五分钟技术趣谈 | 机器学习的前世今生

五分钟技术趣谈 | 机器学习的前世今生

Part 01

机器学习是什么? 

实现人工智能的方法我们称之为“机器学习”,在1956年的美国达特茅斯会议上,Arthur Samuel正式提出了“Machine Learning”这个概念。机器学习是人工智能的一个重要子领域,它专门研究计算机怎样模拟或实现人类的学习行为,通过大量的数据和样本,获取新的知识或技能,对已有的知识结构进行重组,使之改善自身的性能。通俗的讲,就像人类一样通过学习大量的历史资料,对这个世界产生一定的认知,从而获取到新知识,提升自己。

五分钟技术趣谈 | 机器学习的前世今生

图1 输入到输出的映射图

最常见的机器学习是一种学习如何从A得到B的人工智能,也就是“输入”到“输出”的映射,这种机器学习被称为监督学习。假设输入A是一封电子邮件,输出B表示“是”或“不是”垃圾邮件,那么我们得先训练一个模型,让它具有自动识别垃圾邮件的功能。首先我们先将一些邮件及其所具有的标签,一起输入模型进行训练,例如,我们告诉机器第一封是垃圾邮件,第二封不是垃圾邮件,第三封也不是垃圾邮件,以此类推。模型不断捕捉邮件和这些标签之间的联系,进而进行调整和完善,当模型学习的差不多了,人工输入一些不带标签的新邮件,该模型就能够对新邮件做出判断是否为垃圾邮件。除此之外,生活中常见的监督学习还有语音识别、无人驾驶、工业质检等。

五分钟技术趣谈 | 机器学习的前世今生

图1 智能家居客诉故障分类

Part 02

神经网络模型 

提到神经网络,大家第一反应会想到什么呢?是不是想到了中学时期生物课上学过的神经网络,比如大脑神经网络中枢,脊柱神经网络中枢等等。但这里的神经网络并不是我们生物课上所学的神经网络,而是人工智能中的神经网络,也叫做人工神经网络,它是一种模仿生物神经网络行为特征,进行分布式并行信息处理的算法数学模型。

五分钟技术趣谈 | 机器学习的前世今生

图2 神经元结构图

人类的大脑神经系统包含了860亿个神经元,每个神经元上有上千个突触与其他神经元相连,神经元可以接受其他神经元的信息,也可以发送信息给其他神经元,神经元越多,层数就越多,构成的神经网络就越复杂。这样复杂的生物神经网络具有强大的功能,使我们可以通过触觉、听觉、视觉等来感知这个世界,通过思考来进行决策等等。人工神经网络不是被凭空创造出来的,而是科学家从中受到了启发,用数学和计算机模拟的,最初科学家们设计出的人工神经网络非常简单,但经过多年的演变发展到了多层的复杂网络结构,然后从复杂网络发展到更复杂的人工神经网络,就像建楼房一样越建越高,越建越密,但在AI领域中称之为越来越深。

五分钟技术趣谈 | 机器学习的前世今生

图3 神经网络模型图

目前为止,几乎所有由神经网络创造出的价值都基于一种机器学习,就是上文提到的“监督学习”。在监督学习过程中,输入“A”,学习得到一个函数,就能映射得到输出“B”,将这个监督学习过的组件嵌入到更大型的系统中,就能应用在很多人工智能领域。除了相对标准的神经网络外,还有更深层的神经网络,但它被赋予了一个全新的名字——深度学习。

Part 03

深度学习 

2006年,加拿大多伦多大学教授、机器学习领域泰斗、神经网络之父—— Geoffrey Hinton 和他的学生 Ruslan Salakhutdinov 在顶尖学术刊物《科学》上发表了一篇文章,该文章提出了深层网络训练中梯度消失问题的解决方案:无监督预训练对权值进行初始化+有监督训练微调。斯坦福大学、纽约大学、加拿大蒙特利尔大学等成为研究深度学习的重镇,至此开启了深度学习在学术界和工业界的浪潮。

最早的神经网络实际应用时,因训练速度慢、容易过拟合、经常出现梯度消失以及在网络层次比较少的情况下效果并不比其他算法更优等原因,实际应用的很少。中间很长一段时间神经网络算法的研究一直处于停滞状态。直到Geoffrey Hinton提出了新的解决方法——无监督预训练对权值进行初始化+有监督训练微调。其与神经网络最大的不同点就是不需要标签数据、有更多的隐藏层,以及自下上升非监督学习,结合自顶向下的监督学习的方式。不仅如此,它还能利用空间相对关系,减少参数数目以提高训练性能。如卷积神经网络,长短时记忆网络,深度残差网络等都属于深度学习,其中深度残差网络的深度可以到达1000层,甚至更多。深层的网络有助于挖掘数据中深层的特征,可以使得网络拥有更强大的性能。

Part 04

总结 

机器学习是一种实现AI的方法,也是一门研究如何实现AI的学科,它最主要的一门技术是深度学习,而深度学习又是在神经网络的基础上发展起来的,关系如下图所示。

五分钟技术趣谈 | 机器学习的前世今生

图4 机器学习关系图

深度学习给机器学习带来了一个新浪潮,受到从学术界到工业界的广泛重视。在应用方面,深度学习使得语音图像的智能识别取得惊人进展。如果未来能在理论、建模方面,突破深度学习技术面临的一系列难题,将加速推进人工智能发展。

© 版权声明

相关文章