怎么理解机器学习和深度学习(二)— 走近机器学习

阅读时长 9 分钟

上一篇文章中,我们已经知道机器学习是人工智能领域的一个分支,也知道了深度学习是机器学习的一个分支,接下来我们继续深入机器学习。

上一篇文章

在1956年,约翰 · 麦卡锡等人在达特茅斯会议上提出人工智能概念的三年后,也就是1959年,计算机科学家同时也是IBM工程师的阿瑟·萨缪尔(Arthur Samuel)在自己的一篇论文中,提出了让计算机提出了让计算机学习下跳棋的方法,并将这种方法命名为机器学习(Machine Learning)。这可以说是一个机器学习的一个里程碑事件,因为这是一种“让计算机没有被明确编程的情况下进行学习”的方法。就如同上一篇文章中提到的,这是“机器智能”的典型特征。

当时阿瑟·萨缪尔就已经意识到,这种机器学习最终将超越程序创建者的能力,并在论文中用计算机学习下跳棋证明了这一点。几十年后让世界瞩目的大事件,1997年 IBM 的“深蓝”在一场国际象棋比赛(以及复赛)中击败了当时的世界象棋冠军 Garry Kasparov,更是证明了这种人类发明的“青出于蓝而胜于蓝”的能力,已经超越了人类自身。

DALL·E 2024-02-14 12.04.43 - Create an image with a cinematic effect of a human and a sensual female robot playing a game of international chess. The setting should be intimate an.webp

那么这种超越人类的能力,可以胜任哪些工作呢。

01 机器学习可以胜任的工作

如果说人类是从“经验”中学习的话,那么机器学习就是从数据中进行学习。科学家们将机器学习可以胜任的工作大致分成两类,一类是对未来结果进行预测,另外一类,是对数据进行分类。虽然听起来机器学习可以做的工作远远赶不上人类,但是在这两个类别下的很多工作都是人类所难以胜任的,在很多时候它的判断都比我们人类要准确许多。

DALL·E 2024-02-14 12.01.39 - Create an image with a cinematic effect where a female robot stockbroker is explaining candlestick charts (K-line charts) to a group of clients. The s.webp

比如说,机器可以通过通过分析病人的患部图像数据,对肿瘤是良性还是恶性进行分类。或者是通过股票波动数据预测股票的涨跌,再或者通过我们的购买记录,分析我们的购物偏好,从而可以主动向我们推送我们感兴趣的商品,促成最终的商品售卖。

因此我们发现需要从大量数据出发,进行分类或者预测的时候,机器学习就特别的有用。那么这种预测或者分类的工作,既然不是通过程序编码,那是怎么在机器上实现的呢。

02 机器学习的实现过程

还记得训练一个智能沙和尚的五个步骤吗,这次我们来加入一些看起来比较晦涩难懂的名词,用一个更贴近真实的机器学习的例子来进行说明。

DALL·E 2024-02-14 11.58.44 - Create an image with a cinematic effect of a beautiful female zookeeper robot playing the game 'Pictionary' with a group of kindergarten children. As .webp

假设你是一个动物园的管理员,你需要设计一个机器和幼儿园的小朋友们玩你画我猜的游戏。当小朋友们画出图像的时候,机器需要回答这是个什么动物,比如猴子、大象、长颈鹿等等。

你决定用一种叫做“我问你答”的方法来训练机器识别动物。首先,你需要一个“动物名册”,你可以想象成在带有动物名称的照片影集,这个“动物名册”就是我们所说的“训练集”。通过这个“动物名册”,机器就知道:“哦,这张上是标注的是猴子,那这个动物应该叫猴子,那张标注的是大象,那这个动物应该叫大象”,让它慢慢学习。

接着,当机器学习了一段时间以后,你就开始对它提问了,你那一起张图片问它:“这是什么动物?”如果电脑答对了,你就夸奖它;如果答错了,你就给它一些提示,让它学会正确的识别方法。而这个“你问我答”的方法,就是我们所说的“算法”。这个不停的拿着不同图片让它进行回答,并且对它的回答进行正确和错误反馈的过程,就叫“训练”。

你觉得“动物名册”上的动物,差不多机器都能准确回答了,这时候你想知道机器能不能识别除了“动物名册”以外的图片。这时候你让人绘制了大量的动物图片来测试它识别的水平,这些绘制的动物图片就是我们所说的“测试集”。

而在训练的过程中,你还需要一个“错题本”,就像是告诉机器“这张照片应该是猴子,但你猜成了大象”,这就是我们所说的“损失函数”。通过不断地调整这个损失函数,机器可以逐渐提高识别的准确性。

最后,你会根据机器的识别能力,评估它的表现。如果它识别动物达到了一定的准确程度,那就说明你的方法很有效,机器已经学会了如何识别动物,这就是我们所说的“评估结果”。

这样,通过反复不断地训练和测试,机器就能够更好的和小朋友玩你画我猜的游戏了。

03 无限可能

随着从历史不断走近机器学习的世界,我们发现了机器学习和数学以及数据之间密不可分的联系,明白了数据集、模型、算法、损失函数、优化算法、评估指标、神经网络等概念,对于机器学习领域的重要意义,同时会越来越惊叹于其在模拟人类学习过程中的无限潜力和可能性。当你拥有了机器学习这柄利器的时候,你最想让它帮助你做什么事情呢?