怎么理解机器学习和深度学习（二）— 走近机器学习

发布于2024年 2月 14日2024年 2月 15日作者:顺水老师

阅读: 393

阅读时长 9 分钟

从上一篇文章中，我们已经知道机器学习是人工智能领域的一个分支，也知道了深度学习是机器学习的一个分支，接下来我们继续深入机器学习。

怎么理解机器学习和深度学习

上一篇文章

在1956年，约翰 · 麦卡锡等人在达特茅斯会议上提出人工智能概念的三年后，也就是1959年，计算机科学家同时也是IBM工程师的阿瑟·萨缪尔（Arthur Samuel）在自己的一篇论文中，提出了让计算机提出了让计算机学习下跳棋的方法，并将这种方法命名为机器学习（Machine Learning）。这可以说是一个机器学习的一个里程碑事件，因为这是一种“让计算机没有被明确编程的情况下进行学习”的方法。就如同上一篇文章中提到的，这是“机器智能”的典型特征。

当时阿瑟·萨缪尔就已经意识到，这种机器学习最终将超越程序创建者的能力，并在论文中用计算机学习下跳棋证明了这一点。几十年后让世界瞩目的大事件，1997年 IBM 的“深蓝”在一场国际象棋比赛（以及复赛）中击败了当时的世界象棋冠军 Garry Kasparov，更是证明了这种人类发明的“青出于蓝而胜于蓝”的能力，已经超越了人类自身。

DALL·E 2024-02-14 12.04.43 - Create an image with a cinematic effect of a human and a sensual female robot playing a game of international chess. The setting should be intimate an.webp

那么这种超越人类的能力，可以胜任哪些工作呢。

01 机器学习可以胜任的工作

如果说人类是从“经验”中学习的话，那么机器学习就是从数据中进行学习。科学家们将机器学习可以胜任的工作大致分成两类，一类是对未来结果进行预测，另外一类，是对数据进行分类。虽然听起来机器学习可以做的工作远远赶不上人类，但是在这两个类别下的很多工作都是人类所难以胜任的，在很多时候它的判断都比我们人类要准确许多。

DALL·E 2024-02-14 12.01.39 - Create an image with a cinematic effect where a female robot stockbroker is explaining candlestick charts (K-line charts) to a group of clients. The s.webp

比如说，机器可以通过通过分析病人的患部图像数据，对肿瘤是良性还是恶性进行分类。或者是通过股票波动数据预测股票的涨跌，再或者通过我们的购买记录，分析我们的购物偏好，从而可以主动向我们推送我们感兴趣的商品，促成最终的商品售卖。

因此我们发现需要从大量数据出发，进行分类或者预测的时候，机器学习就特别的有用。那么这种预测或者分类的工作，既然不是通过程序编码，那是怎么在机器上实现的呢。

02 机器学习的实现过程

还记得训练一个智能沙和尚的五个步骤吗，这次我们来加入一些看起来比较晦涩难懂的名词，用一个更贴近真实的机器学习的例子来进行说明。

DALL·E 2024-02-14 11.58.44 - Create an image with a cinematic effect of a beautiful female zookeeper robot playing the game 'Pictionary' with a group of kindergarten children. As .webp

假设你是一个动物园的管理员，你需要设计一个机器和幼儿园的小朋友们玩你画我猜的游戏。当小朋友们画出图像的时候，机器需要回答这是个什么动物，比如猴子、大象、长颈鹿等等。

你决定用一种叫做“我问你答”的方法来训练机器识别动物。首先，你需要一个“动物名册”，你可以想象成在带有动物名称的照片影集，这个“动物名册”就是我们所说的“训练集”。通过这个“动物名册”，机器就知道：“哦，这张上是标注的是猴子，那这个动物应该叫猴子，那张标注的是大象，那这个动物应该叫大象”，让它慢慢学习。

接着，当机器学习了一段时间以后，你就开始对它提问了，你那一起张图片问它：“这是什么动物？”如果电脑答对了，你就夸奖它；如果答错了，你就给它一些提示，让它学会正确的识别方法。而这个“你问我答”的方法，就是我们所说的“算法”。这个不停的拿着不同图片让它进行回答，并且对它的回答进行正确和错误反馈的过程，就叫“训练”。

你觉得“动物名册”上的动物，差不多机器都能准确回答了，这时候你想知道机器能不能识别除了“动物名册”以外的图片。这时候你让人绘制了大量的动物图片来测试它识别的水平，这些绘制的动物图片就是我们所说的“测试集”。

而在训练的过程中，你还需要一个“错题本”，就像是告诉机器“这张照片应该是猴子，但你猜成了大象”，这就是我们所说的“损失函数”。通过不断地调整这个损失函数，机器可以逐渐提高识别的准确性。

最后，你会根据机器的识别能力，评估它的表现。如果它识别动物达到了一定的准确程度，那就说明你的方法很有效，机器已经学会了如何识别动物，这就是我们所说的“评估结果”。

这样，通过反复不断地训练和测试，机器就能够更好的和小朋友玩你画我猜的游戏了。

03 无限可能

随着从历史不断走近机器学习的世界，我们发现了机器学习和数学以及数据之间密不可分的联系，明白了数据集、模型、算法、损失函数、优化算法、评估指标、神经网络等概念，对于机器学习领域的重要意义，同时会越来越惊叹于其在模拟人类学习过程中的无限潜力和可能性。当你拥有了机器学习这柄利器的时候，你最想让它帮助你做什么事情呢？

怎么理解机器学习和深度学习（二）— 走近机器学习

01 机器学习可以胜任的工作

02 机器学习的实现过程

03 无限可能

赞过：

相关

归档

01 机器学习可以胜任的工作

02 机器学习的实现过程

03 无限可能

分享到：

赞过：

相关

归档

了解 新手村 的更多信息

了解新手村的更多信息