怎么理解机器学习和深度学习

阅读时长 15 分钟

DALL·E 2024-02-06 17.28.13 - Create a comic-style image of a person standing at the grand entrance to the cosmic world of artificial intelligence. The door is slightly ajar, revea.webp

人工智能兴起之后,经过几十年的发展和演进,出现了许许多多的学科,人们发现,在不断的研究它的同时,又发明了许多新的概念,这些概念和概念之间有些甚至可以互换使用,比如说机器学习和深度学习,搞清楚这些让人费解的概念,可以帮助我们迅速踏入人工智能这个新世界的大门。

如果我们搜索“人工智能”(Artificial Intelligence)这个关键词,你会发现对于”人工智能“有许多不同的定义,那是因为这个概念在六十多年前被提出来,到今天经过了不断的演化补充,它的分支领域越来越多,而各分支领域即深入且各不相通,又是高度技术性和专业的,因此这个领域变得非常庞大且复杂,不便于我们理解。

比如“人工智能”这个概念的提出者约翰 · 麦卡锡(John McCarthy),在自己 2004年发表的论文中就定义到:“它是制造智能机器的科学和工程,特别是智能计算机程序。它与使用计算机理解人类智能的类似任务有关,但人工智能不必局限于生物学上能观察到的方法。”这话听起来很拗口,也不容易理解,但其实核心就在于”智能“这两个字。如果你希望迅速了解这个概念的话,可以查看下面这篇文章。

01 智能和非智能之间的显著区别

但如果要进一步深入理解“人工智能”这个内涵,首先我们得讲清楚“智能”和“非智能”的区别。

这里讲的有智能和无智能,都是针对计算机系统而言。提起计算机系统,大家脑子里面蹦出来的第一个东西,恐怕就是我们鼎鼎大名的操作系统了,比如说电脑操作的系统 “Windows”、苹果电脑的 “Mac OS”,手机操作系统比如说“Andriod(安卓)”,和 IOS( iPhone ),除了这几个以外,其实计算机系统在今天已经深入到我们生活的方方面面了,比如说大家普遍见到的 OA 办公系统、公共交通打卡乘车系统、洗衣机里的洗衣烘干系统、电饭煲蒸饭系统等等。

那这些系统中,哪些是智能系统呢?

DALL·E 2024-02-06 17.49.08 - Create a comic-style image of a humanoid female robot, dressed in a uniform, sitting in front of a computer, typing on the keyboard. The computer scre.webp

你可能会说,别的不敢说,但手机操作系统肯定是智能系统,因为现在的手机,都有一个名字叫“智能手机”,你看安卓系统的标志,不就是个绿色的小机器人吗,这一定没错了。但其实在人工智能的世界里,手机操作系统还远远称不上“智能”。因为,

“计算机应该自己知道该如何完成任务,而不是通过明确的编程指令来告诉它们该怎么做”

也就是说,上面提到的所有的计算机系统都有这样的特征:用户对系统,可以做的所有的事情,系统研发人员都提前设计好,并且用指令的方式告诉计算机,当用户这样操作的时候,你应该做以下的事情……,这就叫明确的编程指令,这种类型的计算机系统,在人工智能的世界里,还算不上智能系统。打个比方,《西游记》中的沙和尚就是一个人形的非智能系统,作者吴承恩是这样对他进行指令编程的:

当有唐僧被妖怪抓走时,你可以做的事情如下。
当孙悟空在场时,焦急的告诉孙悟空:大师兄,师傅被妖怪抓走啦!
如果孙悟空不在场,猪八戒在场时,焦急的告诉他:二师兄,师傅被妖怪抓走啦!
当猪八戒被妖怪抓走而孙悟空在场时,告诉他:大师兄,二师兄被妖怪抓走啦!

DALL·E 2024-02-05 10.32.48 - Create a comic-style image from 'Journey to the West'. Sha Wujing, with an expression of urgent concern, informs Sun Wukong that their master, Tang Sa.webp

可以看出来,沙和尚是一个非智能系统。

02 如何制作一个拥有智能的系统

这就意味着我们不能明确的告诉系统:“你该做什么”,而是让他自己去思考。还是以沙和尚为例,如果需要一个智能沙和尚,我们需要这样训练他。

DALL·E 2024-02-06 18.13.44 - Create an image with the theme of Sha Wujing kneeling in front of a beautiful female robot. The image only shows the back of Sha Wujing, a middle-aged.webp

第一步:首先你需要知道关于抓走团队成员的妖怪信息以及剩余团队成员的信息,比如数量、能力、长相、体毛的颜色、身高、獠牙的长短、来头、会何等法术、头目的信息、有没有法宝、过往的经历、老巢在哪里、团队这边则是剩下了谁,战斗力如何、会哪些法术等。

第二步:如果其中有些信息不清楚的话,找附近的山神或者土地打探清楚

第三步:将这些打探清楚的信息记录下来,将第一步中的重要信息梳理出来,不重要的去掉比如体毛的颜色,獠牙的长短。

第四步:结合这些重要的信息,形成判断方法:团队剩下成员与妖怪战斗是否能救回师傅。再用以往师傅被抓走时的经历,来验证这个判断方法是否准确,如果不准确,那么反复调整这个判断方法,直到判断方法基本准确为止。

第五步:当再次出现团队成员被妖怪抓走的时候,用判断的方法和妖怪的信息进行分析,得出是和团队一起杀入妖怪老巢把师傅救回来,还是打不过需要搬救兵的结论。

这样被训练出来的沙和尚,应该是这样的:
师傅被妖怪抓走了。
孙悟空:悟净在这里等我,俺老孙去救师傅。
沙悟净:大师兄且慢,且听我细细道来。我听附近山神和土地说,抓走师傅的妖怪叫红孩儿,本名牛圣婴,是牛魔王的独子。年纪不大,本领不小,和大师兄一样会72般变化,生性狡诈,善使一杆火缨枪,会口喷三昧真火,此火非常水能熄灭,常年盘踞在六百里钻头号山枯松涧]火云洞,此山洞地势险要,又有一干小妖,纵使我师兄弟三人一起上,也断难取胜。要降伏此妖只可智取,不可强攻。可以与你结拜兄弟牛魔王商议让它放回师傅,如若不肯,再去请南海观音菩萨相助。
孙悟空:哈哈哈,有师弟在,取经又有何难……

DALL·E 2024-02-06 17.59.05 - Create a comic-style image depicting a heartfelt moment where Sun Wukong, a humanoid monkey in golden armor with a thick golden staff and a golden hea.webp

此沙和尚一出,西天取经九九八十一难只怕会变成一路坦途。

03 机器学习

从上面的故事我们可以看到,“智能沙悟净”和人类的完成任务的方式是何其的类似。

其实所谓的“机器学习”,就是模仿人类学习的方式,通过不断的用数据“喂”给计算机,再不断检查计算机得出的结果,最终实现让计算机完成任务的能力不断提高的这个方式,被称为机器学习(Machine Learning)。如同我们人类通过上课和读书获取知识,再通过作业和考试来检查我们学习的结果一样。而刚才提到的沙和尚的训练过程,就是一个机器学习的缩略过程。

DALL·E 2024-02-06 16.44.46 - Create a comic-style image of a classroom scene. A glamorous female teacher with glasses, dressed in a uniform, is standing in front of a chalkboard h.webp

04 深度学习

那么,怎么理解深度学习呢。

虽然这是一个经常拿来和机器学习混用的概念,但是两者之间其实是包含关系,机器学习是人工智能的一个子领域,而深度学习又是机器学习的子领域。用人类的亲缘关系来打比方的话,如果人工智能是爷爷的话,机器学习就是爸爸,而深度学习是儿子。只不过说,儿子和爸爸长的很像罢了。

DALL·E 2024-02-06 18.22.15 - Create a comic-style image of three robots sitting on a long bench. The first robot has a white long beard and is dressed in elderly clothes, giving i.webp

这里的“深度”(deep)这个词,指的是机器在学习中所使用算法是神经网络算法,而神经网络的层数有三层以上,只要符合这个条件的就被称为“深度学习”。这里又出现了“算法”和“神经网络”这样让人费解的词汇,我们先暂时不去细说,还是通过刚才的故事来理解深度学习和机器学习的主要区别。

还记得刚才我们训练沙和尚时候的第三个步骤吗?

第三步:将这些打探清楚的信息记录下来,将第一步中的重要信息梳理出来,不重要的去掉比如体毛的颜色,獠牙的长短。

这个步骤很重要的一点在于,怎么判断哪些信息是重要的,哪些信息不重要进而可以去掉呢。

如果我们是沙和尚的老师,事先告诉沙和尚哪些信息更重要,哪些可以去掉,也就是说让训练者来做这个判断的话,那么这就是“非深度学习”。而如果让沙和尚通过自己动脑子去判断的话,这就是“深度学习”。在人工智能领域,判断哪些信息重要不重要的这个过程,称之为“特征提取”。“深度学习”最大的特点就在于“特征提取”这个步骤的大部分都是自动化,也就是让机器自主完成的。

如果要一句话概括的话,也就是说,机器学习就是机器模仿人类的学习过程,从而对需要完成的任务做出精确的判断和预测。如果这个学习过程更多的是有一位机器人老师参与其中,对机器进行指导的话,那就是“典型的机器学习”。而“深度学习”更多的是让机器进行”自学“,属于“非典型机器学习”。

如果你能看到这里,恭喜你,你已经推开了人工智能世界的大门。推开这扇门的你,是不是开始觉得有点累了,那么好,就让我们下回再继续吧。