4006-456-766

training@51cctr.com

你所在的位置:管理文库 > 运营管理

运营管理
许乃威讲智能 ─ 一招教你识别所用系统是否真智能(这要得罪一些厂商了)
发布于:呼叫中心培训网  点击数:1739  更新时间:2023年-05-29

作者/ 许乃威  


这是许乃威科普教室「从那场华山论剑讲起」这系列文章的最终篇,有兴趣读者可以回头看这系列文章的上和中篇。这系列文章在讲人工智能过去50多年的发展,但有读者问:干嘛花时间去了解这些过去的历史呢?这系列文章其实背后有一个很实用的目的,就是:教大家简单的方法,识别你所用的智能系统,到底是不是现在最新最热门的人工智能技术。


自从谷歌的AlphaGo打败了世界围棋冠军,震动了世界,AlphaGo背后的技术:深度学习,一下成为报纸的头版头条,所有人都宣称自己在搞深度学习,深度学习最成功的应用,就是解决了以往人工智能解决不了的问题:声音、文字和图像的识别处理,我们所在的客户服务领域,不正好就是其中的声音和文字吗?


因此我过去这几年,很常被问到一个问题:老师,我们要买智能系统,各家厂商都讲得很好,但这实在太专业了,而且这可是大投资,一买错,这可就全惨了,是啊,这还真的就很惨,我就遇到有企业买到的,连第一代的智能系统都不算,只是利用关键词比对的技术而已,真没用到人工智能的技术,花了钱花了时间不说,还跟公司的核心系统接上了,要换都不知道该怎么换。


我最近被牙齿弄得真的很烦,也不知道是年纪大了还是怎么着,反正就是有几颗牙掉了,要做植牙。其中有2颗是左下方后面的两个大牙,10年前就做了植牙,结果其中一颗掉了下来,牙医说,失败的那颗没法再植了,但还好还有一个是成功的,他说那这样吧,我们就在没牙的地方做个牙套,然后做个神奇的勾子,跟前面那颗牙勾起来,也把牙套跟后面那个植牙连起来,团结力量大,前后两个牙齿的力量,就能让没牙的那个牙套给固定住了,我听了,连忙点头如捣蒜,频频称好,因为我也不懂啊,除了点头,我还能干吗?十年后的今天。那个神奇的勾子断了,那个牙套站不住了,脱落了,连带影响到我另外那个还在的植牙,也就是两个植牙都不行了,这次我找了真正的专家(过程就不说了),专长就是失败植牙的重建。他看了我的情况,一句话:那个神奇的勾子,是上一代的技术啊,现在都没人用了,我说,那现在的技术是什么?他说,即使植牙失败,都是可以补骨补肉,重新来过,只是要看那个牙医有没有这样的技术而已,然后,我就开始了我现在长达6个月漫长的补骨补肉、重新来过的过程。


大家买的智能系统,就跟我的植牙是一样的,如果你买的是那个「神奇的勾子」,表面听起来再怎么神奇,总归是上一代技术,是被淘汰的,是用不久的,真要换,不是版本更新,而是马车要换火车,但建置智能客服系统,就跟我植牙一样,我们做客服的,一般都不懂技术啊,智能客服系统太专业了,厂商现在这么多,都说是最新最热门的,我们到底要怎么判断?就算是企业的科技部门,也没有多少人懂深度学习,因为深度学习的理论,是2006年深度学习之父Hinton提出,2012年才爆火广泛被接受的,也就是说离现在才10年的时间,你说能有多少人懂深度学习是什么?


现在的智能系统,存在着太多混杂第一代智能、第二代智能和第三代智能的概念,全部夹杂在一起,我们做运营的,因为对技术也不懂,厂商说这样做,我们就这样做,也没有真明白背后的原理是什么,浪费了时间不说,系统的效能越搞越糟,举几个例子。


智能客服系统的核心,不是智能知识库吗?智能知识库不是会有标准问和相似问吗?客户问:我银行卡里还有多少钱?这是标准问,但客户说法有太多种变化,我们要把变化写下来,放到相似问里面,我有次在一个银行客户现场,看到做运营的标注同事,在标准问底下,拼命的添加相似问,有的标准问,竟然放进去了800多条的相似问,这根本就不对了啊,深度学习的确要用到海量训练,但这海量训练是用在学习中文上面,因为中文的说法变化太多,而跟银行这领域的说法变化,应该就少多了,客户的说法的确有很多种,但那是中文的范围,那是你买这套系统之前,厂商应该早就训练好的,你要加的相似问,应该是跟银行知识有关的,例如「账户余额」这个说法,客户可能会说成「户头有多少钱」,只有这种需要加入相似问,而这种相似问的量,根本就不多。


如果这说法变化是跟中文有关的,例如「我账户还有多少钱」,客户讲成「我账户上的钱还有多少」,这是中文的问题,这是主词、动词、受词、副词位置变化的问题,对深度学习系统来说,这是不需要加入相似问的,因为厂商应该已经帮你训练好了,在换个角度想:你的团队就几十号人,用的相似问最多也就是几万条,就能让你的智能系统懂中文,那真是太小瞧深度学习对于训练数据的数量要求了,简单讲,你买到的系统,应该是懂中文的,你要做的事情,只是把你行业的专业知识放进去而已,所以,在每个标准问底下,要添加这么多相似问,看起来就像是第一代的智能技术,根本不是深度学习(或者是厂商没有跟企业运营团队讲清楚)。


什么是第一代技术,我后面会说清楚,再举个例子,我到一个企业现场,看到现场做语料标注的人员有几十号人,我吓了一大跳,我说只是做标注,干么要这么多人?客户说,因为要把客户的话进行词语切割和词性切割,例如「我的账户余额还有多少钱」,要把这句话的主词、动词、受词给标注出来,然后把这句话按照词性给切割开来,我吓了一大跳。确定你用的是深度学习的系统吗?客户跟我当时作植牙一样,点头如捣蒜,后来我发现,其实只要问一个问题,就能简单分辨我眼前的系统,到底是不是第三代的技术,也就是深度学习,如果不是,那我至少知道为何需要这么多标注人员,为何需要做这么多额外工作,这就是我这一系列科普文章的目的:教大家一招,快速识别你眼前的智能系统,到底是不是真的深度学习,但揭晓之前,我还是要在科普一下深度学习到底是什么,用最简单易懂的方式来讲。


话题回到我们上一篇说的,1956年,4位绝世高手,决定来场华山论剑,人工智能元年于是开始,华山论剑之后,三派鼎立:符号派,连接派,和行为派。行为派的研究一直都没有进展,我们略过不谈。


符号派又称为规则派,称霸武林40年,观念也很容易理解:你跟机器说,把红色的球放右边,蓝色的球放左边,只要把规则讲清楚了,机器就能执行,这就是规则派。


规则派在智能客服领域,也被称为第一代智能。为何是第一代?因为后来不行了啊,在声音、文字和图像的领域,规则变化实在太多,根本没法穷尽说完,规则派需要把所有可能的变化都放进去,你没说,机器就不会,这样严格的限制,在商业的应用上,一点都不实际,1990年代,第一代人工智能宣告崩盘,3个门派倒了两个,那只有剩下连接派了。


现在大家最熟知的连接派,自然就是深度学习,但连接派其实包含一个更大的范围,叫做:机器学习,机器学习主要就是在解决「寻找规则、预测未来」这个核心问题之上。它起先建立的基础在统计学,一听到这名词,大家马上就吓到了,但我换个方式讲,你可能一下就明白:其实你每天大量的学习,很多都是基于统计后的结果,问你个问题:动物有几条腿?我讲一个动物名字,你是否能预测它是几条腿?不必大人来教,小朋友在接触大量的动物图片之后,也就是经过大量数据的训练,很容易就能进行「寻找规则、预测未来」这个统计工作,哦,很多是两条腿的,但也很多是四条腿的。我看了一百张图片,我发现有翅膀的是两条腿,没翅膀的是四条腿,所以,如果你给我一个动物名字,我只要想想它有没有翅膀,我就能预测答案了,感受到了没有?人类的学习,很多靠的是经验,所谓的经验,就是把过往的数据进行总结归纳,找出规律,然后预测未来。(讲到这,你有没有想到,其实两条腿和四条腿的分法,不是简单靠翅膀的,能想到有什么动物没有翅膀,但只有两条腿吗?聪明智慧如此的你?)


机器学习一开始,利用的就是统计学的办法,寻找特征,加以分类,然后预测未来。为何你的邮箱能够很聪明的识别是垃圾信,然后直接丢到垃圾桶?垃圾邮件的分类检测,主要用到的SVM方法,就是最典型的统计学例子。SVM到今天都广泛被使用,原理也很好懂,你有一堆红色的球,一堆蓝色的球,你要找到方法把他们分开,你做了很多尝试,后来发现他们重量不同,红色比较重,蓝色比较轻,用「重量」很容易就能分开,「重量」就是所谓的特征值,SVM在做的,就是找到有哪些特征值能够把这两堆球给分开,SVM为何广泛运用在垃圾邮件的分类检测,这也很好理解了吧,你只要把「重量」这个特征值想象成垃圾邮件的特征,只要是垃圾邮件,就会有一些特征,只要找到这些特征,就能把垃圾邮件给分类出来。


故事讲到这,怎么还不讲「一招识别深度学习」这个主题呢?马上来了,因为终于要讲深度学习了,机器学习在1980年代崛起,而且取得相当的进展,但在声音、文字和影像这些领域,还是遇到巨大困难,使用统计学的办法,有个前提:这个复杂的世界,是可以用少数可以理解的特征值来进行描述的,例如刚刚讲的红球和蓝球的分类,是可以用「重量」这个少数可以理解的特征值来进行描述的。讲个大家更好理解的例子:


你在一个大公司,公司有一万名员工,员工的绩效工资,公司只有给最终的计算结果,但没有跟大家说明绩效的计算方法是什么,你是一个学过统计学的聪明员工,你拿到所有员工的绩效工资,你也知道绩效可能的指标包括接电话数量、客户满意度、一解率、质检分数、出勤、月考、客户表扬、客户投诉等等,可能被纳入的指标太多了,你不确定哪些指标被纳入最终的绩效当中,但你有大家每个指标的原始分数。透过统计学的技术,你很容易就能找到哪些指标被纳入了绩效考核当中,这就是特征值,有了特征值,用简单的数学,你很容易就能算出最终的绩效公式是什么,但问题是,在声音、文字和影像这些领域,各种努力都找不到用少数可以理解的特征值来进行描述,传统统计学的方法也行不通。


一直到深度学习出现。深度学习的技术,实在难懂难讲,我后面在找机会看能否用简单易懂的方式来说明,大家先这样简单理解:只要先想成刚刚那个绩效工资的例子,有一万名员工的绩效资料,公司用了一个宇宙无敌超级难懂的计算方法来算工资(就是不想让你懂,怎样?),你有原始资料和最终的绩效工资,你要猜出公司这个宇宙无敌的公式到底是什么,其实你为何要去算这个公式?你真正的目的是要做预测,你有员工的原始指标数据,你要猜到他可能拿到多少钱,你只要能达到这个目的就行,你不必真猜出这个公式,对吧,就算这个公式对你还是一个黑盒子,只要能够从原始数据猜到最终结果,你目的还是达到了啊。


统计学还是希望能猜到这个绩效公式,而深度学习来了一个大转弯:我干脆不去猜这个公式了,我只要能从原始数据这里,猜到结果就行,大家有没有听过这个故事:AlphaGo打败了世界围棋冠军,它下棋的策略,让人类都无法理解,哇,听起来有没有够玄幻了?其实深度学习本来就没有打算去了解机器如何去猜到这个结果的,因为这就是深度学习的核心思想:我只要把一堆原始数据丢到机器,机器有一堆开关,这些开关有各种组合,就让机器去组合吧,不管机器怎么组合,只要能把结果猜出来就行。(我尽力了,对深度学习的技术,你应该还是一头懵,相信我,这太正常了)除非你是打算写代码的,如果你只是做运营的,其实懂到这里也就够了。或是懵到这里也就够了。因为我们最大的重点要来了。


2006年深度学习之父Hinton找到了一个办法,在复杂的声音文字影像世界当中,不必去费神分析刚刚讲的特征值(例如接电话数量、接电话质量),就能从原始数据猜到结果,但他的理论出来,仍旧没有引起什么反响,一直到2012年,发生了人工智能使用真正最有意义的一场重大事件,深度学习一夕爆火,3年后,才有了AlphaGo,这个事件,终于来到了我们这篇文章的主要标题:一招分辨深度学习。


2012 年 Hinton 的两个学生参加了一场比赛ImageNet,由史丹佛大学举办,是个图像识别竞赛,可以简单理解为人工智能界的奥林匹克,这比赛从2007年创办以来,每年的比赛结果、每家都差不多,错误率大致落在 30%、29%、28%... 瓶颈一直无法突破,这种错误率,根本不具备商业应用的价值,这也清楚的说明,在2010年以前,就算机器学习用统计学的方法,仍然没法让人工智能具有商业价值,Hinton 团队上场了,Hinton在这领域坚持了30年,组了一个公司,公司就3个人,无人看好,没人,没钱,而对手是谷歌、微软这种巨头公司。


就好像少年队对上了国家队。(这种故事听起来真的就很励志)结果,Hinton 团队不只完胜对手,而且将世界记录一下往前推进到空前的程度。以 16.42% 的错误率远胜第二名的 26.22%,用的正是深度学习技术,深度学习终于引起各大巨头企业的关注,真的是一夕爆火,谷歌后来立刻投资Hinton的三人公司,2015 年的冠军微软,以 3.5%,正式超越⼈类的 5%错误率,大家看到这里,难道心中没有个疑问:2006年Hinton就解决了深度学习的理论障碍,为何还要等到2012年才扬眉吐气?因为Hinton缺一样东西,而这样东西一直到2007年才逐渐开始成熟:GPU!这就是我们文章的重点了!


以前人工智能用CPU来运算,CPU如同电脑的通才,能扛起各种运算任务,但对于海量数据的计算,就是不够力啊,GPU是干啥?本来是用在绘制荧幕上呈现的影像,后来发现GPU是个专才,它当时设计的思路是并行运算,特别适合海量运算,例如:深度学习,2007年以前就有GPU了,但没有简单能在GPU上面写代码的编辑器,一直到2007年,而Hinton团队,就是利用深度学习,加上GPU,终于一举突破影像识别20%错误识别率的关卡。


好了,铺垫了这么长,该做结论了:智能系统有3代,第一代是规则派的,第二代是机器学习型的,只有第三代才是现在我们熟知的深度学习的,第三代的技术,不需要你提供特征值,换一个简单的说法,什么词语切割、词性切割,主词、动词、受词、副词,这些都是特征值,第三代技术,是看整个句子的,我们根本不知道深度学习到底是怎么切割的。


我们传统认为语料标注的工作,其实更多是第一代和第二代技术用到的,到了第三代技术,对于语料标注的依赖度,除了要定义一些行业的专有术语和说法之外,依赖度已经降到很低了,一招教你识别你用的系统,是第一代还是第三代:你只要问一下,这套智能系统有没有用到GPU?没用到GPU的,几乎不可能是第三代技术,跟深度学习应该是没有关系的。


当然,这是一个快速检验法,仍然不够完美,在后面的科普文章当中,我会再继续介绍深度学习到底需要做什么,不需要做什么,怎样能够搞明白,我到底用的是哪一代的技术,有了这些了解,你也才能更好的掌握深度学习现在这个当红的人工智能发展。



电话:010-82794120

邮箱:邮箱:ciig@ciiglobal.cn

地址:北京市海淀区上地三街9号B座

关注我们

关注公众号

官方微博

版权所有:北京易训天下咨询服务有限公司 @ 2024 京ICP备11026241号-5

北京易训天下咨询服务有限公司