你所在的位置:管理文库 > 电话营销
为什么智能语音识别技术近几年特别火呢,其中在关联度较高的呼叫中心行业,我认为有三个原因,第一是技术的进步所带来的发展,第二是应用有强劲的需求,第三是大佬们的推波助澜以及资本的热捧。业内对生物特征识别也普遍持乐观态度,这是权威的国际生物识别集团(International Biometric Group,IBG)在2014年做的《2007-2020全球生物识别技术行业市场规模与预测》,IBG预测,在2020年,全球生物识别技术行业的市场规模将达到250亿美元。
衡量一个声纹识别效果的重要参数是错误接受率和错误拒绝率,在这个曲线中,错误接受率和错误拒绝率是一个矛盾曲线,即两者不可兼得,因此,业内提出来等错率,目前的声纹识别技术在理想的情况下等错率可以做到低于0.5%,即在1000个的声纹比对中,仅有不到5个的错误接受率和错误拒绝率。
智能语音识别技术涵盖指纹、人脸、声纹、瞳孔、掌纹以及静脉纹,每种生物特征识别都有着不一样的技术特性和应用场景,在此我们可以简单比较一下声纹和人脸之间的区别,人脸识别是基于人的生理特征,而声纹识别不仅基于人的生理特征,也是基于人的行为特征。人脸在人的一生中是相对有规律的自然变化,而声音不仅有相对规律的自然变化,也与人后天的生活环境、文化环境相关,具有极强的自然属性和文化属性,不易被仿冒,或者说仿冒的难度比较高。因此,相对人脸识别,声纹识识别更能够应用到远程身份认证领域,声纹识别如果能和现有的基于互联网的客户服务结合,会有更好的应用前景和市场前景。
我们人类对语音的说话人鉴别是我们人类在几百万年的进化过程中习得而来,与生俱来,而通过机器进行说话人识别跟人类大脑的识别是不一样的。在这个图中,上面两个是声音的波形图,即声音振幅随时间变化的曲线,下面两个是语谱图,即声音在不同频段的能量值大小随时间的变化曲线,上世纪三四十年代,美国的Bell实验室的劳伦斯·科斯塔通过观察语谱图第一次提出了"声纹"的概念;到四十年代至七十年代,同样是Bell实验室的S.Pruzansky提出了基于统计学原理的声纹识别理论,系统地发展了声纹识别理论,理论体系得以初步建立,这一阶段的研究主要集中在特征参数的选择、提取上,相继提出了线性预测倒谱系数、共振峰参数等特征参数;在上世纪七十年代至九十年代,声纹识别技术发展迅速,参数提取上提出了应用较为成熟的梅尔频率倒谱系数(MFCC)模式匹配,并相继出现了矢量量化技术(VQ)、动态时间规整(DTW)、隐马尔科夫模型(HMM)等模式匹配模型;九十年代至今,开始步入实际应用阶段,工作重点是提高声纹识别系统的可靠性和实用性。
面向确认的声纹识别应用已经达到了实际商用水平,如司法行业的司法矫正中就用到声纹识别,大家可能不知道,声纹识别早在2010年前后就开始在司法行业中得到应用了。基本流程是这样的,假释人员首先在司法部门进行司法宣告,留下语音,然后给他一个具有LBS功能的手机,在监外服刑期间,司法矫正系统会定期对矫正对象所持手机进行定位,以判断对象是否在规定的地理位置,同时,利用东进Keygoe多媒体交换机对手机进行外呼,通过IVR引导矫正对象进行声纹比对,以判断矫正对象和手机是否分离。目前,这种面向确认的声纹识别技术在司法行业已经达到较高的商用成熟度。还有一个应用就是手机的声纹锁,用声纹来打开你的手机,这种的应用的商用化程度也非常高。
技术的进步和应用需求使我们进入了生物特征识别产业高速发展的增长期,而要获得持续的市场增长,就需要我们在技术及其应用上进一步去探索与突破,除此之外,生物识别技术的应用还存在一些安全和隐私问题,除了技术需要进一步提升外,行业还要制定相关的标准和规范,甚至国家在法律层面还需要制定相应的法律和法规,以明晰可能存在的风险,让我们在基础研究、技术开发、行业应用等方面共同努力,以更好的产品和服务迎接生物特征识别市场收获季节的到来