科大讯飞董事长刘庆峰:中文语音技术中国人做

  刘庆峰,科大讯飞董事长,毕业于中国科技大学,而其此生也因此与科大结下了不解之缘。从一个学者到一位创业者再到一位成功的企业家,在他的执掌下,科大讯飞从无到有,直至成为当今汉语语音技术的领导者。随着苹果发布iPhone4S,语音控制技术迎来了市场成熟的新机遇,而刘庆峰认为,未来的3至5年将是科大讯飞正式“起飞”的时间窗口。

 

科大讯飞董事长刘庆峰


 

图:安徽科大讯飞信息科技股份有限公司董事长刘庆峰


  很小的时候,刘庆峰便表现出超常的数学能力。他五六岁的时候,母亲在小店里面卖包子、馒头,由于当时票证依然流通,购买这些食品时需要粮票,在这些对孩子们来说还比较复杂的计算中,即便小学二三年级的学生都没有刘庆峰算得快。

  上学之后,刘庆峰的学习从来不需要家人操心,特别是他在上初中二年级时发现其他同学竟还有预习和复习的习惯,并加以仿效后,他在班上的成绩就稳居第一名。参加中考时,刘庆峰是全县总分第一名、物理竞赛第一名、数学竞赛第一名;到了高三,刘庆峰又在全国数学竞赛和物理竞赛中获奖。

  1990年,成绩一贯优异的刘庆峰获得了被推荐到清华大学汽车工程专业的机会,但他却放弃了常人眼中的“最高学府”,选择了当年招生分数线最高的中科大电子工程系。值得注意的是,当年进入中科大就读的学生中就有来自13个省的高考状元。即便如此,在中科大这样一个人才济济的高校,刘庆峰依然出众。在刘庆峰的本科生涯中,几乎所有数理类的课程测试,他总是名列前茅。

  对数学极有兴趣的刘庆峰打算转系到中科大数学系,但就在这个时候,他遇到了一位足以改变其人生轨迹的贵人,中科大电子工程与信息科学系教授王仁华。大二那年,王仁华教授在刘庆峰班上挑了三个学有余力的学生加入中科大语音实验室,刘庆峰就是其中之一。

  进入实验室后,刘庆峰跟着师兄、老师做研究,他逐渐开始发现语音研究很有意思并慢慢地喜欢上中科大语音实验室,于是放弃了转到数学系的打算。在实验室里,刘庆峰获得了展示才华的平台。1995年,刘庆峰在王仁华的指点下制作了一个语音系统参加国家863项目竞赛,结果轰动了当时的学界。也正是在这一年,刘庆峰获得保送中科大硕士研究生的资格。

  成为硕士生后,刘庆峰成为中科大语音实验室863语音合成项目组组长,带领十多个人参与研发工作,这十多个人中有本科生、研究生甚至副教授。而其中有不少人,如今也在科大讯飞中担任要职。

  科大高材生投身商海

  1998年至1999年间,有了技术储备的刘庆峰开始了自己的创业生涯。当时,刘庆峰和他的团队在由团中央等单位举办的挑战杯创业竞赛中获奖,在相关单位的鼓励之下,刘庆峰和他的团队开始了创业历程。

  刘庆峰说:“当时我们的团队里有很多优秀的人才,当时中科大BBS电子计算机相关的八个板块中有六个板块的版主加入了团队。一开始,我们是和外面的公司合作,我只做总工程师,战略方面的事情交给合作方。但一段时间下来,我们发现管理公司的负责人必须要懂得技术、没有前瞻性就会迷失方向。最后在团队其他成员的坚持下,我们才开始完全自主地开始经营公司。”

  实际上,刘庆峰还是给自己留有后路。在创业的同时,刘庆峰拒绝了保送中科大博士的机会,转而通过考试的途径读博。当年,中科大和国内一些高水平大学的优秀毕业生几乎无一例外都选择了出国深造,而刘庆峰之所以拒绝保送,就是为了能够在创业遇阻的情况下出国留学。刚刚完全接手科大讯飞时,刘庆峰的案头仍然摆放着多个出国的选择,但最终这些后路都没有派上用场。

  刘庆峰说:“当时除了我们拥有更为明确的发展方向之外,还完成了第一笔融资,3000万元。当时我们利用这笔钱将国内语音技术比较好的中科大、中国科学院声学所和中国社科院语言所的资源整合在了一起。这是业界和学界多少年想做都没做成的事情,我们依靠企业制度和资本把大家联合起来,这件事我很自豪。加上公司步入正轨,于是我决定留下来继续自己的梦想。”

  中文语音技术应由中国人做

  刘庆峰的梦想是中国语音技术应该由中国人做到最好,这同时也是当时国内语音技术研究者们的共同梦想。在这其中,刘庆峰提到的三家科研机构拥有最强大的技术优势,中科大做语音算法研究最强;中国科学院声学所对声音、信号本身的理解最深;中国社科院语言所对语音、文字,对实验语音学最为了解。但本来有着很多优势的几家科研机构却因为种种原因从未走到一起,而国外巨头们对国内语音市场早已是虎视眈眈。

  到了1999年,也就是刘庆峰和他的同学们刚刚开始创业的时候,国内市场已经基本上落入外资企业手中,IBM、微软、英特尔、摩托罗拉都在国内建立了联合实验室,国内从事语音技术研究的人才大量流失,相关科研院所的研究团队甚至被外资企业连根挖走。

  面对这样的局面,虽然刘庆峰和他的团队起步稍晚,但发展却很快。由于有着国内各种有利要素的集聚,科大讯飞在语音技术和语音产业两个核心领域都已达到国内领先的地位。

  在语音技术方面,科大讯飞自从诞生起就在中文语音合成方面处于领先地位,而目前这种领先地位已经扩展到英文领域。

  刘庆峰说:“我们现在已经从中文逐步到了多语种的语音技术。我们已经连续6年获得全球英文大赛第一名,现在俄罗斯语与西班牙语又做得非常好。进而在声纹识别领域,再到语音发布,语音听写,其实我们的技术在发展过程中越来越强,核心优势越来越明显,技术创新是我们打造自己核心竞争力的第一个切入点。”

  但是光有核心技术还不够,由于实际生活中充满着南腔北调,还必须有一个强大的数据库支持,才能实现准确识别。目前,科大讯飞是全国普通话等级考试语音系统的技术提供商,今年使用这一测试系统的人数约为200万,而明年将在所有的测试中推广使用这一系统。如此一来,科大讯飞可以通过对这些数据的分析,掌握全国各地不同人群语言的特点,从而大幅提高识别的准确性。

  虽然从技术角度说,科大讯飞已经取得了成功,但从市场层面来说,科大讯飞和刘庆峰还面临着更大的挑战。刘庆峰说,“科大讯飞是按照自己的产业发展思路去发展,我们要获得对这个产业发展的主导权,要有话语权。”

  待到蜜$桃成$熟时

  创业之初,刘庆峰和同事们为自己定下的目标首先是全球最大的中文语音技术提供商,以后是全球最出色的多语种技术提供商。虽然刘庆峰认为他们与当初定下的目标还有一定的距离,但就技术提供商的定位来说,科大讯飞已经算得上是成功了。

  而今,科大讯飞与新浪合作推出的红微博、与腾讯合作QQ聊天项目都运用了语音听写技术。除此以外,科大讯飞的客户还包括华为、中兴、联想和电信运营商们。科大讯飞已经通过过硬的技术实力成为了国内市场份额最大的中文语音技术提供商。

  未来,科大讯飞还将保持技术提供商的身份,但是也将迎来或许是公司历史上最为重要的产业延伸。根据刘庆峰的规划,科大讯飞一方面需要抓住在移动互联网时代具有标杆性和引领性的一些应用,另一方面则是重点培养教育等行业市场的语音应用。

  刘庆峰说:“比如云输入法,我们下一步要做语音助理,希望真的能听、会说成为将来整个移动终端一个基本的因素。操控手机也好,操控家电也好,我们会选一些非常有标志、有典型的应用业务自己做。”

  科大讯飞从技术提供商走向终端应用的开发有其必然的原因。首先是科大讯飞拥有业内最强大的语音技术;同时,作为技术提供商,只做核心引擎,很难把规模和产业做大。另外,开发应用产品将使科大讯飞的品牌向终端消费者品牌过渡,提高消费者对科大讯飞品牌的认知度和使用粘性,反过来也将促进科大讯飞在技术市场和应用市场上的发展。

  在行业市场方面,科大讯飞更加重视教育领域。在科大讯飞办公楼的墙上有着这样一句话“我们的事业影响着中国的未来”。实际上,这代表着刘庆峰对中国教育事业的特殊情怀。

  刘庆峰说:“我以前学的英语就是哑巴英语,虽然老师水平很高,但一开口就有问题。在教育应用行业方面,我们希望以英语教学为核心的解决方案,可以在标准课堂教学、口语和课外拓展时使用,让孩子们用最短的时间获得比较好的英语能力。如果你的技术产品真的影响到每个孩子未来的成长,影响到人类未来沟通的方式,这就影响着我们国家的未来。”

  科大讯飞已经选定了市场突破口,但科大讯飞真正能从中获得收益仍要等待各种条件的成熟。不过,在刘庆峰看来,市场已经具备了走向成熟的条件。他认为,目前的语音技术已经能够达到实用的水平,同时互联网出现的云计算、高速移动互联网技术也为语音应用提供了很好的平台。而通过长期的教育和引导,加之苹果推出的iPhone4S加入语音系统,终端消费者对这一应用的需求正在觉醒。未来的3到5年内,将是语音应用大发展、大繁荣的机遇期。


TAG: