如今,对着手机、电脑说话,让它帮你在网络上搜索数据已经普及。这样的人机交互,还可以查询天气、设置手机日历、闹铃等服务……现在天天用它搜索数据,知道是谁创造的吗?他,就是百度首席架构师、语音技术部首席研究员,贾磊。
贾磊加入百度时,百度公司没有任何语音搜索系统的核心技术。只是依靠外部合作单位提供一些很基础的语音搜索系统,该系统的语音搜索的精度远远比不上当时的谷歌在中国大陆提供的汉语语音搜索服务。
面对百度要研发自主产权语音搜索产品的要求,以及当时语音人才匮乏的窘境。贾磊义无反顾地投入自主产权的核心技术研发中。他亲自上阵,提方案、做设计、做规划。贾磊回忆起当时,每天除了睡觉都是在工作。当他的方案被一个同仁认可时,就多一个人帮他做,就这样一个、两个、三个……信任贾磊的团队成员日益增多,分工日益精细、各抒己长,贾磊负责攻克核心技术难关和任务拆解,大家负责产品方案的实施和产品效果的打磨。百度语音搜索技术的研发之路,在贾磊的带领下越走越广。
从项目开始到百度完全自主研发的语音搜索系统上线结束,只用了不到6个月的时间。上线时已经明显超越了谷歌的中文语音搜索产品。目前该语音搜索系统每天服务千百万的中国广大搜索用户,成为语音技术产业化的最成功经典案例。
他的过去:成功研发日语汽车导航系统产品原型
过去,贾磊曾在松下中国担任松下语音识别技术项目组Team Leader(团队负责人), 并和松下美国研究所一起,成功研发了手机上的英语、日语和汉语的人名数字拨号系统,该产品最终在松下手机上获得成功应用。
之后,贾磊离开松下,加入IBM中国研究院。贾磊和IBM美国研究部门的同事一起,构建了汉语广播识别系统。2006年年初,贾磊又回到松下中国研究开发有限公司,并担任松下整个语音技术部的高级经理(GM),领导松下中国部门成功研发了日语汽车导航系统产品原型。为理想奋斗的他,想让他在意和关心的人也能够用到他研发的技术,所以他又放弃了松下,回到中科院自动化研究所,主导了中科院自动化所的第一版本的云计算条件下的机器翻译系统构建工作。
他的现在:他不仅是一位优秀的技术研究者,更是一位阳光导师
现在,贾磊在百度的团队有80人左右。语音已经成为百度的技术强项,而贾磊个人在百度、在业界也早已不是默默无闻的人。每一个和他聊过天的人,都被他的阳光、自信所感染,每一个和他聊过天的人,都说他不仅是一位优秀的技术研究者,更是一位富有“阳光”心态的导师。百度资深研发工程师万广鲁说:“磊哥不愧为国内语音技术届首屈一指的人物。我很佩服他。跟着他一起干,不仅技术有突破,更为社会做贡献。”
将科技变成产品,用产品服务生活,是贾磊正在做的事情。现在,每天有上千万的用户使用贾磊团队做出的产品。语音识别系统的准确率和识别速度都达到了国内领先水平。
但贾磊并没有放慢脚步,他在完成语音搜索和语音输入法产品后,贾磊又领导团队,研发了类似苹果“Siri”系统的智能语音手机助手系统。使用该助手,人们可以直接使用语音操作手机交互界面。该系统被成功应用于百度以及各大手机厂商的产品中。此外,如三星等国际知名手机终端厂商也采用百度的语音助手作为自己的穿戴式设备解决方案。
他的展望:让我们相信中国技术的力量
自从百度对外宣布了开放语音识别、合成技术,并无偿提供给中国的所有开发者免费使用开始,已经有类似中国国际航空公司、陌陌等大量的厂商接入使用百度语音技术开放平台的语音技术。上百家中小开发者也会陆续接入百度的开放语音技术平台,享受到免费的语音服务,这是百度实现技术报国的实际举措。而语音技术开放平台的背后,正是贾磊领导其团队辛苦劳动的工作成果。
未来贾磊将继续领导团队,为语音技术的全社会免费使用贡献自己的力量。贾磊认为:“技术和科学不一样,中国有很多像我一样普普通通做技术的人,很多中国本土的工程师,没有高大上的背景,我们都是普通人,就让我们一点一滴的做,让我们中国的技术,改变中国的社会,希望整个社会相信我们中国技术;要将科学变成技术,惠及更多的人,还需要许许多多的中国工程师,所以让我们相信中国技术的力量。”贾磊对每一个技术都追求做到极致。
对于未来,贾磊只说了一句话:“中国技术可以改变中国社会,让我们相信中国技术的力量。”
【小档案】
贾磊,百度首席架构师、语音技术部首席研究员,男,1975年12月出生,博士。百度语音搜索、语音输入法创始人。他的团队曾获得2012年度百度最佳团队,曾获2013年度百万美金的百度最高奖;他的项目“具有个性化自适应能力的高性能语音处理技术及应用”获得北京市科学技术奖二等奖。
【对话】
记者:你是如何“迷上”语音技术的?
贾磊:我在中国科学院自动化研究所攻读博士学位时,选择的博士论文题目是广播语音识别。这项技术是在通过语音识别技术,对广播电视新闻中的声音内容信息进行识别和挖掘,然后建立关键词索引,最终实现多媒体内容的轻松索引。应用很广泛,但是如何实现还要攻克各种技术难关:音频分割、音频分类、说话人聚类、连续语音识别、说话人自适应、关键词检索技术……其实本科、硕士期间也尝试过其他的东西,可以说年轻时一直在寻找,当遇到“语音”时,便“钟情”于“她”。
记者:现在团队里的人越来越多,大家配合怎么样?
贾磊:现在百度上下都说我们团队是“子弟兵”、“兄弟兵”。现在大家配合都很默契。
记者:你的工作强度很大,同时要精准又需要创造力。平时你如何放松自己?
贾磊:我现在最喜欢跑步,跑步时我可以放下所有事情,什么都不想,只专注于跑步。而且我是不管哪里都可以跑,出去开会也是,换上跑鞋就可以,不需要环境很好,只要可以跑步,我就能放松下来。
□本报记者 高铭/文 彭程/摄