浙江在线首页 浙江在线首页 网站地图
主办:浙江省科技厅 浙江在线新闻网站
您当前的位置 : 浙江在线  >  科技频道 > 创新动力  
一知智能陈哲乾:做能“懂你”的AI机器人,用算力实现更多可能
2020-12-30 16:20:20 来源: 杭州市创业投资协会 许慕容

  电影《钢铁侠》中小罗伯特唐尼和AI助理贾维斯的交流画面,经常在陈哲乾的脑海中萦绕。

  ——不管是起初测试钢铁侠套装的数据,还是高空飞行时需要帮助,小罗伯特随时随地可以唤出贾维斯。随时待命的虚拟助手根据对话内容,完美解决面前的一个个问题。

  陈哲乾觉得,科幻电影中的镜头,其实离人类并不遥远。

  要在现实生活中拥有AI助理,自然语言处理(NLP)是一个出发点。作为人工智能中最为困难的问题之一,NLP能够缩减人与机器之间的交流差距,而这正是陈哲乾团队的一个技术优势。

  从2011年到浙大读计算机专业开始,到读博第三年创办杭州一知智能科技有限公司(以下简称一知智能),1993年出生的陈哲乾跟人工智能已亲密接触了将近10年。

  一知智能的AI虚拟员工,你听出来了吗?

  作为一知智能的创始人、执行总裁,陈哲乾带着公司走在人工智能充满魅力和挑战的道路上——专注于人机交互领域,给机器装上中枢大脑。

  短短三年多时间里,年轻的公司交出令业界瞩目的成绩单——

  团队和微软联合推出的FastSpeech语音合成系统,使机器的语音合成速度提高270倍,为目前业界合成速度最快的领先算法。

  成立两年即融资1.3亿元,在国内NLP领域创业公司中名列前茅。

  作为一家技术驱动型公司,一知智能获得多家权威机构的认可。2019年度杭州市领军型创新团队榜单里,一知智能榜上有名。获批的9家团队中,还有阿里巴巴、海康威视等知名企业。

  2019年最具成长性to B企业、2019年最可能改变未来世界企业、机器之心中国十大最具潜力早期AI公司等多项荣誉,也被他们默默收入囊中。

  今年7月份刚刚博士毕业的陈哲乾说,“一知”的意思是“一问便知”,他们要做出最聪明的语音交互机器人,为企业提高效率,用科技给人们送去便利。

  选择这个方向创业,让陈哲乾“每一天都充满希望,每一天都满怀激情”。

  能“读懂”人的机器人

640.webp (36).jpg

“虚拟人”小知,跟真人主播没啥差别

  一知智能引起过很多业界专家、政府领导的关注,最近一次吸引的,是中国工程院院士潘云鹤的目光。

  在10月中旬举行的第二届中国(杭州)国际智能产品博览会暨2020全球人工智能大会上,潘云鹤院士在一知智能的展位前驻足良久。

  这位浙江大学的老校长、中国人工智能领域的开拓者之一,如此看待一知智能的人机交互研究方向:“有很大的应用前景和想象空间”。

  在营销和客服场景,机器人被使用的频率越来越高,很多人可能都不陌生。但要遇到一个能说会道,能“读懂”人,具有“人的温度”的机器人,却并不那么容易。

  在萧山区的杭州湾信息港,一知智能的虚拟客服“小知”,令人惊喜地看到机器模拟人的程度可以何种逼真。

  陈哲乾在电脑上噼哩啪啦输入一行字,具有高颜值的“虚拟人”小知马上用设定好的或柔美或严肃的语气讲出这句话,讲话过程中唇音同步,从神态到唇形都呈动态变化,跟真人主播无异。

  以电话为载体的第一代产品“语音客服”,同样表现出色。现场实验了一个售后服务的多轮对话,从“你好”到“祝您生活愉快”,气氛融洽的8轮对话一共进行了1分50秒。

  在人机交互中,多轮对话是一个核心技术。市面上相对智能的机器人,通常对话时间不超过一分钟。但在一知智能切入的电商场景下,机器跟人的对话时长可以达到平均73秒。

  不只是多轮对话,机器还能识别情感。比如说用户是开心还是不耐烦,机器都能识别出来,并会根据不同的情绪配置不同的话术。

  “几百万通电话下来,平均通话时间越长,代表人越乐意跟机器去交流。”聪明的机器人,是陈哲乾追求的产品效果。

  创业之初,陈哲乾曾去企业的客服中心体验过一周,一天电话打下来,到了晚上人都是懵逼状态。人工一天打200个电话已是极限。对企业来说,管理成本高,人员流动性大,是亟待解决的痛点。

  如何帮员工减负、帮企业降本增效?利用人工智能来代替高重复性的人员工作,无疑是最好的选择。

  目前,一知智能合作客户近3万家,其中不乏华为、腾讯、阿里巴巴、国家电网、中国银行等这样的大客户,客户覆盖了电商、教育、金融、政企等领域。

  疫情期间,一知智能的智能语音机器人被大量用于通知、回访电话,提醒打卡电话。在国家电网的营业厅、电商“双11”“双12”订单尾款催付中,一知机器人也都发挥出重要作用。

  以国家电网为例,一知智能每月为其拨打80万交费提醒电话,用户覆盖浙江省11个地市,截至目前累计催收电费金额7.2亿元。电费回收时长平均缩短两天, “机器代人”减少人工催费工作量近40%,预计一年可减少近2亿元的人工成本。

  而一知智能的第二代产品“虚拟形象数字员工”,最近也应用于无人营业厅,实现的是“跨媒体多模态人机交互”。陈哲乾解释说,就是将语音、视觉、触控等多种传感器模态组合起来,实现机器跟人的智能交互。

  传统的自动终端机,可能旁边还需要一个大堂经理帮忙指导用户如何操作,通过“虚拟员工”的多模态交互,不仅可以听懂问题,还能根据用户需要调出画面,“手把手”教用户操作,更加灵敏和智能。

  潘云鹤评价说,“这种跨媒体多模态人机交互产品,是支撑未来机器与人多维度、跨媒体交互,建设‘数字中国’的大势所趋。”

  含着金汤匙出生的一知智能

640.webp (37).jpg

曾经的比赛牛人,通过创业挖掘人机交互的魅力

  从2011年来杭州读大学,陈哲乾已经做了9年“浙大人”。

  大二那年,他看到微软发布的一个关于未来的概念视频,对视频中描述的泛屏时代印象极深。刷一下卡,桌子、车窗都可以成为电脑屏幕。人工智能引起了陈哲乾的兴趣。

  大四快毕业时,他在保研和直博中选择了后者,进入浙江大学国家重点实验室——计算机学院CAD&CG实验室,从事人工智能人机语音交互相关研究工作。他希望自己能成为人工智能方面的专家。

  读博期间,陈哲乾很拼,前两年就满足了博士毕业的要求,还经常去国外参加各种比赛和演讲。

  各种比赛中最牛的一次,当属2017年获得SQuAD机器阅读理解比赛全球单模型组第二名,排名仅次于微软。

  SQuAD 是由斯坦福大学于2016年推出的数据集,被誉为自然语言处理领域金字塔尖的比赛。自发布以来,吸引着谷歌、微软亚洲研究院、IBM研究院、阿里巴巴达摩院等众多国内外知名研究机构和高校的目光。

  在AlphaGo火起来的2016、2017年,人工智能受到国内天使投资机构的强烈关注。也正是在这种情况下,天使轮金沙江联合资本对一知团队有格外的关注。毕业于浙江大学的王国成,“邀请”这支团队出来创业。

  当时陈哲乾还在读博士,团队经过调研,发现市场需求巨大,而且当时市面上并没有像样的人机交互产品。

  而人机交互是浙大的一个看家本领,一群技术男觉得有责任发挥其价值。

  “干吧。”

  2017年8月,一知智能成立。

  萧山区政府的大力招引,可以说是把一群技术男变成创业者的另一个“神助攻”。

  陈哲乾记得,当时只有一个PPT,萧山区领导听了他们的介绍,20多分钟就决定引进项目,并且给了办公场地和资金支持。

  用陈哲乾的话说,“ 我们那时候也算是含着金汤匙出生的。”

  公司成立半年,一知大脑做了出来。凭着技术在业界崭露头角的一知智能,受到不少公司关注,包括某行业巨头也曾找上门来邀请他们加入。

  现在的一知智能,从10几人的公司,发展成了拥有近150号人的大公司。快速发展离不开技术与商业并重的创始人团队。

  创始团队中,同学李一夫是首席技术官。同样是90后的联合创始人顾泽良,被他们从金沙江联合资本的投资岗位上“拉下水”,成了公司CMO(首席营销官)。

  录入10句话,你就能成为“歌手”“故事大王”

640.webp (38).jpg

在他的想象里,《钢铁侠》里的AI助理有可能实现

  陈哲乾身上有种沉稳和自信,凡是见过他的人,很容易保持一致看法。

  这个24岁开始创业的人说,创业是一个正确的选择。

  “用我最熟悉的技术做最喜欢的事情,而且还能做得比别人好一点,这种感觉很奇妙。”他如此形容他的创业。

  年轻的一知智能已经走上了正轨,深受客户好评,而且实现了盈利,账面资金充足,对陈哲乾来说,“我现在每天想的是如何让他更好,每天看到的是希望。”

  他深知自主研发能力对科技型公司的重要,所以一边抓产业化落地,一边搞算法攻关,研究底层技术。

  因为重视人工智能前沿算法的基础研究工作,公司成立之初便设立了浙大·一知人工智能联合研究院。目前一知团队硕士、博士有40多人,员工中80%的科研人员来自浙江大学、英国帝国理工大学、英国巴斯学院、香港科技大学等知名院校。

640.webp (39).jpg

浙大·一知人工智能联合研究院揭牌仪式

  陈哲乾说,研发人员是公司的宝贝。浙大·一知人工智能联合研究院的学弟们,跟曾经的他一样,研究起黑科技来可以通宵达旦。

  比如今年陈哲乾给他们定了一个课题,“如何用尽可能少的样本,训练出最拟人的效果?”

  他们交出的黑科技,好玩有趣。

  陈哲乾给我们听了一首《隐形的翅膀》,甜美的声音听起来跟唱片没区别,但实际上却是用机器合成的。问其原理,用到的是音色克隆技术。

  一个人在安静的环境里录几句话,一知大脑就能捕捉到其音色特征,把声音、乐谱合成后,你就成了拥有动听歌喉的“歌手”。

  同样的,通过音色克隆,机器会模仿家长的声音给孩子讲格林童话,也可以模仿子女的声音陪伴老人。

  令人叫绝的是,一知大脑录入的样本足够小——10句话就够了。而导航上听到的林志玲的声音,据说至少要录一天,可能要读上3000个句子。

  因为公司强大的科研基因,黑科技被源源不断地创造出来。一知智能研发的语音合成算法二代,速度比谷歌的算法快了400倍。

  在自然语言处理中,一知机器人也更聪明。不按常规顺序的反问句、倒装句,粤语、四川话等方言,机器人都能“听得懂”“听得清”。语音识别和语义理解比普通智能机器人更胜一筹。

  “机器会越来越聪明,让机器去适应人,这是我们的憧憬。”

  通过自主研发的语音语义算法引擎,一知大脑在电话、自助终端机两个载体上开出了一连串鲜艳的花,智能语音、智能呼入、智能在线客服、智能质检、坐席辅助、虚拟数字人等产品功能和服务,深度赋能客户企业,帮助企业在数字经济时代建立核心竞争力。

  围绕人机交互,一知智能还在不停寻找新的载体。比如说眼镜、桌子、窗玻璃未来说不准都会成为载体,人类“唤醒”一下,全息投影的虚拟人从空中冒出来,跟人进行对话。

  在陈哲乾的想象里,《钢铁侠》里的AI助理,微软概念片里看到的场景,都有可能实现。

  “我是一个对科技充满幻想的人,我觉得这一切都可以期待。我希望有一天是我们公司,把《钢铁侠》里的AI助理亲自做出来。”

  曾经的苦行僧在“open”生活中快速成长

640.webp (40).jpg

  如果分别用一个字来形容创业前后陈哲乾的不同,专心读博时他偏“静”,创业后却不得不处于各种“动”中。

  他在“静”中修炼,在“动”中成长。

  读博时写代码,看满是公式的全英文论文,都需要心非常静。读博时过着苦行僧一样的生活,心无旁骛,不要想任何事情,“如果一个博士比较open的话,这个博士一般会读不好。”

  现在的他,几乎全天候处于“open”状态。

  为了让自己尽快成长,他看书,交流,网上看视频,积极参加浙大校友会等组织,虚心向人请教。因为经常出去交流请教“混圈子”,去年瘦了十斤的他,今年又重了十斤。

  在浙大一个创业社团,上市公司每日互动创始人方毅成了他的企业导师。从方毅那里,他说学到书本上学不到的知识。

  实际上,刚读大学时陈哲乾就知道了鼎鼎大名的学长方毅,并且加入后者组建的创业精英会。大三时他曾创过一次业,跟同学一起做了个校园社交APP,多的时候2000多号人同时在线。

  创业过程中,走过弯路踩过坑。陈哲乾印象深刻的是,2018年7月份,团队没日没夜开发产品,眼一睁就干活,困了就睡公司。搞了一个月,结果发现这个版本bug太多。毅然全部推翻,从头再来。

  “技术男比较理想化,一来就想建世界顶尖的摩天大楼,实际上连小土房都没建过。那个版本地基打得有点歪。”

  陈哲乾从中领悟到,不论做什么产品,一定要用迭代的思想一步一步去做。

  陈哲乾也纠结过,学术和创业能否二者兼得。公司的第一代产品,是他亲自画的原型图。前期语音识别、语音合成的人机对话算法,也是他带着团队做了工程化。他舍不得技术,还想自己写代码。后面发现根本不允许,赶紧往自己不擅长的管理方向努力学习。

  他过着跟以前截然不同的生活。但相同的是,一切都是为了自己最喜爱的人工智能,而且他乐在其中。

  一知团队中90后居多,平等的交流和讨论是90后的相处模式。有些员工说,“我是来帮一知上市的。”他接受这种自信。公司学习氛围很浓,他喜欢大家在一知夜校里看书分享的氛围。

  他脾气很好,说话慢条斯理,没有波澜。但同时又极有原则,他希望公司小伙伴都是一种正面积极的形象。

  三年前总是论文、代码不离手的陈哲乾,在德鲁克的书中学管理,在《菜根谭》《孙子兵法》和心理学书籍中,学着读懂人心。在商业模式的寻找中,他逐渐把握了航向的精准度数。他更看到眼下人工智能时代,一知智能的潜力和优势。

  “在人机交互领域,聪明不聪明,反应快不快是最本质的东西,就像汽车的发动机,业界没几家能生产出来。领先的自研技术,让一知智能有绝对的优势和信心。”

  在陈哲乾的想象中,人机交互智慧化服务的未来前景非常广阔,而一知智能,将为此不懈努力。

  “未来将是一个万物智联的数字社会,人工智能将不断深度融入到生产生活。一知智能很荣幸能参与到这一伟大的历史进程,贡献我们的青春和力量。人机交互智慧化服务的未来前景非常广阔,比如基于人机互动的双边关系,终端客户单向度向全生命周期管理演变,真正实现大数据‘精耕细作’的巨大价值;比如由可听可看可用向交互赋能迭代,激活体验场景价值,带来更多的自由、更多的选择。未来一知智能将为社会提供百万名数字员工帮助政府、企业实现智能化重塑转变,解放简单重复劳动力,让越来越多服务实现‘不见面’,使我们生活变得更智慧、更聪明。”

  在人工智能的三个重要赛道里,人脸识别有商汤科技,语音识别有科大讯飞,人机交互领域,一知智能能否成为最耀眼的星?

  未来可期。

标签:人工智能;人机交互;机器人 编辑:张吉
分享到:
相关阅读
Copyright © 1999-2017 Zjol. All Rights Reserved 浙江在线版权所有