原标题:马云投资1000亿的达摩院,已拿下国际顶尖技术赛事40项世界第一
自2017年10月阿里巴巴达摩院亮相之后,到目前为止一直没有太大的消息传出,这个马云承诺要投资1000亿的部门到底在研究什么?
2017年10月,在杭州召开的云栖大会上,阿里巴巴的达摩院正式亮相,很多人或许还不知道,这个部门一直是阿里的核心技术部门,里面有最顶尖的研发资源。
2019年已经过了大半了,两年时间,达摩院到底研究出了哪些黑科技呢?
一、达摩院突出成就——AI技术
在成立达摩院时,马云表示在三年内将给达摩院投入1000亿元用作技术研究开发。
好在,达摩院没有让马云失望,仅两年时间,阿里AI团队便在国际顶级学术会议上共发表近400篇顶级论文,在国际顶级技术赛事上斩获40余项世界第一。
就在6月刚刚结束的第三届图像识别竞赛中,阿里AI以82.54%的识别准确率击败了全世界150多支参赛队伍获得冠军。仅仅通过拍摄一张物体照片,就可以实现数据精确比对查询,从而获得最精确的反馈结果。
其实这样的技术,阿里早就开始研究了。我们在日常淘宝购物时,都应该用过拍立淘,只要拍一张或者上传一张你想要买的东西,平台就会在现有的店铺商家产品中,为你匹配最相似的产品。目前,阿里AI技术已经可以识别实物物体超100万种。
二、达摩院集结世界级高端人才
所有的成就不是一蹴而成的,而是和达摩院实力雄厚的人才储备有非常大的关系。有数据统计,达摩院旗下科学家团队有超过20多位世界级科学家,以及10多名IEEE FELLOW,连原Facebook人工智能科学家贾扬清也宣布加入阿里巴巴达摩院任技术副总裁。
不得不承认,阿里的达摩院已经是一个全球化的机构,半数以上成员都具有博士以上学位,办公室分布在四个国家的8个主要城市。
三、语音合成技术再现“黑科技”
达摩院机器智能向外界展示了新一代语音合成技术——KAN-TTS。
就是将传统 TTS 和端到端 TTS 结合,通过两者的优势,充分利用二者具有差异化的深层技术,合成具有表现力和稳定性的语音。
且针对不同的需求,达摩院机器智能技术实验室可以提供更加智能的 TTS 产品,包含5 大场景:通用场景、客服场景、童声场景、英文场景和方言场景,并具备 34 个高品质的声音。
TTS技术从1939年发明出来以后,经历过多个发展阶段,我们所能认知的阶段,还处在以2017年为节点的科学技术,而目前的技术水平简直是神一样的发展速度,商用系统合成语音与原始音频录音的相似程度可以超过97%以上。
四、达摩院硕果累累
1. 语音领域
2019年1月在机器智能技术国际顶级对话系统评测大赛中获得双料冠军,将人机对话准确率的世界纪录提升至94.1%,并在2019年7月创造了这一记录背后的人机对话模型 ESIM。
2. 自然语言理解方面
机器智能技术实验室在 6 月的 MS MARCO 文本阅读理解挑战赛中,击败了 Facebook和微软,创造了阅读理解能力测试的新纪录,并在开放域问答任务上超越人类阅读水平。
3. 机器翻译技术
达摩院的机器翻译技术团队已经实现了48个语言翻译方向,支持俄、西、法、阿、土,泰、印尼、越南等多种语言翻译,其中电商覆盖了大部分语向和场景,超越了谷歌和亚马逊,日调使用量达到17.9亿次。
4. 机器视觉领域
在机器视觉领域,机器智能技术实验室在图像搜索、大规模图像识别、视频分析、线下视觉智能等领域都有所建树。其中,图像搜索领域,阿里 AI 的向量引擎比Facebook快6倍。
结语:
最最恐怖的是,上述的所有成就,只是达摩院旗下机器智能技术实验室的进展和成绩,其他领域的“黑科技”尚未透露。
但可以预见的是,未来的达摩院将成为世界级的科学实验室,中国也将在高端科技研究领域,拥有非常高权重的影响力。