【TechWeb】11月18日,蚂蚁集团正式发布全模态通用AI助手“灵光”,上线第一天下载量破20万,两天多下载量破50万,第三天冲上App Store总榜第七,App Store免费工具榜第一,热度持续上升。

“这个表现超出了我们最乐观的预期。”蚂蚁集团CTO何征宇直言。
今年3月立项,历时8个月研发,上线3天即超预期,蚂蚁集团是如何做到的?在已经拥有AQ、蚂小财、支小宝等C端AI应用的背景下,蚂蚁为什么还要推出灵光这样一款产品?它有何独特之处?
带着这些问题,我们和蚂蚁集团CTO何征宇、蚂蚁灵光负责人蔡伟一起聊了聊“灵光”背后的故事。
受DeepSeek刺激推动灵光研发 上线时间都是灵光自己算的
DeepSeek春节爆火,打开了AGI新时代,也促使蚂蚁内部启动“灵光”项目。
其实,蚂蚁此前已经在讨论这个项目,但有些摇摆不定。直到DeepSeek问世,给了大家极大的信心。何征宇谈及当时感受:兴奋、紧迫感,还有一些羞愧。在“缺衣少粮”的情况下,DeepSeek也可以做到世界前沿水平,蚂蚁为什么不可以。
何征宇透露的一个背景是,蚂蚁第一款开源模型Ling-Plus 跟deepseekV2差不多时间启动,性能也差不多,但由于计算资源等原因,蚂蚁晚了一步。
于是,过年期间大家都没闲着,春节后第一天开始,蚂蚁内部连着讨论了三天,然后在3月份左右把几个团队集结起来,成立了相对独立的AGI组织,内部代号为“Inclusion AI (普惠AI)”,灵光正式立项。
说起灵光名字的由来,还有一个小插曲。因为蚂蚁旗下很多产品都是“灵”字辈的,比如百灵大模型、做具身智能和机器人业务的灵波,所以身为湖南长沙人的何征宇想了个名字“灵泛”(湖南话机灵的意思),考虑到很多人可能不知道什么意思,最后折中取了“灵光”。
何征宇透露,灵光的上线时间,也是团队在问过灵光之后,它自己给出的。灵光背后的模型有多家,包括千问等主流的开源模型,但主对话还是蚂蚁自研的百灵大模型。
据介绍,Inclusion AI相当于蚂蚁基座一样的部门,这个团队积累了很多技术能力,包括基础模型、搜索能力及AI Infra等,这些技术已经应用到蚂小财、AQ等蚂蚁其他支柱产品。
有用户花2个多小时“手搓”应用 闪应用功能一度被挤“宕机”
无论海外还是国内,目前大部分AI助手类产品还是文本呈现为主。就像互联网刚刚开始的时候,大家去写email ,里面通常是一些文字。
而蚂蚁做AI助手选择从全模态切入,首批上线三大功能——“灵光对话”、“灵光闪应用”、“灵光开眼” ,支持3D、音视频、图表、动画、地图等全模态信息输出。
用蔡伟的话说,灵光从email进化到了web,大家不再只是去读文字,而是去看一个网页,网页里面有各种各样丰富的内容,这些内容都是基于全代码生成的。
具体来看,“灵光对话”突破了传统文字问答模式,可以生成可视化内容。比如,当小编提问“电视剧《唐朝诡事录之长安》中提到的风狸兽是什么动物?”,灵光不仅给出了文字回答,还根据相关记载绘出了图片,甚至能让图片中的动物动起来。