阿里发布千亿参数规模 AI 模型,可设计 30 多种物品高清图像
发表于2021-03-02 20:28:30

  原标题:阿里发布千亿参数规模 AI 模型,可设计 30 多种物品高清图像

  3 月 2 日消息,阿里巴巴与清华大学联合发布业界最大的中文多模态预训练 AI 模型 M6,该模型参数规模超千亿,同时具备文本、图像的理解和生成能力,图像设计效率超越人类,可应用于产品设计、信息检索、机器人对话、文学创作等领域。 此次发布的 M6 模型参数规模达到 1000 亿,是多模态预训练领域史上最大的模型,其理解和生成能力超越传统 AI。以图像生成为例,模型可设计包括服饰、鞋类、家具、首饰、书籍等在内的 30 多个物品类别的图像,最短一分钟即可完成作品的创作,效率超越普通设计师。 M6 的突破源自多项底层技术创新。阿里巴巴研究团队基于自研 Whale 分布式框架,将参数规模扩展到千亿的同时,利用大规模数据并行和模型并行,训练速度提升 10 倍以上,仅需 1-2 天即可完成上亿数据的预训练。此外,M6 模型首次将多模态预训练模型应用到基于文本的图像生成任务,结合向量量化生成对抗网络学习文本与图像编码共同建模的任务,能够生成清晰度高且细节丰富的图像。 阿里巴巴达摩院智能计算实验室资深算法专家杨红霞表示:「多模态预训练是下一代人工智能的基础,M6 模型实现了训练效率和生成精度等多项突破,是当前众多中文多模态下游任务最优模型。」

投稿:lukejiwang@163.com
Copyright © 2002-2024 鹿科技