当前位置: 首页>关注 >

出门问问李志飞:大模型的最好“工作”是做人类的助理|焦点简讯

2023-04-21 23:07:35 来源:亿邦动力

【亿邦原创】4 月 20 日,出门问问在北京举办主题为 "AGI · 降临 " 的 2023 AIGC 战略发布会。会上出门问问 CEO 李志飞宣布内测探索大模型 " 序列猴子 "。


(资料图)

李志飞认为,大模型是一个序列模型,比如文本就是一个简单线性序列,自然界还有很多更复杂的结构,比如蛋白质结构、核聚变状态,都可以通过大模型思路来建模与分析。大模型这种方法有很大的想象空间。

同时,李志飞指出,大模型的最好工作,是做人类的 CoPilot/ 助理。

为此,出门问问在大模型能力的基础上发布面向创作者的 CoPilot 产品矩阵,其中包含了四款 AIGC 产品,分别为 AI 写作平台 " 奇妙文 "、AI 绘画平台 " 言之画 "、AI 配音平台 " 魔音工坊 "、数字人视频与直播平台 " 奇妙元 "。

出门问问还发布了面向 C 端的升级版语音助手魔法小问,以及面向 B 端的企业专属大模型的内测探索。

1、什么是 " 序列猴子 "?

出门问问大模型 " 序列猴子 " 是一款具备多模态生成能力的大语言模型,模型以语言为核心,涵盖 " 知识、对话、数学、逻辑、推理、规划 " 六个维度,能够同时支持文字生成、图片生成、3D 内容生成、语音生成和语音识别等不同任务。

目前," 序列猴子 " 大模型已经具备了一定的自然语言理解、知识、逻辑以及推理等能力。比如李志飞在现场提问," 湖南和湖北哪一个省会的人口更多 ",大模型能够快速给出推理答案。

据介绍,出门问问自研大模型中文名 " 序列猴子 " 的灵感,来源于数学家埃米尔 · 波雷尔在 20 世纪初提出的 " 无限猴子 " 定理,指的是,如果一群猴子随机地敲打一台打字机,最终一定会产生完整的莎士比亚作品。这个定理基于概率论和组合数学,阐释了概率的统一性。

出门问问大模型的构建原理与 " 无限猴子 " 类似,海量文本序列通过出门问问自主算法的不断训练,经过大规模算力消化理解,就可以练成 " 序列猴子 "。

李志飞表示,大模型不只是参数量大,当今的大模型是互联网文本的深度建模,而互联网文本是世界知识的映射,因此大模型是一个认知模型,是对语言的建模。

语言是思维的边界,而大模型拥有无限想象空间。

" 序列猴子 " 在训练过程中已经展现出了 " 涌现 " 能力,目前正处于 " 顿悟 " 阶段,未来提升的速度会越来越快。他还认为,未来,个人与企业专属的 CoPilot 将无处不在。

2、一站式 CoPilot 产品矩阵

基于 " 序列猴子 " 大模型,出门问问内测探索了多款面向创作者的 AIGC 产品及应用。目前出门问问产品矩阵注册用户超 500 万,全球付费用户超百万。

1)奇妙文:AI 写作助理

发布会上第一个亮相的 CoPilot 产品是 " 奇妙文 "AI 写作助理,AI 写作能力覆盖了职场办公、市场营销、新媒体和创意写作四大内容创作场景,可以帮助用户在撰写年终总结、客服话术、剧本、广告文案等内容时,提供灵感和创意方向。

" 奇妙文 " 有八大 AI 编辑功能,分别为风格转化、要点提取、校对纠错、续写、改写、扩写、缩写、翻译。" 奇妙文 " 还能在写作中自动生成图片,为用户带来图文并茂的写作体验。

2)言之画:AI 绘画助理

" 言之画 " 是 AI 绘画平台,服务于设计师、插画师。

" 言之画 " 支持二次元、蒸汽朋克、插画等 8 种创作风格。用户只需输入文字," 言之画 " 就能一次性生成 8 张光影逼真、细节丰富的 2K 高分辨率图像。

除了以文生图,它还拥有以图生图、动图生成、个性头像生成等 AI 绘图能力。对于企业用户," 言之画 " 还支持专属模型定制,能够根据企业风格定义模型风格,并且支持多人协作生产。

目前," 言之画 " 已经与家装设计平台酷家乐达成了探索意向,在酷家乐平台上,用户们借助 " 言之画 " 只需用文字描述出自己的需求即可轻松更换装修风格、调整家具位置等,进而设计出自己喜欢的装修方案。

3)魔音工坊:AI 配音助理

面向 AI 配音场景,出门问问推出了新一代 AI 配音产品 " 魔音工坊 "。" 魔音工坊 " ( 海外版 DupDub ) 已经开放了超 1000 种音色、超 2000 种声音风格以及超 20 种方言和外语。

" 魔音工坊 " 搭载了大模型 AI 写作功能,可以进行 AI 写作、AI 配音和剪辑等多个场景,在它的辅助下,用户可以完成影视解说、有声书、在线教育、新闻播报等集文案与配音于一体的内容创作。

目前," 魔音工坊 " 已经与微信读书、少年得到、大众等多个行业的头部企业达成了合作。

4)奇妙元:AI 数字分身

在文字、图像、声音等生成能力基础上,出门问问还退出了 AI 数字形象创作及直播平台 " 奇妙元 "。

据介绍," 奇妙元 " 平台现有超 100 款数字人、超 1000 款 3D 数字资产、超 1000 种声音。凭借多模态生成技术," 奇妙元 " 平台目前共支持图片建模(2D 数字人)、视频建模(2.5D 数字人 ) 、3D 建模 (3D 数字人)三种不同形式的数字人生成。

形象克隆功能,仅需一段 5 分钟的真人视频素材,就可以 1:1 复刻用户的形象神态,为用户打造声音一致、动作自然的数字人分身。

3、从个人到企业,CoPilot/ 助理将无处不在

出门问问在语音助手领域的研究积累了 10 年,2014 年出门问问发布了首款语音助手 " 小问助手 ",2015 年迭代了 " 小问秘书 ",2017 年推出了全场景 VPA,并在 2019 年对 VPA 进行了升级。本次发布会上出门问问内测探索的 CoPilot- 魔法小问,可以理解为 Siri 与 ChatGPT 的综合体。

作为面向个人用户开发一款智能语音助手," 魔法小问 " 可以帮助用户查百科信息、查天气、查餐厅、查酒店,还能与用户自由对话,让用户更方便、快捷地获取信息。

据出门问问介绍,"CoPilot" 源自超级助理的概念,它将拥有基于大模型的高智商大脑,能够分析海量数据即时准确地与人类交流;拥有动听的声音、靓丽的形象,可以搭载任意硬件平台,如手机、手表、车机等;还能够适配很多行业,比如老师、律师、医生、金融客服等。

目前,出门问问的几款应用都已经开放内测。

出门问问还和首批十大行业的内测探索伙伴达成了合作,包括汽车、教育、律所、金融、医疗、旅游等,未来出门问问 "CoPilot" 将逐步赋能更多行业,助力更多企业拥有自己的专属大模型,打造自己的专属 "CoPilot"。

关键词:

推荐内容