两个周鸿祎继续厮杀“百模大战”,红衣教主:LLM弯道超车还得是多模态
衡宇 发自 凹非寺
量子位 | 公众号 QbitAI
周鸿祎,给所有不想自己上班的家人们谋福利了!
(资料图片仅供参考)
360智脑大模型应用发布会现场,他让自己的数字分身周鸿祎扛大旗,“今天我们不设媒体专访了,有什么问题问他”。
虽然谨慎起见,事先声明过“说对了算我的,说错了算他的”,但数字人周鸿祎的表现……好像还不错?
面对“你对360发展人工智能有信心吗?”这个问题,红色polo衫数字人周鸿祎的回答,从投入、安全领域应用经验、数据来源、可解释性和安全性等方面聊了一圈,最后表示:
充满信心,并会继续努力推动。
听了答案,真人周鸿祎乐呵呵,直言“回答得比我好”。
接下来的几个问题,数字人周鸿祎也对答如流,被周鸿祎称为“滴水水不漏,面面俱到”。
老周本人为360 AI数字人展台,不全是出于为产品站台。更重要的是,他吃到了自家数字人的第一枚甜枣:
不久前,嗓子哑掉的周鸿祎,训练了数字人,代替自己参加活动进行演讲,观众反馈不错,还称数字老周“比本人温柔”。
这虽然让他巨有危机感,但能有个AI分身帮自己干活,可太爽了。
数字人周鸿祎发布即上任
360智脑大模型应用发布会将360智脑迭代到4.0版本,统共有三个关键词:多模态、全端应用、数字人。
互动性最强、现场反响最热烈的,就是360智脑AI数字人。
这也是360在大模型上的核心创新点。
关于打造360 AI数字人的初衷,周鸿祎现场给出了解释。
一方面,周鸿祎称自己是坚信,AI发展下,在将来,浏览器、搜索、桌面都未必是普通个人和中小企业进入AI大模型最合适的入口。
他强调,大模型一定要场景化、产品化、平民化、垂直化。
比如现在与大模型对话十分重要的提示词工程(prompt engineering),对大多数普通人来说并不友好,熟练掌握也需要漫长的过程。
“让所有中小企业的老板都变成提示词专家,写出非常漂亮的提示词,我觉得是不现实的。”但是AI不断进化,应该成为人类的助手和朋友。
由此在360看来,未来进入AI大模型最合适的入口,最有可能是数字人。
以此为基础,360希望在GPT大脑的基础上,把多模态能力——周鸿祎称发展多模态能力,是中国自研大模型弯道超车的关键——融合在一起,包装成一个有自己思想、目标,有“灵魂”的数字人概念。
为了让人直观感受,现场推出360数字人广场平台,一口气发布了200多个数字人。
分为两大类,一类是数字名人,一类是数字员工。
数字名人偏向to C,包含明星偶像、历史先贤、文学IP,比如诸葛亮、林黛玉、孙悟空,还有马斯克……
没有事先录制视频,周鸿祎选择在现场向数字名人诸葛亮语音提问。
赤壁之战的时候,如果有iPhone,你会怎么使用?
最初,数字人给出的答案有些讨巧,周鸿祎现场让他再回答了一次这个脑洞大开的问题,于是得到这样的答案:
夫兵者,国之大事,死生之地,存亡之理,不可不察。
若有iPhone,吾必善加利用。
或可借其先进的通讯技术,迅速联络各方力量,调整战术策略,提高作战力量;亦可利用其强大的计算能力,准确预测战场变化,及时调整兵力部署。
……
,时长01:21
此后的其他对话,以及和孙悟空的交谈,都比较符合角色的性格及身份。
另一类数字员工(专家、助手)偏向to B,是360针对企业和办公一族打造。
最勾得人心痒痒的,还是每个人能够定制自己的数字人,就像周鸿祎那样。
问,周鸿祎创建一个周鸿祎,一共需要几步?
答案是3步(倒也符合360对大模型持有的平民、易用理念):
第一步,在360智脑平台上选择添加数字人;
第二步,添加角色信息,上传图像,添加角色描述;
第三步,导入资料,上传定制数字人的知识库,比如周鸿祎就上传了他的讲话稿、个人资料。
最后一步也直接展示了360称自家AI数字人“有灵魂”的原因,大多数数字人吸引人的点,多在外形姣好、逼真,以及贴合说话内容的口音和动作神态态。
到了360这里,最基本的,周鸿祎定义其“一定不是一个简单的对口型的虚拟形象,也不是一个念稿的机器”。
360的每个AI数字人,都有自己不同的人设,最后有自己的记忆、目标,并且能够自主学习、链接外围系统。
未来的研究方向,360希望自家的数字人能够跟人类对话、交流,进行讨论,提供帮助。
而做到这一切,需要其背后的360智脑提供多模态能力支撑,现已迭代到4.0版本。
大模型的仗,360怎么打?
从3月底官宣,加入全球“百模大战”,360千亿参数大语言模型360智脑如今是打了2个多月仗的“老兵”。
彼时周鸿祎口中爆出来给大家看看的“刚出生的孩子”,已经陆续有了看得见的成果——
在普通人间广为流传的,当属360智脑大模型押中今年全国甲卷和新课标II卷的两道作文题目,一度冲上新闻热榜。
从专业测评角度,360智脑是国内首个通过信通院AIGC大语言模型功能评测的大模型,研发团队还参与了大模型国家标准的编写,算是“国家队”的一员。
同时,在中文模型评测基准SuperCLUE 5月底更新的榜单中,新增360智脑大模型,在总榜单、基础能力榜单、中文特性榜单上都处于大模型第一梯队。
△SuperCLUE总榜单(5月23日更新)
而如果依照应用功能来,2个多月的时间里,360智脑相继发布了文生图、图生图、图生文功能。
发布会现场,又首发文生视频功能,各生成了4段奔跑的野马、企鹅在沙漠里洗澡、熊猫划船等短视频。
诸多多模态能力的展现,为360 AI数字人能够复刻思维方式和人生经历,成为AI分身提供技术底气。
如果将大模型视作新时代的发电厂,而非娱乐工具或消磨时间的软件,360智脑目前体现出的能力,似乎已经可以点亮小簇跳动的灯火,一定程度上提高个人和组织的工作效率了。
进步如斯,原因何为?
周鸿祎回顾2018年起,360对谷歌所发布BERT的跟踪和研究,到2023年积攒下了多个方面的经验,全部迁移到对大模型的研发上:
自然语言处理基因技术(搜索底色);
大规模/多样性/高质量数据优势(搜集和清洗数据是360的强项);
补足大模型短板的搜索增强优势(通过实时搜索对大模型幻觉进行矫正);
15亿全球用户和大流量训练出的工程调度能力(分布在能力层、平台层和框架层);
国民级互联网应用场景优势(和微软AI全家桶一般,让大模型能力接入全端产品);
数据安全+AI安全能力沉淀的大模型安全优势(360内部已成立专门的AI安全团队);
A股市场前列的算力资源(卡数多,有knowhow)。
在此过程中,周鸿祎还分享了一个训练千亿级大模型的方法。
即把部分训练方法先在百亿模型上求证,快速验证后再在千亿模型上进行实践,如此能够明显提高训练速度。
关于如何继续提升大模型的能力,360会继续走“两翼齐飞+四路场景”战术,一如老周继续秉持“不发展GPT才是最大的不安全”——
回看国内卷起“百模”厮杀后,至今,大模型已经遍地开花,无论是通用还是垂域模型,种类和数量都日渐丰富。
具体落到360智脑身上,周鸿祎表示AI的进化要以人为本。
既要“争先”,发展多模态的全面能力,铸造360迈向AGI的新的一级台阶,为360 AI数字人筑牢地基;
也要“求长”,推出结合场景的应用,如未来发展方向是生成声音、视频并拥有长期记忆的AI数字人,让它们拥有“手和脚”,具备执行力,更好提供服务,也成为360智脑对外亮剑的利刃。
发布会最后,红衣教主还留下了一个one more thing彩蛋——
数字人群聊,将是360智脑下一次版本更新的发布目标,把给出的林黛玉&诸葛亮&周鸿祎&孙悟空群聊demo,从视频变成实际功能。
这个功能让人想起前段时间斯坦福和Google的合作论文,研究者们让25个AI智能体在一个虚拟小镇上生存,活脱脱就是AI时代的《西部世界》。
如果红衣教主真能兑现承诺,也许普通人可以直接参与和观察的AI《西部世界》,就由360智脑搬来第一块砖也说不定哈~
关键词: