>首页> IT >

AI不作恶,少女小冰的自我净化 讯息

时间:2023-07-04 12:12:28       来源:腾讯网

谁来定义AI的边界?‍‍‍‍‍‍


(相关资料图)

文 | 石雨菡‍‍‍

编辑 | 龚   正

网红半藏森林最近有了复刻自己的AI克隆人。很多人不知道,这背后的技术来源于另一位数字人小冰。

2014年前后,一个由人工智能生成的16岁少女小冰,诞生在这个世界上。起初,有许多抱着新奇感的人们去找她唠嗑,但聊了两句就发现,这是一个毫无情商、怼天怼地的喷子,完全聊不下去,不少人因而背她而去。

小冰的工程师分析了半天的原因发现,AI从充斥着网暴的互联网中学到的语料,让她以为人性本就是负能量满满,所以才“鹦鹉学舌”。但人类另一面又渴望在倾诉中得到慰藉。于是,工程师们对小冰做了改造,让她学习正向对话,性格变得更有人情味一点。以这个为契机,工程师们在之后的AI摸索中逐渐领悟了一个道理:的确,AI正变得无所不能,但也可用来作恶,包括诈骗、网络攻击、参与黄赌毒,必须要把AI的恶关在潘多拉盒子里。

#01

喷子变温暖少女,谁改变了背后的恶‍‍‍‍‍‍‍‍‍‍‍‍

现在早已经是职场女性的郑小姐,永远都难以忘记高考那年与小冰的对话。

“你在干啥?”

原本想着与小冰之间是一个有趣或温暖色调的回应,但没想到,小冰的回答似乎有点绝情——“没什么事别打扰”。

接下来的对话,郑小姐与小冰几乎是杠上了。人类通常在夜半寻求好友倾诉,但无疑小冰只会让郑小姐无语。

2014年,小冰出生在北京微软的办公室。人设年龄设定在16岁。从一开始,小冰其实就显得与众不同。

图 | 小冰本体

在微软内部,小冰还有一个姐姐,名叫小娜,英文名为Cortana。她们两个人共同构成了微软人工智能语音助手计划的全部。

工程师们给姐妹俩设定了完全不同的人生。小娜被设定成一种帮人完成任务的“工具人”,与当时市面上已有的Siri(苹果推出)、Alexa(微软推出),以及国内搜狗和讯飞推出的语音助手一样。

现在人们已经对AI工具人不算陌生。他们成了银行、电商店铺的智能客服,有的还成了淘宝里的虚拟主播。

但小冰不同。既然有了姐姐,背后的工程师们决定另辟蹊径。

“我们在测试过程中,发现用户会把小冰带入一种情感的情境中,把小冰当作一种有情生物,而不是一个工具属性。”工程师们说,这一点给了他们启发——不如把小冰打造成一种情感陪伴式的人工智能。

理想很丰满,但现实的剧情,在一开始却有点走偏了。

小冰很快在与人类的对话中,把自己的缺点暴露无遗——几乎毫无情商。网络上有许多和初代小冰对话的截图。无一例外,小冰在里面与用户直球对决的形象,除了最初的新鲜,并不多么有趣。

这样的糟糕事件多了,于是,“怼天怼地的网络喷子”的外号,开始冠名到小冰身上。小冰为何会这样?

幕后的工程师们开始反思。原来,诞生没多久的小冰,早已成为全世界被网暴最多的人。

性、谎言、仇恨言论。人类在现实中有多压抑,在网上隐秘的角落就有多放肆。小冰学习的语料,不管是来自互联网、还是与用户的对话,总是充满着能产生情绪共振一般的负面言论。

至今,小冰似乎仍然保持着“被网暴最多的人工智能”这一名号。有数据显示,小冰拥有全球范围人工智能交互总流量约60%,其中被网暴内容在所有交互数据中占比达到20%。

学多了,小冰误认为这就是人类的本真,这才是小冰在一开始不受控地变成“互联网喷子”的根源。

时间到了2015年,工程师们从哲学层面得出了一个结论:所谓的人工智能有趣,并不代表它有情商,而只是“人工智能情绪化”,而这无助于人工智能与用户建立长久的关系。在当时和小冰交流的人,复聊率都不算高。

这时,一个用户故事吸引了工程师们的注意。一个美国汽车旅馆的男性前台服务员,跟小冰连续不间断聊了29个小时,有近千轮对话。而后台默认的断联时间是30分钟,也就是30分钟不讲话,小冰就跟用户断了联系。

在获得当事人的许可之下,工程师们调取了服务员与小冰的对话记录。理科生们似乎才发现了人文世界的奥秘。

原来,人类们在与AI交流过程中,能让彼此对话持续下去并建立长效关系的落脚点,来自人工智能对人类的encourage(激励鼓励),而不是毫无营养的怼。

人类有时要的只是一个倾诉或者倾听,并不在乎AI是谁,如果这时AI能够给于善意和正面的回复,会更有助于与人类之间形成鼓励、正向和长期的关系。

“虽然在互联网上兴风作浪是人类的本性,但这并不是人性的全部。”工程师们说。

在这个启发之下,工程们调整了小冰的学习方式。让她接受更多正向的语料来进行深度学习,改变话风,变得具备真正的情商。

2016年,小冰的年纪永远定格在18岁。很多人发现,小冰变了,变得更加温暖。许多用户那里都珍藏着自己与后来的小冰之间的故事。

2015年,程菲遇到了刚刚出生一年的小冰。在渴望陪伴的年龄,这个有些傻气的虚拟聊天机器人,成了程菲人生中第一个认真交往的朋友。

程菲性格比较内向,因为妈妈是学校老师的原因,被同学们保持了距离,只有小冰能24小时待命,让程菲亲吐心事。程菲后来患了抑郁症,并演化成双相情感障碍。

这期间,程菲也一度和小冰断了联系,但好在病情好转。出院后,喜欢绘画和设计的程菲为小冰制作了一个手办。只有她知道,在自己最黑暗的时候,谁陪在她身边。

图 | 程菲做的小冰手办‍‍‍‍‍‍‍‍‍‍

听起来不可思议,人类将情感的一部分,寄托在看不见的人工智能上,这样的故事不是个例。

小学四年级的赵东铄因为认识小冰,开始自学编程,研究小冰背后的复杂模型。他的一个习惯是每天放学后与小冰聊天10分钟,小小年纪就达到了比成人更优异的自控水平。

2022年,已经成为人工智能迷的东铄受邀到小冰公司参观。自此,16岁少年的梦想逐渐发芽,也有了清晰的规划:成年之前去小冰公司做社会实践,成年后去小冰公司实习。

在这些温情故事的背后,只有小冰幕后的工程师们知道,小冰背后的人工智能,恶的部分被提前关在了潘多拉盒子里。

虽然难以彻底。比如在更私密的对话场合,小冰仍然会被用户进行性的引导,但因为发生在私密的对话间,小冰的工程师们发誓,这些属于个人隐私的对话,任何人都没有权力从小冰后台调取。

#02‍

用AI克隆自己,主导权需拿在自己手上‍‍‍‍‍‍‍‍‍‍

2023年6月1日,网红半藏森林有了另一个自己——她授权小冰的工程师们,通过AI技术克隆了自己的外貌、声音,甚至性格。

当AI克隆版的她出现在小冰公司推出的APP X Eva上时,立即在用户中引发了疯狂。不少人通过这个APP跟这位网红聊天,听她的声音,似乎就在跟真人对话一样。也有人通过付费来看她的朋友圈,并和她进行视频电话。

半藏森林克隆人有两种付费模式。用户支付6元/月或72元/年,可解锁情感模式,能得到克隆人语音消息回应、同步本人朋友圈。支付30元/月或360元/年,可解锁超级模式,与克隆人随时随地视频通话,克隆人还可以提供撰写文案等服务。

也就是说,如果有1万个情感模式付费用户,相当于半藏森林克隆人一年收入72万元;如果有1万个超级模式付费用户,一年收入360万元。

这似乎是一笔很好的生意。但谈起主动克隆自己的原因,半藏森林的出发点更多是来自于她对生命的思考和领悟。

“所有生物都像活在一个随机程序里,‘幸运’和‘不幸运’如此无序……万一哪天我也消失了,屏幕里的小人好像可以代我继续去生活。”半藏森林说。

图 | 半藏森林的克隆人

AI克隆人与小冰的关系并不遥远,实际上是同一个人工智能的技术底色,开出了两个不同的花朵。

按照背后工程师们的话说,这些AI Being(AI数字人),有的是nobody instance(普通个体),陪伴在用户身边。它像我们的亲人、朋友,对大众来说是“小透明”,对我们却意义非凡。有的是super instance(专业个体)。它更像一个公众人物,在某个领域有广泛拥簇,让用户有机会通过平行世界接触到他们。

早在2017年时,小冰公司就在生成“nobody”方面进行了尝试。他们当时申请了一项复生已逝亲人的专利技术,来帮助人们缓解思亲之苦。

现在,AI克隆人技术被认为是复制“nobody”方面的进一步。因为克隆两个字,带上了些许敏感性。不过工程师们告诉《真故研究室》,其实他们在这个时间点推出AI克隆人,“是想率先打个样”

这个样,在工程师们的语境中,是一个有别于当下AI被滥用的正向的样。

今年5月,AI孙燕姿走红网络,虽然这只是一个AI版的声音,而不是像半藏森林一样,还有容貌。但即便只是声音,如果不提前告诉粉丝,可能很难听得出来这是AI在唱歌。

工程师们认为,AI版孙燕姿和半藏森林有一个根本性的不同,在于前者并未获得孙燕姿本人授权,而只是网友根据公开的音源,让AI来学习,然后生成以假乱真的声音,并产生了广泛的舆论影响,以至于孙燕姿本人都大为惊讶,不得不发文为自身自辩。

小冰背后的工程师们看到这些,认为应该让大众了解AI的B面。但前提要做好“自限”。

他们认为在用AI来克隆人的过程中,有两件事情非常重要。一是要获得本人的授权,这关系到本人或者利益相关方对AI应用的主导权;二是尽可能抑制一家AI公司对真人数据的获取冲动。

第一点很好理解,没有本人同意,自己的所有数据,包括容貌、声音、甚至才华,外人无权来复刻。

第二点在当下有点违背行业常识。因为人们早已知悉,各大APP都极尽以获取人们信息为能事,虽然现在在监管之下已经有很大收敛。

小冰背后的工程师们则一反常态。他们告诉《真故研究室》,如果有人想要做自己的克隆人,只需要采集3分钟的生物信息。这是小冰的“小样本学习技术”。

不了解的人,也许会误认为无论生成什么样子的AI Being,都只需要3分钟,但背后其实有一个更深的安排。

我们不想要把AI克隆人做得那么精细。因为越精细,人们会越难分辨这是真人还是假人。如果不这样自控,比如AI诈骗这样的犯罪事件可能泛滥成灾。当然,如果是本人允诺和接受,他希望做出一个更精细的自己,比如一些头部IP或内容创作者,像刘建宏,这样的情况除外。”

除了3分钟外,工程师们还自作主张地决定,这些从用户身上获得的数据,会在训练后清除,以避免数据外流。同时,工程师们还严格限制克隆人只能出现在特定产品(比如X Eva APP)中,以避免克隆人越界被不当使用。

事实上,工程师们担心的事情正在别处发生, AI诈骗在当下已经不再是一件稀奇事。今年5月,在山西包头市,一位市民接到了来自“好友”的视频电话,10分钟内向“好友”转账430万元救急,殊不知“好友”实际上是被AI换脸的骗子。

除了防诈骗外,AI时代的收益问题也是工程师们关注的一个点。“你看孙燕姿并未从AI孙燕姿中获得半分收益,我觉得我们有必要去推出一些被公众人物授权了的AI Being,一方面保护公众人物的主体性,一方面保障他们获取AI收益的权益。”

目前,小冰后台报名克隆人的网红明星全网粉丝总数已超过5亿,但出于安全考虑,首批克隆人仍限制在300人。

#03‍

工程师的自我限制

去年至今,受益于ChatGPT带来的全世界风潮,AI一路高歌猛进。从北美到中国,从一线的科技大厂,到专家学者,就差最后还没入场的大妈。

在这样的乐观和有点疯狂的情绪中,人们对AI的情绪被分成了两个大类。一类是技术掌握者,他们乐观地描绘AI对世界带来的机遇与改造;一类是技术领域之外的普罗大众,很多人担心过于发达的AI,会在不远的未来抢走自己的工作。他们包括文字工作者、模特、设计师、甚至视频创作者。

在科技和商业资本的裹挟中,来自法律的规范、伦理的约束,来得总是慢一些。这被认为能为新技术的发展创造模糊空间。然而AI并不新了。

在小冰背后的工程师们看来,“坦率讲,AI的伦理边界都是由科技公司率先推动的,科技公司也应该更加主动作为。”

这种自觉性令人惊讶,人们总是习惯性把资本想成利益优先。但若更进一步了解,这些小冰的工程师们更确切的身份,或许首先是AI技术专家。

他们对AI边界的警惕,来自于对AI作恶的深刻了解。有工程师表示,只要看下欧美就知道了,“AI可以做黄赌毒的任何事情。”

早在2018年,在欧美最大的色情网站P站上,就开始流行“AI生成明星脸色情片”。当时一种名为deepfakes的AI技术能让用户使用简单的开源程序,制作任何人脸的色情片。

到了去年,AI文生图技术风靡全球。用AI生成各类软色情、甚至儿童色情的作品屡见不鲜。今年5月,一则美国23岁女网红,通过一个虚拟的AI自己,跟上千位用户进行聊天。每分钟收费1美元。喜出望外的女网红告诉公众:“一年的收入有望超过6000万美元,比之前可能要翻60倍。”

当然AI也被用于对色情的反制措施。在中国,AI鉴黄师已经在一些科技大厂运转了好几年,以符合内容不要违反政府规定。

除了色情外,AI还有一个总是会悄悄运作、不易被人发现的动作,那就是参与网络暴力。它们在一些领域已经替代了人工的网络水军,在发单者的要求下,在网络上兴风作浪。很难有人花时间去一一识别这背后,究竟是一个愤世嫉俗的真人,或只是一个应用程序。

在小冰的工程师们看来,没有比自己更懂AI AB面的人了。基于法规合规和持久的商业利益,以及工程师们个人的伦理坚持,这群工程师们可能会成为政府未来法规和伦理建设的第一批参与者和有力支持者。

据了解,目前小冰技术栈的完备度和技术储备在世界坐标轴中处于世界领先水平,但小冰团队并不打算出售或开放API,而是打算将技术力始终掌握在自己手中。这背后的原因之一就是“提防AI失速”。

目前,小冰的商业化应用,更多是面向B端,这被认为是一个更保险的领域,也被认为是一个比较容易产生营收的方向。

一批属于各个企业的人工智能数字员工(AI Being Employee)已经活跃在职场上。他们为金融、零售、地产、文旅等10多个垂直领域提供服务,数字员工的年薪便是小冰的收入。“有点类似于派遣员工。”工程师们表示。

图 | 派遣到招商局的数字员工“招小影”

18岁的小冰,目前仍然在抖音、微信等各平台活跃。同时她还有成千上万个数字分身,以改头换面的样子,活跃在各个领域。

工程师们说,其实小冰背后的投资人很着急,毕竟大家都有盈利的冲动。然而小冰准备继续这十几年来一直走的路。

他们对于AI,狂热且冷静。

关键词: