《更新书堂》·第378 篇
内容来源| 本文摘自中国人民大学出版社书籍
(相关资料图)
《ChatGPT:读懂AI爆发背后的技术和产业逻辑》
项立刚 刘欣 项天舒 著
责编| 初心
第7633 篇深度好文:5324 字 | 14 分钟阅读
2023年3月堪称人类科技史的重要里程碑,以ChatGPT及GPT-4为代表的诸多人工智能产品的发布震惊了全世界,世人惊叹于人工智能时代正在加速到来,或兴奋或恐惧的情绪也随之在全球蔓延。
舆论场中各种各样的声音不断刺激着人们敏感的神经:兴奋者说ChatGPT的横空出世拉开了第四次工业革命的序幕,人类将由碳基生命进化为硅基生命,借力AI将诞生无数“超级个体+一个人的商业帝国”,如几年前的“互联网+”一样,社会将步入由“AI+”引领的深度数字时代;
恐惧者说全球范围内的失业狂潮将不可避免,智能机器人势必在不远的将来取代人类统治地球,在强大的AI面前人类不堪一击,并且还借用《黑客帝国》《终结者》《机械公敌》《流浪地球》等著名科幻影片的经典桥段来表达对AI发展的恐惧和担忧,仿佛世界末日近在眼前!
不同的情绪也引发了人们的种种困惑:ChatGPT的出现到底意味着什么?ChatGPT将给我们的工作和生活带来哪些冲击?
人类会被机器取代吗?社会会被ChatGPT重塑吗?机器人会不会自我进化?AI会不会发展出自己的人格?如何看待AI技术的发展?……
对于新生事物,过度吹捧和质疑都是不科学的。
《ChatGPT:读懂AI爆发背后的技术和产业逻辑》一书就很好地解答了上述诸多困惑。
这是一本兼具专业水准和深刻洞见的诚意之作,作者是中国通信业著名观察家项立刚领衔团队,三位作者不仅理性审视了ChatGPT的前世、今生和未来,更以冷静的笔触和通俗的表达,为读者厘清专业基本概念,层层揭开ChatGPT的神秘面纱。
一、为什么火出圈的人工智能产品是聊天机器人
过去,我们记忆中的聊天机器人都是点状思维的,你问什么,它就回答什么,经常前言不搭后语。而ChatGPT结合上下文的连续对话功能,让我们体验到了和真人互动的流畅性。
ChatGPT 以轻松有趣的AI聊天形态出现,最大限度地降低了使用门槛,能够在最短时间内获得海量用户。同时,ChatGPT拥有良好的多语言能力,得以在全球范围内快速推广。
一切都来得太快了,仿佛一夜之间,我们就进入了一个新的人工智能时代,所以人们惊呼:“我们即将因AI而失业,人类即将被AI 颠覆。”特别是在ChatGPT被频繁应用的领域——程序员、媒体人、文案和翻译们陷入焦虑,这种焦虑正在更大范围里蔓延。
ChatGPT这样的聊天机器人,让用户最直接地感受具备大模型处理能力的人工智能可能的表现,这种冲击的意义是深远的,显然在人工智能的发展历程中,它已经迈上了一个新的台阶,这的确是人工智能服务人类的历程中跨出的一大步。
仅凭ChatGPT这一款应用很难改变世界,但是人工智能技术一定会改变世界,ChatGPT让我们看到了人工智能蕴藏着巨大的发展潜力。
二、发展ChatGPT无法回避的四个难题
1.通用引擎的局限
在专门的引擎中,系统是封闭的,相关信息是隔绝的,不会形成信息之间的冲突;而在通用的引擎中,冲突的信息共存在一个系统中,而又很难做到对用户有所判断。
在这种情况下,要做到生成的内容基本准确就是一个无法回避的巨大且极有难度的问题。而且,在通用引擎不断学习的过程中,并没有一个信息库作为准确的蓝本,不断被输入的语料,让学习不断发生,系统不断被训练,大量错误的信息又将成为语料的组成部分。
在这种情况下,诸多干扰信息的存在就影响了信息的完整性和准确性。
用一个通用方案来解决所有问题,这看起来很美好,但是要把问题解决到符合商用标准,达到在某一领域非常精准的水平,以我们今天的硬件支持和算力支撑条件来看,还有一定的差距。
到目前为止,ChatGPT还很难变成真正意义上的商用产品,大家在惊叹于它写的一些似是而非的内容已经很有“人”味儿的同时,也会发现实际上它真正能应用于自己的工作和生活中的场景并不多,而且它对于中文的支持远不如英文。
2.标注的困窘
事实上,ChatGPT的内容生成质量不仅需要技术人员去建立模型、优化算法、构建智能训练的系统,同时它还需要大量的外包人员去手动完成数据标注。
长期来看,ChatGPT 能否把质量做到足以解决大部分问题,让社会大众普遍接受,在普遍意义上真正帮助用户解决问题,标注的质量可以说是最大的掣肘,因为这不仅是一个技术问题,更是一个精细化运营的过程。
面对五花八门的敏感信息所采用的标准将决定ChatGPT 的态度,它生成的内容将会影响很多用户的判断和理解。
这一标准的制定,标注人员的选择,标注质量的检查,检查标准的制定等,这些都是复杂的系统性工作,而这些工作在很大程度上决定了ChatGPT的内容生成质量。
信息标注是一项极其重要的工作,依靠雇用贫穷国家的那些拿着超低工资的社会底层人员来完成,而这些标注者有着极大的文化差异和语言水平差异。
对于中文语境,更是存在数据残缺和可供参与训练的内容不足的弊端,如此境况下所做的标注和评分都不够准确,这些问题也是ChatGPT想要做好中文内容存在极高难度的原因之一。
3.无解的安全问题
ChatGPT要做到理解更加全面,它不可能就相同的问题为所有的用户提供一个共同的答案,而是应该根据用户的提问,对用户进行长期跟踪,并对用户的立场、态度、世界观、年龄、性别、职业、学历等做出判断,然后根据这些要素生成符合用户特点的信息。
然而,这就需要收集更多的用户数据,再结合用户的使用习惯和偏好,增进对用户的了解。
事实证明,以上提到的这些数据确实可以帮助ChatGPT更深入地理解用户,生成更高质量的内容。
但是,收集用户数据,尤其是用户的使用习惯,不可避免地会收集用户的个人信息、兴趣爱好、价值取向,乃至个人隐私等方面的一手信息。
这些信息是对一个人增进了解的重要工具,也是窥探用户信息和用户隐私的重要工具,对这些数据的收集行为不可能绕开监管部门的强力审查。
而且,在ChatGPT 的系统中,用户进行提问,ChatGPT予以回答,但答案是唯一的,这就意味着用户完全丧失了主导权,ChatGPT给出的内容是什么用户只能被动地接受,用户完全失去了选择或判断的可能性。
安全层面还有一个很大的问题,那就是版权,尤其是进一步发展,对于图片内容进行处理,被人工智能处理之后的原图版权,某些人物肖像被人工智能处理后生成新的图像,很可能产生肖像权纠纷。
大规模普及甚至滥用ChatGPT一定会导致信任危机。
对每个主权国家的政府而言,当ChatGPT大量生成内容信息输出的时候,存在一个重要问题——这些内容很多涉及历史、文化、道德、思想,涉及一个社会的基本价值观,如果大量青少年使用,势必会影响下一代的教育和价值判断。而且它提供给用户的信息是唯一的,没有参照,无法选择,存在一定程度上的灌输意义。
这相当于将社会道德、思想、价值判断的定义权交给了一家商业公司, 而这家公司是由工程师写出规范,由国外低收入群体进行标注,这对于任何一个国家而言,都是不能容忍,也是不可能等闲视之的。
2023年5月,纽约一名执业30年的律师为了帮代理人打赢一场过了诉讼时效的官司,用ChatGPT搜集对自己有利的判例并向法庭提交了相关文书,结果其中的6个案例的判决结果、引语等都是假的。
涉事律师称,他询问过ChatGPT案例的真实性,ChatGPT再三确定这些案例是真实的,且在“可信的法律数据库”中可以查找到。轻信ChatGPT“一本正经的胡说八道”让他感到非常后悔,涉事律师和其所在律所也因此被处以5000美元的罚款。
这起事件不仅仅对法律界有着重要的警示作用,也应该引起各行各业的重视。始终保持对人工智能的审慎态度,将其作为辅助工具而不是绝对的决策依据,才能避免因依赖人工智能而导致的风险和问题,能够明智地为社会和业务带来长期的益处。
4.如何参与社会实践
今天我们看到的人工智能所有能力的形成,无外乎一种模式:建立模型,通过大量信息进行标注,一次次排序、打分,生成内容,对内容进行分析、打分,再进行训练,最后渐渐让内容达到比较符合人类思维的水平。
人工智能目前还是在人类的辅助下,通过算法、模型、人工标注来提升能力,由于人工智能面对的是大量的、不断更新的知识,如果要形成自我学习的能力,就需要其亲自参与社会实践,在社会实践中去理解逻辑,形成思维能力,对社会实践的过程进行归纳、总结、演绎、推理,从而形成真正的智力。
目前来看,谈人工智能达到这一步还为时过早,对ChatGPT这样一个聊天机器人而言,它的功能还是较为单一的,还是要依赖人类的算法、模型和标注,我们现在没有必要为人工智能的自我学习能力、自我意识而焦虑。
人工智能包含算法、数据、算力三大核心要素,面对信息时代近乎无限的内容,如何收集和筛选数据是人工智能要迈过的第一道坎,也是人工智能想要融入社会实践必须解决的难题。
互联网上有太多低质量甚至无效的有害信息,如果一直把这些垃圾当成养料投喂给大模型,其生成的内容质量必然大打折扣。
在社会实践方面,华为盘古大模型就为大模型如何改造社会生产力提供了一个很好的观察样本。2023年7月18日,山东能源集团、华为、云鼎科技在济南联手发布全球首个商用于能源行业的AI大模型——盘古矿山大模型。
作为AI大模型在能源领域的全球首次商用,山东能源、云鼎科技、华为在前期试点验证AI大模型赋能工业生产领域的基础上,正在开发和实施首批场景应用,涵盖采煤、掘进、主运、辅运、提升、安监、防冲、洗选、焦化9个专业21个场景应用,切实做到了降本增效,并且还在持续地加以改进和探索。
相比之下,把大模型的能力应用于聊天机器人,被各路网友以各种奇葩问答“调戏”,ChatGPT更像是一个新奇的玩具而非改造生产力的工具了。
三、用系统思维看待人工智能的产业应用前景
人工智能由信息采集、信息存储、信息传输、算法、大模型、信息加工等诸多环节组成,并在此基础上形成决策机制,所有环节都不能脱离大系统而独立发展,更不可能因为某个环节发展得好就超越了大系统,它只能是大系统的一部分,带动整个大系统的发展。
不要简单地把人工智能仅仅视为一项研究、一套算法或一个模型,它必然是一个庞大系统,要用系统的眼光去看待人工智能的发展和应用。
看一个国家的人工智能发展水平如何,只能看这个大系统的整体发展情况,因为人工智能最终是要为社会服务的,人工智能需要在每一个环节都形成匹配,设想利用单点突破而一举攻克整个系统的难点,显然是不切实际的。
人工智能要成为一种有价值的能力,就不可能单独存在,需要和众多的传统能力结合起来提高效率。
人工智能一定要介入社会生活的诸多领域,对社会管理、社会运营、生活服务、交通运输、生产制造产生革命性影响,让这些领域的效率更高、能力更强、成本更低,让很多以往不可能实现的能力因为人工智能的助力而得以实现。
人工智能要成为一个良好的服务系统,必须走软硬件一体化的道路,需要软硬件同步发展,除了传统的电脑和智能手机,未来人工智能一定会用在智能汽车、无人船、无人机、智能电网、智慧工厂、智慧医疗等众多的领域,很多传统行业面临着自身的改造,需要主动适应人工智能的要求,成为智能体系的一部分。
而这些领域要完成改造,需要一个漫长的接受过程,需要时间,也需要探索。今天全球的人工智能发展还刚刚开始,还远远没完善到可以影响人类生存的程度。
对于人工智能的发展,人类大可不必如此焦虑。今天,对于从基础建设做起,提升算力,加大存储中心的建设,加强智算能力, 建立更多把人工智能和传统领域结合起来的接口,智能互联网还有一段漫长的道路。
从基础设施到算力、数据,再到应用能力,远远没有强大到需要焦虑的程度。人类不需要抵制人工智能,而应该拥抱人工智能,抓住人工智能发展的机会,让人类文明达到新的高度。
除了以上核心观点外,本书还立足于互联网发展阶段和信息传播演化的历史经纬,着眼于中美两大科技强国的人工智能和通信产业的发展纵横,用极富创新性的观察视角大胆畅想并系统性地阐述了AI的产业应用前景、前沿趋势与挑战。
拥抱、跟踪一切技术突破,不断完善自己的能力,这才是技术发展的开放心态。
这本书既不侧重于技术讲解,也不构成投资建议,更多的是帮助读者了解技术创新给社会带来的冲击变化和潜在机遇,让人们面对新生事物不再雾里看花、人云亦云。
四、结语
看多了科幻大片,我们总会把“改变世界”想象成一个突如其来的伟大创举,但事实上,人类世界正以肉眼可见的速度实现着数据化,恰恰是成千上万人聚合后的数据张力,让人工智能有可能站上最关键的位置,成为联结虚拟与现实的核心入口。
在理解自然和社会的基础上,构建技术应用场景,推动产业进步的人类实践,最终推动着文明的进程。作为技术革命的人工智能,也不会是瞬间绽放在夜空的绚烂烟火,而是一次次脚踏实地、攀向高峰的前进步伐。
AI爆发已经引发了剑指下一代互联网主导权的“军备竞赛”,事态的走向和变化都有待我们持续地关注和观察,也希望能和各界的读者朋友们一起见证历史和人类文明的未来!
*文章为作者独立观点,不代表笔记侠立场。
9月16日,笔记侠“AI新视野,增长新势能”第二届新商业智能大会,将在杭州宝盛水博园大酒店举办。
众多行业大咖、一线企业、初创公司在这里聚集,分享彼此对AI的认知和经验,帮你发现AI带来的增长势能,看到未来,融入未来,成为未来!
余票不多,先到先得。
关键词: