胡益清、胡欣悦:ChatGPT 作为语言基础设施

哈喽大家好我是站长,美区火箭apple ID 土耳其apple ID 其他apple ID 账号资源,可加微信:yuke36 咨询 公众号:云创磊哥Ai

ChatGPT4.0的发布掀起了人工智能的热潮,其特性、功能、影响和效果受到热议。ChatGPT自1.0版本以来,已经有了成熟可行的编码方法,不断生成和完善自身语料库的能力,让ChatGPT的角色彻底发生了改变,它不再仅仅是一个玩具般的数字对象,相反,它已经成为了数字化的语言基础设施。语言基础设施的广泛使用,有两个可预见的结果:一是人类将生活在标准化语言的注视之下,二是基础设施媒介将从后台走向前台。这意味着,人类自我意识的危机再次来临。

ChatGPT(聊天生成式预训练Ttransformer)最近引起了全球关注,不仅频频登上热搜,还在几乎所有职业和阶层引发了震动。很多人认为,这项由一群不满谷歌技术霸权和技术垄断的年轻人开发的技术,将改变互联网和人工智能的未来。作为美国公司OpenAI推出的应用,它被视为“生成式预训练聊天机器人”(俞国明,2023)、“通用任务助手”(张宏忠等,2023)、“最新的新知识媒介”(周宝华,2023)、“数字大模型”或“语言大模型”,拥有比元宇宙更多的生活应用场景。如果仅此而已,ChatGPT不能说是一个划时代的人工智能媒介。 其实,ChatGPT 最重要的特点恰恰是其 1.0 版本中被人们调侃所体现出的潜力:它擅长处理非常长的句子和段落,这不同于以往所有依赖模板的写作机器人,因为它以自己的方式生成人类语言。正是这种不需要模型设定就能自动生成语言的能力,让 ChatGPT 自然而然地与所有人工智能技术区分开来。

语言曾是人类的专属财产,几乎是人类的代名词,它与人类的共生关系是所有技术中最彻底的。卡西尔把人类称为“符号动物”(卡西尔,1985:34),海德格尔也曾断言“没有语言的地方,什么都不存在”(海德格尔,2004:152)。这些观点都明确地用语言来指认人的本质特征:“语言是最接近人性的,语言随处可见,所以当一个人用心去观察存在的事物时,立刻就会遇到语言,并根据语言所展示的东西的决定性方面来定义语言,这是毫不奇怪的”(海德格尔,2004:1)。即便是海德格尔这样的先知(虽然他准确地预言了哲学之后将进入控制论时代),也没有预料到语言会因机器的发展而外化、物化。 数字化语言让这个世界出现了一种比人类语用更标准化的“语言”,人们把它作为自己语法是否标准的重要参考。这是一场真正的语言革命。就像通信因为电报的发明不再完全依赖于交通基础设施一样,语言也将因为ChatGPT而不再完全依赖于人脑,它可以由机器生成,从而真正成为一种“数字化对象”。

01

1.语言的物化:它如何可能?

ChatGPT之所以能够生成语言,和21世纪二进制数字世界的全面展开有着密不可分的关系。计算机的数字系统与数学常见的数字系统——十进制完全不同。如果说在十进制中,数字是用来解释对象的,那么在二进制中,数字是用来表示对象的:“0和1不再被理解为事物的代理,而是成为系统的本质。在系统内部,事物显现出来。0和1其实已经不再是数字,而是代表着系统本身,代表着不存在与存在”(Buckhardt,2008:35)。 这必然导致这样的后果:“二元化意味着数字技术与人之间主要的关系不再是一种解释关系,技术以一种透明而霸道的方式嵌入、介导于人的生活,从而构成技术与人的背景关系和具身关系。数字技术迫使人不断采取行动去改造和创造社会现实,而不是被人用来理解头顶的星空和脚下的大地”(陈宇峰、胡逸清,2022)。

二进制之所以能表示对象,和它无限的编码能力有关。语言,特别是基于字母的语言,特别容易和二进制编码联系起来。不仅如此,由字母生成的表音字符的编码方式,几乎和二进制编码方式是同样的逻辑。因此,ChatGPT从1.0版本开始,就有了成熟可行的编码方式。每一个英文字母对应一个五位二进制代码,然后进一步分配词性、成分、多义性、应用领域等,最后分配词语之间的相关程度,从而形成了从词语间关系的概率角度生成语言的能力。这些都说明,由字母生成的表音字符,由于基于同样的编码逻辑,更容易和二进制世界联系起来。如果是汉字,那么这个二进制赋值过程就会变得异常复杂,因为汉字的编码逻辑相对具体,比表音字符复杂得多。

在《字母表效应》一书中,洛根有一段颇具争议的说法:“字母表具有重大影响,促进了西方抽象、逻辑和系统思维。这可以用来解释为什么科学兴起于西方而不是东方”(Logan,2012:5)。以十进制数学和字母表为基础的自然科学产生了拼音文字,这在逻辑上确实是自洽的。但是,自然科学的兴起确实不是字母表的结果。相反,从历史的角度看,自然科学的兴起在很大程度上重塑了西方国家的语言。不过,洛根的思考并非一文不值,因为正如他所说,“拼音字母表的神奇之处在于,它不仅是一种书写系统,而且是一种组织信息的系统”(Logan,2012:1)。换言之,拼音文字是一种书写系统,字母表是组织这种书写系统的方式。 在洛根看来,这种语言的组织方式与数字的组织方式相关,“位置数字符号与书写系统始终是紧密相关的”(Logan,2012:114)。洛根试图从元素、集合、重复性和顺序性四个方面来解释,字母表其实是一个26进制的数字系统,是一个用于表音语言的化学元素周期表。洛根看到的问题非常重要,因为它表明表音文字是一种与数字世界高度一致的可编程的书写系统。然而,洛根的视野仍然局限于他作为物理学教授的知识背景。他没有看到的是,字母表与二进制的关系比十进制更密切,因为二进制更接近于字母表的排列组合,因此表音文字很容易就变成了一组二进制的数字对象。

古典语言学教科书以双层性、位移性、生产力和递归性等四个特点来区分人类语言与动物语言(Yule,2010:11-15)。与动物相比,人可以不断嵌套和补充自己想要表达的意义,从而随时随地都能不断表达自己、解释自己的想法。这既与双层的结构特征有关,也与位移性、生产力和递归性等生成性特征有关。正如乔治·尤尔(George Yule)所说,人类语言的这种反身性与动物语言有显著的不同(Yule,2010:11)。这也意味着人类语言有自己的独特性。自从文字出现以来,语言的外化和对象化过程就开始了。但无论是文字还是印刷,都无法模拟无限的生产力和无限的递归。相反,语言一旦通过书写或印刷进行转化,其新鲜感就消失了,语言变成了静态的语用学,交流成为一种推测。ChatGPT 并非如此。 它以自己的方式复刻了人类语言的无限生产力和递归性,因此,它仅依靠词语之间出现的概率,就能与不同的人就各种话题进行人机对话,因此,ChatGPT作为数字对象,不再是静态的,而是动态的、可操作的。

02

语言的基础设施:从代码到参与者

当然,单纯地将语言变成具有动作的数字对象并不足以解释为何ChatGPT会让人感到如此的威胁。事实上,对语言进行编码和物化的工作一直在进行中。本杰明对机械复制可能带来的后果的分析,是对学术史上机械复制技术带来的语言和文本大规模物化的深刻反思。语言机器的发明也早已开始,自冷战以来,将语言机械化的努力就一直持续,例如情报行业对翻译机器的创造和使用。如今,翻译软件的开发和使用已经达到了相当成熟的阶段。计算机的发明使得人机交互成为可能,因此追求完美的聊天机器人成为计算机科学的重要发展方向。多年来,已经推出了几个民用聊天机器人(ChatBot),包括苹果推出的智能语音助手Siri,它是一个可以连接到用户手机程序并为其提供聊天服务的程序。这些技术早已将语言变成了数字对象,但ChatGPT不仅仅是一个应用的数字对象。

除了拥有一套复杂的编码技术使其能够生成长段语言之外,ChatGPT 的成长始终与其对语料库中海量语用能力的学习能力息息相关。它的 1.0 版本从 BooksCorpus 数据集(一个涵盖 7000 部网络小说的数据库)中学会了造句和写作,2.0 版本则开发出了可以获取优质网页文本的网络爬虫工具。到了 3.5 版本,Transformer 架构的大语言模型(Large Language Model)开始成熟,使其具备了开放地理解文本内容和进行深度学习的能力(凌霄雄等,2023)。按照这样的发展速度,最迟到 2026 年,ChatGPT 将耗尽人类所有最重要的优质英语语料,届时其英语写作能力将超过大多数人,成为人类英语语用能力的新标准。

图片[1]-胡益清、胡欣悦:ChatGPT 作为语言基础设施-网络副业创业项目大全资源整合

面对海量的英文语料库,ChatGPT 利用人类反馈的强化学习不断提升语言能力。这种学习技术具体表现为三个步骤:预设初始语料、训练偏好数据模型、自动比对微调(张宏忠等,2023)。总体来说,ChatGPT 的整体特点可以分为三个方面:

首先,从对话模式来看,其按照“用户提问——关键词识别——数据库筛选——匹配概率——生成答案”的基本机制运作。其次,从对话内容来看,通过概率计算,其语言生成机制接近人类自然语言系统,试图摆脱刻板的机器式回答,尝试将人脑回路接入系统,从而像平常朋友之间的交流一样与用户建立对话。第三,从技术框架来看,其具备二次学习的能力,不仅可以通过用户不断细化问题、提供更多关键词来辅助搜索更多相关内容,还可以将平台上的所有内容转化为新的学习内容,丰富自身的数据库。

不断生成和完善自身语料库的能力让 ChatGPT 的角色彻底发生了改变,它不再只是一个玩具般的数字对象,相反,它本身已经成为了一个数字“世界”,或者用最流行的媒体术语“媒体基础设施”来套用,可以称之为“语言基础设施”。

基础设施是指广泛共享、不可或缺的、能够长期为经济生产和居民生活提供服务的“社会技术”系统,如交通、水利、通讯等。它们的共同特点是可靠性、广泛共享性和不可感知性。在《奇异的云:媒介即存在》一书中,彼得斯提出了“基础设施媒介”(他也称之为“物流媒介”)的概念,以分析媒介如何成为像铁路一样的基础设施。对于彼得斯来说,将基础设施从工程领域迁移到媒介研究的目的是将其作为一个重要的隐喻,探讨媒介如何构成社会运行和人类存在的前提。 为此,彼得斯对这一概念给出了一个相当清晰的定义:“如何理解媒介对我们的影响?基础设施主义提供的一个视角,就是把它看作是后勤性质的。我把具有基础作用的媒介称为‘后勤媒介’。这类媒介的功能,就是对各种基本条件和基本单位进行梳理。如前所述,记录媒介压缩时间,传输媒介压缩空间,它们都具有杠杆作用,而后勤媒介在它们的基础上更进一步,具有组织和校对方向的功能,它能把人和物放到网络上,能协调关系、发号施令,把人整合起来,把万物连接起来。”(Peters,2020:42-43)不仅如此,彼得斯还将基础设施分为软基础设施和硬基础设施,于是他提出“网站(通信)协议是像水坝和高速公路一样的基础设施”(Peters,2020:37)。从这个角度看,我们不仅可以把互联网看作基础设施媒介,还可以看作软基础设施和硬基础设施的集合。 比如,数以万计的机台、计算机硬件系统可以看作互联网的硬基础设施,而平台操作系统、后端数据库等可以看作互联网的软基础设施。

互联网在成为基础设施的同时,逐渐展现出远远超出传统基础设施的作用能力。通过将其触角延伸至现有的交通和金融基础设施,它正在深刻重塑各个传统领域的运行规则和逻辑。互联网基础设施绝不仅仅是物质工程意义上的技术体系,它将默默地服务于用户的生活方式和存在方式,颠覆和建构他们的精神世界和社会生活秩序。而且,这种技术体系通常以背景的方式存在,因此我们可能很难感知到它。这一切都与基础设施在日常生活中发挥的作用非常相似。“‘让人们忘记它的存在’可能是所有基础设施的关键特征”(Peters,2020:42)。

随着人工智能互联网的兴起,视频识别软件、算法软件等人工智能软件在平台上被广泛应用,将各类应用软件、网络社区和个人用户结合在一起,形成独特的时空和权力秩序。以互联网平台领头羊谷歌为例,它从搜索引擎服务起家,逐渐扩展到音视频、电子邮件、地图导航、聊天、输入法、阅读软件等,所有应用都在谷歌个人账号下互联互通,实现“一号在手,生活无忧”。用户日常生活之所以高度依赖谷歌,是因为它能提供全方位、多场景的服务,一旦离开谷歌,用户可能就会觉得自己完全无法适应这个世界的生活。从某种意义上说,谷歌之所以可以被视为一种媒体基础设施,是因为它是一个庞大的应用软件数据库,可以默默提供各种互联网服务。

与谷歌不同的是,ChatGPT 以另一种方式嵌入到了用户的生活当中,而这也正是 ChatGPT 的优势所在。与传统搜索引擎不同的是,ChatGPT 不仅为用户解答问题,其 AIGC(AI 生成内容)功能致力于为用户提供更多符合日常工作和学习场景的服务,比如翻译、答疑、文章撰写、稿件润色、邮件撰写、分析预测等。同时,ChatGPT 站在前人技术的基础上,正在以极快的速度兼容手机和 PC 的操作界面:有用户成功将 ChatGPT 与苹果语音助手 Siri 进行对接,并表示 Siri 变得更聪明了;而与各种 Windows 操作界面的对接,使得 ChatGPT 极有可能成为整个微软操作系统的语言背景。语言基础设施与人类社会的嵌入程度,远远超过元宇宙或位置媒介等基础设施。人类社会离不开语言、文字和交流。 当更加成熟和庞大的GPT5.0、6.0降临人世,正如电力系统普及到人们日常生活的方方面面,作为语言基础设施的ChatGPT也将紧随其后,成为人类社会沟通的语言背景。

从搜索引擎、算法到社交媒体机器人、ChatGPT,互联网技术展现出越来越强大的作用力。如果说媒介生态学只能依靠媒介的偏见来解释媒介对社会的影响,那么今天,媒介作为非人类的行为体,已经具有足够强大的作用力来重构用户的主体性。一百多年前,马克思说:“自动机在资本家那里获得了意识和意志”(马克思,1975:442),他想以此来解释大机器技术如何从资本的逻辑中获得力量,成为行动的主体。今天,ChatGPT作为语言基础设施,正通过服务于用户的语言需求,成为重塑社会秩序的行为体。如果说过去传播学是从结构功能静态的视角来审视媒介与社会的关系,那么今天我们或许需要用行为体的动态视角来审视媒介与社会的关系。因此,笔者倾向于将大众传播研究的时代称为“媒介静态”时代,将当下的传播学研究称为“媒介动态”时代。

03

语言基础设施是什么意思?

也许现在讨论ChatGPT对人类意味着什么还为时过早,因为虽然大家都在密切关注,但距离被广泛应用还需要一段时间。乐观的学者会把眼光超越现在,放眼未来,重点探索ChatGPT在不同行业场景下的技术助力,而消极的学者则主要质疑ChatGPT引发的版权和伦理问题。但问题的关键并不在这里,问题的关键在于语言的基础设施让人们感觉到ChatGPT对人类的未来构成了威胁。这种威胁来自于人们无法适应自身生存方式的不确定变化,也来自于人们对其他类型行为体限制自由意志的担忧。因为,如果连语言都是基础设施,那么还有什么不能被客体化、外化呢?比如,未来是否会出现基于情感的基础设施媒介?到那时,人类的本质特征是什么?

我认为,语言基础设施的广泛使用有两个可以预见的结果:第一,人类将生活在标准化语言的注视之下;第二,基础设施媒介将从幕后走向前台。

一方面,作为语言基础设施,ChatGPT将作为语用学的绝对标准而存在。对于英语世界来说,未来我们很难再看到比ChatGPT更标准的语法和更优美的语用。因此,即便什么都不发生,人们也一定会把ChatGPT的语用学作为自己语用学的标准。人们的语法生成不再是任意的,而是在语言基础设施注视下的语法生成。标准化一直是媒介史发展的重要方向。文字所建立的标准化,让苏格拉底等学者为口语所孕育的创造力在文字时代正在消亡而感到悲哀;印刷所建立的标准化,让人们意识到文字的世界依然具有艺术魅力;打字机所建立的标准化,终于让人们意识到印刷时代人依然是创造的主体,打字机的出现只能让“文字替人说话”。这一切在ChatGPT面前,不过是“小巫师遇到大巫师”。 与以往所有技术不同的是,ChatGPT 不是“媒体即消息”意义上的潜在标准化,而是一种显性标准化。标准语言包围并主宰着我们,这种语言标准化必然预示着知识和社会生活的进一步标准化。在 ChatGPT 之前,已经有很多 AI 语音助手面世,比如“小度”,它采用类人合成语音,试图通过类人声音增加拟人化的真实性。它们带有明显的机器痕迹,因为它们只能和人做简单的问答,触及知识盲区时会生硬地回复不知道,或者让用户再问。不过,当用户使用 ChatGPT4.0 时,这种情况很少出现。当 GPT 无法回答问题时,它会“顺口”地给出模棱两可的中性答案,学者们称之为“褶皱式答案”(张胜,2023)。 这是 ChatGPT 作为语言基础设施最重要的能力之一:从对话的根本逻辑出发,并不是简单地模拟人说话的声音,而是模拟人大脑世界思考问题的内在逻辑顺序。但问题是,这种回答依然不带有任何真正的人类情感。如果未来我们以这种语言作为自己说话、写作的标准,人类的情感将越来越淡漠,很有可能人类的情感必然走向“人工智能”。机器越来越像人,人类也越来越像机器,这种“双向奔波”或许并不是人类所希望看到的。

图片[2]-胡益清、胡欣悦:ChatGPT 作为语言基础设施-网络副业创业项目大全资源整合

基特勒关注的是媒介技术变革带来的人类铭刻体系的深刻变化,而这种铭刻体系的改变带来了历史性的断裂,因此他用“话语网络”一词来描述铭刻体系的变化。他认为,话语网络1800与话语网络1900是相互割裂的,“后者是随着19世纪下半叶新的模拟媒介技术的出现而来的”(Winthrop-Young,2019:41)。后者的到来要求一切书写都要符合模拟技术的标准。ChatGPT带来的“话语网络2000”必将是铭刻体系的又一次重大的历史性断裂。这场由二进制世界发起的数字革命,将机械化书写转变为数字化书写。

另一方面,ChatGPT将逐渐从人机交互的背景走向人们社交的前台,重塑基础媒体与人的关系。自麦克卢汉以来,媒体作为一种背景受到高度重视,他的“媒介即是信息”和“媒体是人的延伸”是这一观点的重要代表。麦克卢汉没有谈内容,因此忽视了媒体的中介性。因此,与所有看到媒体中介性的学者不同,麦克卢汉和媒体生态学的代表学者看到了媒体的背景性:“媒体环境的概念是把媒体看作是一种环绕的或弥漫的物质,它不是在两点之间画一条直线把两者连接起来,而是用一个圆圈把两点围起来,就像鱼在水中游动,人生活在空中一样”(Strate,2008)。用这个观点来解释基础媒体是非常有说服力的,因为后者是社会秩序的安排者,往往是人类存在的背景。 基础设施媒介支撑着我们的社会互动,但我们却对其视而不见。这就是基础设施媒介的体现。这种体现主要来自于界面的吸引力或者界面的不显眼性。前者可以用影院效应来解释,后者则与界面本身的设计有关:“基础设施结构虽然庞大,但它的界面可以很小。这些小界面,如水龙头、加油泵、电源插座、电脑终端、手机或机场安检设施,都扮演着‘门’的角色,通向更大、更隐蔽的系统”(Peters,2020:36)。这种体现也可以被视为理所当然,或者被自然地忽略。但无论如何,先前的基础设施并没有威胁到人们的主体性。

然而,ChatGPT或许注定不会是这么低调的基础设施媒介,它不仅默默地服务于人们的社交,还在工作和学习的世界里扮演着高调而引人注目的角色。随着其技术性能的不断提升,它不仅可以生成内容帮助人们交流,还可以以人机对话的形式与人交流,甚至可以成为交流的话题。如此一来,媒介基础设施将不再只是存在于后台,而是中介与后台的统一,它不仅会将人们“沉浸”其中,还会在人与世界的几乎每一个连接点上扮演中间人的角色,人的主体性也将因此面临前所未有的挑战。当人类的一切“本质”都可以以概率的方式被中介时,基础设施媒介的力量将不仅体现在物质层面,更将直接体现在人的精神层面。如果机械化的存在会以它们独特的方式展现人的存在,那么作为存在者的人类又能以何种独特的方式展现存在呢?

马克思早在多年前就预言了人在机器面前的悲惨命运:“在机器上,生产资料的运动和活动就脱离了工人。生产资料本身就成为一种工业永动机,如果它们的助手——人没有受到某些自然的限制,即肉体的弱点和人的意志的制约,它们就会永不停息地生产下去。”(马克思,1975:442)在先进技术面前,人是资本逻辑最想取代的对象。人工智能是资本逻辑在当代的重要体现。这是我们无法回避的现实。

从功能角度看,以ChatGPT为代表的AI技术固然给我们带来了诸多便利,但我们也应该反思:在存在论层面,语言基础设施的存在对于人类的存在意味着什么?失去了语言(或拥有外在客体化的语言)的人,还能把语言作为自己存在的特征吗?恩斯特·卡西尔曾宣称,自我意识是哲学研究的最高目标。他认为,符号思维和符号活动是人类最具代表性的特征,而富含符号和语言的情感,绝非“人类是理性动物”可以描述和表现的。卡西尔认为,他以“人类是符号动物”解决了人类自我意识的危机。然而,ChatGPT和语言基础设施的出现,其实意味着人类自我意识的危机又来了。

(胡一清、胡欣悦:《ChatGPT作为语言基础设施》,2023年第6期,节选自微信发布系列,学术引用请务必参阅原文)

这个问题

本期刊唯一投稿邮箱为xwjz@sumg.com.cn

图片[3]-胡益清、胡欣悦:ChatGPT 作为语言基础设施-网络副业创业项目大全资源整合

在这里,你可以了解中国新闻业的转型

在这里,我们讨论新闻业的未来

在此,深刻而严肃的思考

这里,关心记者自己的命运!

帮助

哈喽大家好我是站长,美区火箭apple ID 土耳其apple ID 其他apple ID 账号资源,可加微信:yuke36 咨询 可扫码下方关注公众号获取账号教程资源

© 版权声明
THE END
喜欢就支持一下吧
点赞6 分享
评论 抢沙发
头像
欢迎您留下宝贵的见解!
提交
头像

昵称

取消
昵称表情代码图片

    暂无评论内容