ChatGPT知识生产框架、技术迷思与未来演进

哈喽大家好我是站长,美区火箭apple ID 土耳其apple ID 其他apple ID 账号资源,可加微信:yuke36 咨询 公众号:云创磊哥Ai

关键点

ChatGPT是当下最热门的人工智能技术之一,给知识生产、连接和传播带来了革命性的影响,实现了知识生产的全数据化、知识连接的全场景化、知识传播的中心化。ChatGPT的快速发展也让人们再次面对了诸多人性化难题和技术迷思:从机器代替人到机器“迷惑”人、对事物解释的不合理性、人类遭遇忒修斯陷阱等。本文认为,应扩大数据可用性,增加用户规模;增强ChatGPT的感知能力,从阅读文本到看世界;探索法律规制路径,引导人工智能健康发展。

关键词

ChatGPT;生成人工智能;智能通信;知识生产;技术风险

2022年底ChatGPT发布后,比尔盖茨坦言:“在我的一生中,我见过两项令我震惊的革命性技术。第一是1980年的图形用户界面,是包括Windows在内的所有现代操作系统的前身;第二是OpenAI开发的ChatGPT。”ChatGPT可以在几秒钟内创建文本内容响应,因此受到各界的广泛关注。从专业生成内容(PGC),到用户生成内容(UGC),再到人工智能生成内容(AIGC),它展示了内容创作方式的变革和进步。随着ChatGPT的更新和迭代,生成人工智能(Generative AI)可能会颠覆大多数行业和领域的生产方式,并影响社会、经济、环境和文化发展。 本文将分析ChatGPT对知识生产、连接和传播的创新影响,阐述ChatGPT如何突破传统知识生产链、构建新的知识生成范式,进而从“人—机”的视角审视ChatGPT带来的风险与迷思,并从数据应用、技术更新和法律规制三个层面探索ChatGPT的未来方向。

1.ChatGPT知识框架:

全数据、全场景、复杂

1.知识生产模式:全面数据化

有学者指出,大数据时代的科学知识生产呈现出三个重要变化:第一,研究对象由过去的少量数据变为海量数据,研究人员只有访问和分析大规模数据集,才能获得更全面的分析依据;第二,科学研究的目标由追求数据间的因果关系变为关注数据间的相关性,关注数据的关联和趋势性;第三,科学发现的性质由过去的绝对精确性变为相对模糊性,这意味着研究结果涉及更多的概率和不确定性,需要更加谨慎地理解和解释。以上三个变化为当前的科学知识生产范式提供了分析框架。ChatGPT在这种基于数据的知识生产基本范式的基础上,增加了“网络-机器-用户”的个体知识生成要素,呈现出数据驱动的逻辑。

一方面,ChatGPT基于Transformer架构和大规模语言建模预训练,学习语言统计规律和语义关系,综合考虑对话历史和上下文信息,根据用户输入的上下文生成回复文本,再通过个性化的微调方法调解知识整合和输出功能,在海量数据和个性化用户之间提供“提问-反馈-参考”闭环,大大提高知识供给效率。微软代码库GitHub在2022年9月的一份分析报告中称,开发者使用其AI Copilot工具帮助其编写代码,将所用时间缩短了55%。

另一方面,人类“一阶知识”和“二阶知识”的形成过程包括符号理解、联想、推理、加工和组织,而ChatGPT产生的“三阶知识”是基于信息论“概率”的自然语言处理,是人工智能通过控制论反馈机制训练的结果,是一种更多基于数据的信息,或者说是一种比信息稍微系统化一些的、由整理、加工后的信息构成的“知识初级形态”。也就是说,这种通过数据梳理逻辑生成的信息根据场景为用户筛选、整合知识,其“消化”和“发散”过程与人类的经验知识生成逻辑有着本质区别。人类通过自身的经验、学习和思考来生成知识,知识生成过程依赖于主体的认知和心理活动,通过理性思考从经验中抽象出普遍的规律和原理,并基于这些原理进行推理和判断,注重因果关系和逻辑一致性。 人工智能与人类智能对于知识生产中概念具体化、符号化、抽象化的过程有着不同的解释机制。ChatGPT的知识生产过程是自动化的有限程序计算逻辑,以大数据和知识源头为依托,以模型和系统为输出标准,呈现出以数据为源头、以数据为操作、以数据为传播的数据化知识生产的综合形态。

2.知识连接模型:全生态场景

2023年5月,随着ChatGPT联网和插件功能的推出,ChatGPT-Plus用户将可以使用超过70个第三方网络服务插件。插件是为现有软件应用程序提供附加功能的软件组件或扩展,通过提供额外的工具、功能或集成来完善主软件的功能和特性。用户使用这些插件通过ChatGPT在特定网站上执行任务。例如,Video Insights ChatGPT Plugin插件可以为用户提供各种视频平台(如YouTube或Daily Motion)的信息价值理解和呈现功能。用户只需输入某个视频的URL,ChatGPT就会提取该视频的文字记录、元数据和其他相关细节。用户不必观看整个视频就能了解其主要内容和其他信息。1977年,汉娜和弗里曼提出了“组织的种群生态学”,指出单一技术的发展离不开技术生态系统,共生状态是技术发展的常态。 显然,继“微软生态”、“华为智能生态”、“苹果生态”等之后,ChatGPT也将构建自己的技术生态,以语言知识处理为连接基础,实现多场景技术融合,实现技术与社会的实时协同演进。

首先,作为核心技术,ChatGPT 提供基于自然语言处理的对话交互能力,通过网络化功能连接互联网上的资源,获取实时信息、数据和内容,为用户提供更加全面丰富的知识和功能;其次,ChatGPT 的网络化发展,与其他在线服务和资源建立相互依赖关系,与搜索引擎、知识库、社交媒体平台等进行信息获取和传播。这种媒介间的相互依赖促进了知识的共享和交流,提升了用户体验的整体性。此外,开放的 API(应用程序编程接口)允许开发者利用 ChatGPT 的能力构建更加复杂的应用程序和服务。这种技术合作与创新进一步促进了技术生态系统的发展,促使各方基于 ChatGPT 进行更深入的研究和创新。

“一项技术的发展必然需要相关技术与环境的协调匹配,从而刺激和推动支撑技术的产生发展和环境的变化,突破性技术尤其如此。”对于ChatGPT来说,实时网络化的全场景知识连接体系,使其与社会知识全景更加紧密地连接在一起。媒介依赖理论认为,人们对媒介的使用与基本信息需求的满足密切相关。ChatGPT的网络功能提供了与互联网和在线资源的连接,使用户能够依赖该功能获取知识和信息。通过提供全场景知识连接服务,ChatGPT可以满足用户在各个领域的信息需求,在信息获取和传播中发挥重要作用。截至2023年5月25日,ChatGPT已在阿尔巴尼亚、克罗地亚、法国、德国、爱尔兰、牙买加、新西兰、尼加拉瓜、尼日利亚、韩国、英国、美国等12个国家的iOS系统上线应用。OpenAI还承诺很快将推出一款安卓应用。 不难想象,随着ChatGPT在各国的铺开,多场景适用性的突破将会更加迅速。

3.知识传播模式:中心化

詹姆斯·凯里认为,“传播是将技术与理念融为一体的符号形式在人类关系中自然展现的过程……成为人类行为(包括活动、过程、实践)的结构、表达的总和以及结构化和正在结构化的社会关系的集合。”传播不仅是人类行为的自我解释,也是人际关系、人机关系、人与自然关系的展现。随着科技的不断进步,技术在传播中的作用越来越重要,各种智能技术在人类传播系统中的进步不断带来传播模式的变革。

智能传播不断向数字化、算法化、碎片化、多样化演进。基于数字逻辑的技术导致传播的信息基数不断扩大,技术媒介所蕴含和涌现的数据量导致传播过程中信息生成、筛选、整合、连接所需的工作量不断增加。数据巨大的增值容量与人类信息处理能力之间存在差距。一些技术可以帮助人类检索和筛选数据,以可视化呈现简化信息缩减的过程。但在信息生成数据的过程中,具有决策意义的审核、清洗和深化仍然需要人的介入和主导,人的角色在智能传播中仍然不可或缺。ChatGPT为传播模式带来了进一步的革新。 在技​​术处理和人工审核两个步骤之间,增加了“数据-信息-数据-信息……”的“无限集中的知识生成”环节,通过用户的反复询问和确认,识别和理解用户指令,包括问题的澄清、补充信息的提供、答案的确认或修正,并将零散的数据以准人工的方式筛选和呈现。生成的结果可以反复滚动成更多的背景数据,从而生成更全面的响应。研究表明,大脑中电信号的速度是硅片中信号速度的十万分之一。对于ChatGPT来说,基于数据和计算能力进行一百次思考所需的时间甚至比人类进行一次深度搜索和整合所需的时间还要短。在中心化的知识传播体系中,人的价值体现在人与机器的互动中。人与技术都是“双价值循环”和“多价值循环”中的节点,媒体生态系统的整体价值随着主体之间的互动而不断提升。

图片[1]-ChatGPT知识生产框架、技术迷思与未来演进-网络副业创业项目大全资源整合

2. 从“人与机器”的角度看ChatGPT神话

随着人工智能的更新迭代,人与机器的关系愈发暧昧而紧张,ChatGPT的知识生产、传播能力和全场景生态的逐渐扩大,迫使人们再次直面人类处境的困境。“埃吕尔的技术理念表明,技术不仅仅是工具和机器的集合,更是一个塑造我们价值观、信仰和行为的复杂社会文化系统,并具有不断扩展和自主化的趋势。”在人工智能技术快速扩张的当下,以ChatGPT为代表的生成式人工智能的潜在风险需要反思。

1. 从机器代替人到机器“迷惑”人

在未来的知识生产范式中,类似ChatGPT这样的自动化生产模型会扮演非常重要的角色,导致人们面临人与机器关系的两个问题。

首先,机器作为行动者,成为人类知识传播体系乃至文明构建的重要组成部分,替代了部分体力劳动。机器利用计算逻辑理解人类逻辑,实现机器主动介入人类生活,与人类取得表面的“相似性”,实现“机器替代”。 “纵观人类科学史、思想史的发展,可以看到一个从分析到综合,再从简单综合到更大综合的发展过程。不断综合发展,从综合到更大综合,是21世纪人类科技发展的持续趋势。”在不断提高知识综合性的同时,也在对越来越庞大复杂的知识进行多次总结和简化,实现“体积简化-知识扩展-体积简化”的循环。未来人类的知识库只会呈指数级扩大,知识体系构建和传播过程的集成化和简化化离不开自动化计算、演绎和生成技术的帮助。 我们可以认为,“机器替代”并不是技术对人类劳动力的逐步替代,而是在人类知识体系构建过程中辅助人类进步,并与数据扩展同步,使人类不至于在数据的海洋中不知所措。

第二是机器算法适应人类传播活动的问题。算法本身所依赖的计算思维背景是网络信息的良莠不齐,数据吞吐的过程是接近信息真实性的过程,也可能是虚假信息合法化的过程,导致虚假新闻的广泛传播。王天恩认为,“信息既不是物质也不是能量,而是一种接受关系;信息具有创造性、涌现性和互惠性等基本特征。”在人与技术相互感知的过程中,信息是在描述或传达感受、体验、意义或关系的过程中产生的,是一种符号体系或表象,技术与人类双向传递体验、思想和情感。此时,人类对信息的获取和理解依赖于技术的数据库背景,ChatGPT 响应中的错误、偏颇或误导性信息将被中心化响应机制中用户与机器之间信息传递过程的接受要素所掩盖。

2. 对事物解释的不合理性

随着对技术工具性认识的不断深入,技术不仅仅被看作是一种工具或外在实体,而被认为已经渗透到人类的日常生活中,反向塑造了人们的认知方式和视野,成为一种非生命的物质“他者”。用户使用ChatGPT获取知识的同时,虽然难以理解其中复杂的算法,但不断训练算法生成响应的过程,也是人类对自身进行整体性认识的过程。从早期的符号逻辑到现代的神经网络和深度学习,“技术(技术制品)是一种手段,通过技术(技术制品),我们可以从以前未曾体验过、无法感知的‘世界’到达我们现在所处的领域”。无论是信息内容还是信息结构,都是以技术的设计和理念呈现给人类的,信息传播过程则以事物的逻辑进行解读。智能技术通过感知、理解、推理和学习,从丰富的数据和信息中提取并分析关键节点和关联,生成有意义的知识和洞察。 这种对世界的解读过程,以大规模数据和强大的计算能力为基础,通过算法和模型的计算处理,将复杂的现实世界转化为可理解、可操作的形式。这样,文化体系就不仅仅是纯粹人脑活动的结晶,技术作为信息传播的参与者,正在成为解读文明、构建文明的重要一环。同时,未来人类与算法将共存,智能物体将在解读现在和未来世界的权力中占据非常重要的地位。

然而,ChatGPT对现实世界的解释——其理解世界的能力——的合理性却受到质疑。有学者指出,“ChatGPT与世界隔绝,被困在符号的海洋中,对它来说,输入输出的信息只是简单的一串符号,它所处理的信息只是表面的信息。”一方面,ChatGPT用于知识生成的AI语言系统与技术本身相连,即技术本身是可识别的、内在通用的,但另一方面,这种AI语言并非在理解世界、在“在世”的实践中演化而来,而只是在对符号的理解基础上理解人类、贴近人类的取向和需求。正如艺术家Nick Cave在评价ChatGPT模仿他的歌词时所说,“它没有内在的存在,它没有去过任何地方,它什么也没有忍受,它没有超越自身局限的勇气,因此它没有能力分享超越的体验,因为它没有超越的局限。” 不接触客观世界,就不可能真正全面地认识世界,这时ChatGPT对事物解释的片面性、不连续性、扭曲性就凸显出来,势必影响人类对世界的认识和实践。

3. 人类忒修斯悖论

传统纸质阅读文本通常在语言表达上具有很强的逻辑性和抽象性,在句子排列上具有很强的稳定性和顺序性,这可以在作者和读者之间制造一定的距离。通过相对独立的阅读活动,读者可以形成理性的思考和批判意识,最终形成理性的“自律的自我”。而线上阅读文本则不同,读者不再独立阅读,在快速的线上阅读中容易丧失独立思考能力,批判理性逐渐消失,分散、碎片化的“情感的自我”将取代理性的“自律的自我”。ChatGPT全场景生态建设遵循数据时代“消除一切距离”的逻辑,作为一种新兴的智能媒介,正在不断增强与人类的融合,从文字沟通到生活助手,全方位拉近技术与人的距离。缩短人类知识生产过程中人与背景知识的距离,用机器逻辑打造人与海量数据之间的信息简化通道,必然会使人与数据的连接更加紧密、便捷。 人类与人工智能的“浪漫关系”不再只存在于科幻电影中,“虚拟沟通定义是融合人、物、实践的沟通者”。数据合理性的背后,其实是对智能技术过度依赖的非理性,人们自身的仪式感、独立性受到冲击。

忒修斯之船,又称忒修斯悖论,是指古罗马帝国时期哲学家普鲁塔克著作中的一个思想实验。当人们不断将忒修斯之船上的旧木板换成新木板,直到船上所有的木头都不再是原来的木头时,这艘船还是原来的那艘船吗?也就是说,一个物体的所有部件被替换之后,它本质上还是同一个物体吗?随着ChatGPT的发展和完善,人与科技的数字化互动将逐渐改变人们的工作、出行、交流、娱乐方式。内容体验、生活体验、情感体验齐头并进,甚至知识的学习、生成、传播也离不开“技术器官”的辅助。这时候,人还是人本身吗?数字人/赛博人/智能人与原来的“人”具有概念上的统一性吗?这是ChatGPT冲击带给我们的又一个迷思。 这时,人们需要与技术保持一定的距离,防止自己陷入“忒修斯悖论”,以在数据逻辑中保留人类思维、情感、行动的独特性。

3.展望未来:

ChatGPT 的演变

作为新一代生成式人工智能技术,ChatGPT 能做的事情远不止现在展现给我们的这些。2023 年 6 月 15 日,奔驰表示部分豪华车型或将搭载 ChatGPT,以增强车内语音助手功能。未来,ChatGPT 不仅会建立自己的技术生态,还会融入其他领域,为生产、工作、生活提供更丰富的辅助功能。这也意味着 ChatGPT 必须不断自我创新,接受更完整、更严谨的外部审查,在技术创新与风险防范之间寻求平衡。

1. 扩大数据可用性并增加用户群

有学者指出,ChatGPT最重要的里程碑是将AI从特定的专用领域带入了通用市场,在历史上开辟了通用人工智能(AGI)的新道路。对“通用”概念的解读有两种方式,一种是自上而下的学术定义,当人工智能的计算能力达到一定阈值时,就被称为通用人工智能。但ChatGPT的“通用”属性,是基于自下而上的用户群定义,许多国家的用户使用ChatGPT为生活的各个方面提供参考和量化,使得ChatGPT成为通用人工智能。AIGC模型的可用性和通用性取决于其所掌控的数据库的大小。对于ChatGPT来说,要增强技术洞察力和准确性,需要从不同来源收集大量数据,包括书籍、文章、网站、博客、推文和互联网上的其他文本。OpenAI尚未透露ChatGPT数据集​​的具体大小,很可能有数百GB。 大量高度多样化的数据是生成式人工智能的核心驱动力,数据的可获得性和信息供给的连续性是数据可用性的关键组成部分,无法获得的数据等于没有数据或数据不准确,因此保持和优化技术的高可用性,畅通无阻地获取和整合多源数据对ChatGPT尤为重要。

图片[2]-ChatGPT知识生产框架、技术迷思与未来演进-网络副业创业项目大全资源整合

实现多源数据融合,关键在于数据的标准化、匹配与连接、特征选择与提取、数据聚集与合并等,从而实现多种数据源的融合,形成一致、完整、有用的数据集。由此,数据质量、内容冲突与一致性校验、数据安全与隐私保护等课题成为亟待解决的问题。在现有技术的描述中,隐私保护与数据挖掘是一个串行的操作序列,这直接导致带有隐私保护的数据难以进入挖掘分析。如何调整数据的隐私保护强度与数据流的关系成为当前需要解决的难题。未来生成人工智能的创新发展必然以网络主体间的协同流动为基础,资源互补与知识流动是协同网络构建的关键方向。 在可追溯、易修正、易评审的要求下,维护各方数据流的异构性(安全、隐私、自治),构建多网络主体数据协同流动的一致行动框架(可访问、可识别、可融合),推动生成人工智能对海量网络数据的合理可用尤为重要。

2.增强ChatGPT的感知能力,从读文字到看世界

人类认识和理解世界、塑造知识体系的认知过程一方面依赖于直觉实践和观察活动,另一方面则来自于大脑的认知想象和模拟能力。通过大脑对感知、动作和情感体验的模拟演绎,可以超越个体当下的经验和现实,启发式地联想出对世界的多层次、多方面的理解。正因如此,人类和动物的学习能力,以及对世界的系统和理解,远远超出了当前人工智能和机器学习(ML)系统的能力。当前的机器学习系统严重依赖大量的数据样本和实验,缺乏想象力和推理能力。对于目前的ChatGPT来说,主要接受大型语言模型等文本训练。基于数据的语言——人类在网络中留下的所有文本表达历史,成为ChatGPT理解世界的主要来源,也形成了ChatGPT与现实世界之间的屏障。 纽约大学教授 Yann LeCun 认为,新一代人工智能革命的关键在于学习“世界模型”的能力。世界模型不仅可以在神经层面模仿人脑,还可以在认知模块上完全贴合人脑分区,并在大型语言模型的基础上增加对世界的表征、预测和规划能力。学习范式和架构的设计应该让机器能够以无监督(或自监督)的方式学习世界模型,并利用这些模型进行预测、推理和规划,从而模拟人类和动物基于想象的认知过程。在这个过程中,ChatGPT 首先要具备“感知世界”的能力,而不仅仅是“阅读历史”。

近年来,智能感知设备和人工智能技术的快速发展为ChatGPT提供了获得情感感知、内容感知和情境感知的机会,使得实现“人-机-世界”的技术双向感知成为可能。利用智能感知技术和多模态数据融合系统,拓展ChatGPT的机器学习背景,在文本学习的基础上加入多种形式的信息,增强智能技术对世界的阅读能力。例如,吸收认知神经科学的研究成果并搭载相关研究技术,通过眼动仪、脑电图设备、生理多通道设备等从人脑的结构、功能和活动中分析出可用于训练ChatGPT的认知模式,学习人脑如何思考和理解“世界模型”。目前,以ChatGPT为代表的大语言模型的涌现能力受到广泛关注,即当模型规模(主要是基于文本的任务)达到一定阈值时,对某些问题的处理性能呈现指数级增长。 在加强了Chatgpt的多维感知之后,它不仅可以在预设主题范围内显示出绩效的提高,而且还可以在培训一个主题的过程中了解并展示多个其他主题的处理策略,从而使“出现”更具启发性,跳跃和关联机器本身,从而从世界上看到世界的美观人工智能,从而从世界上造成世界知识,然后才能解释信息,然后才能诠释信息,然后才能诠释信息。

(iii)探索指导AI健康发展的法律监管途径

随着Chatgpt和其他强大的生成AI工具的发布,全球政府已开始采取行动来规范此类AI技术。欧盟人工智能法(AI法案2021/0106)进入了最终的谈判阶段。 2020年,中央网络空间委员会发布了“国家新一代人工智能标准制度的建设准则”,在2021年,国家新一代人工智能治理委员会发布了“新一代人工智能伦理法规”,以计划制定和使用人工智能,以宣布法规,以及针对法规的发展。可以有效地调节和指导生成AI(例如Chatgpt)的健康发展。

作者认为,可以从三个维度调节生成人工智能的法律法规策略:信息内容,传播过程和传播方案:首先,敏感内容的呈现和敏感数据的处理,尽管生成的人工智能(例如,诸如聊天者)与内容过滤相关的信息促进了一些敏感性和指标。 CHATGPT使用包括用户敏感的数据进行模型培训,三星电子人员将机密的代码泄漏到人工智能法规中,应建立清晰的保障措施。将增加传播虚假信息的风险。 Chatgpt的全赛季传播模式意味着其在人类生活中的应用无限可能性,但是这种生成的AI在某些情况下的应用可能会导致负面影响。

四、结论

CHATGPT带来了新的知识检索,分类和演示模式,大大简化了知识获取,吸收和传播的过程,并成为具有颠覆性的新一代智能媒体。关于文化研究和传统信息传播理论的生成逻辑,技术幻想的问题以及人类机器的传播和人类机器的传播。 。 With the continuous updating of the form and elements of intelligent space, seriously reflecting on the relationship between man and machine will help people regulate their own innovative practices within the scope of safety, health, and sustainable development. Artificial intelligence is not a scourge. Only by establishing a tolerant and positive research and growth environment for artificial intelligence and daring to break through the self-limitation of human perspective can we truly maintain human initiative and subjectivity in the process of rapid technological development. ■

【关于作者】

Cheng Sifan是上海金融与经济学大学人文学院的博士生。

(这是一个删节的版本,省略了参考文献,原始文本发表在《当代沟通》中,第6期,2023年)

结尾

主管:新疆每日

主持人:新疆记者协会新疆日报

出版商:当代传播杂志

执行编辑:他陶

编辑总监:马Xuan

哈喽大家好我是站长,美区火箭apple ID 土耳其apple ID 其他apple ID 账号资源,可加微信:yuke36 咨询 可扫码下方关注公众号获取账号教程资源

© 版权声明
THE END
喜欢就支持一下吧
点赞15 分享
评论 抢沙发
头像
欢迎您留下宝贵的见解!
提交
头像

昵称

取消
昵称表情代码图片

    暂无评论内容