AI如何通过“终极考验”？让我们回到人类诞生的方式。

人工智能的发展是当前最热门的话题。人工智能如何才能真正理解人类的语言和智慧，成为真正的“智能”？普遍接受的标准“图灵测试”如何在实践中落地？许多专家学者从不同角度进行了研究，发表了不同的观点。在观察者网2026年思想家春晚/问答秀的舞台上，上海财经大学人文系主任王宪华教授试图通过回到人类文明的起源——文字的发明来对人工智能进行逆向工程。他提出了一个名为“Nigiro Challenge”的测试计划。在本次“社交虚拟文字创作测试”中，我们将看看人工智能能否系统地重塑、创新和构建一个可以外包记录文明的文字系统。古代文明研究专家王先华大师的《想象》和楔形文字，可以作为文科角度流行的“科学话题”的参考。王先华：能够参加这样的活动我感到非常荣幸。此前，曾毅教授和范永鹏教授从各自的专业角度谈论了人工智能。用永鹏教授的话说：“作为一个文科生，让我来讨论一下这个话题。” – 我也是一个文科生，一个很老的文科生，而且我的专业很偏。今天我有空参与这个话题。我认为人工智能相关的研究对于文科学生来说相对陌生。然而幸运的是，我自己的研究领域对于我的大多数听众来说相对来说并不陌生。那么，这种双重陌生感是不是显得更加“熟悉”呢？再加上最近的感受，感觉这个世界已经不再是熟悉的时候了，虽然感觉还是同一个世界。因此，今天我冒昧地提出一个“最终决定”。e”人工智能通用智能的测试计划，既是从这种“双重陌生”中的“文化自信”角度，也是从对楔形文字起源的研究方向出发。我把这称为“尼吉罗挑战”。让我们从一点历史开始。对楔形文字和文字起源的研究表明，我们已经发现了几千、几万年前的楔形文字和文字的起源。别以为你了解罗塞斯的真相。其实，我们在历史研究中总是这样。目前，我们只能更清楚地讲到楔形文字的起源，这与文字起源之前的三个现象有关。另一个是在贴纸上绘制的各种表情符号。基本上我们认为这三个现象与文字的起源有关。。淘炒被用来记录交易。先说淘潮。公元前8000年。 C.陶瓷碎片在西亚和近东地区广泛出现。它的主要功能是统计羊的数量和谷物的收成。到了公元前四千年，陶瓷碎片变得更加复杂，有时会有孔洞或划痕。更有趣的是在粘土“信封”的中间放一条陶瓷条。这有点类似于我们目前将钱和东西放入信封的方式。然后用蜡封密封内部，用于记录交易和财产。在淘搜之外，封印是相对相似的技术系统。已经是公元前 7000 年了。 C.西亚居民开始使用印章，将其放置在集装箱封条上，以验证物品的所有权并确保交易的安全。最初，印章图案比较简单，后来变得更加复杂，出现了特定的图像、动物、动物等。奥普莱。同样在公元前四世纪中期，出现了滚轮密封件。此类印章的优点是可以覆盖较大的粘土表面，图案也更加美观。我们认为，这些主要是当时的组织人员（例如寺庙管理员）使用的，用于将泥土密封在容器和门封中。从这个意义上说，它也是权力和信任的象征，就像今天的公章代表某种权威和认可一样。滚筒印章可以覆盖较大的粘土表面，主要用于集装箱密封、门密封等。有时由设施工作人员使用，图案包括风景和简单的设计。包括设计。接下来是数学。这个过程从研究难度上来说比较复杂，只能从后人的角度来看。事实上，文字在理论上从公元前4000年末就出现了。直到公元前 3500 年和公元前 3000 年我们仍然知道早期的书写系统有多个并行的数学计数系统。现在一些学者认为有五种类型，而另一些学者则认为有六种或更多。例如，用一种叫做“S系统”的东西来记录牛和羊的数量。 “粒度系统”ŠE专门用于记录能力。从公元前约3500年到公元前3000多年，人们普遍认为楔形文字是在这一时期出现的，其基础是陶瓷令牌、印章和上述数学系统的发展。您可以看到结果。起初，它是一块纯粹的数字泥板，上面只写有数字符号。后来，人们在数字旁边加上一两个表意文字，就形成了“数字+表意文字”。例如，在数字“5”旁边添加表示“羊”的符号。这意味着有 5 只羊。这类似于超市账单。我们称这个时期为乌鲁克第四时期。与此同时，“标签”也出现在乌鲁克第四阶段。标签上没有数字，但包含符号我们不一定认识的东西，例如谷物或布料。 u 标记产品或名片。乌鲁克第四阶段的标签根据目前的统计，公元前3200-3300年左右，有大约1900种早期楔形文字，包括象形文字和所谓的“矩阵符号”。矩阵符号类似于汉字部首，它们组合成单个符号以提供更多语义信息。尽管我们目前对最早的发音系统基本上一无所知，但我们确实知道当时的符号已经使用了转喻原理。基本上，我们可以得出结论，任何代表植物的符号都可以用来代表“花园”。但是否涉及到音频转换之类的问题？有些问题有明确的答案，而另一些则没有。我们简单回顾了这个过程。我有一个非常重要的话题。学者们认识到，文字的形成和发展，以及它的起源，实际上与日益复杂的文字密切相关。y 社会。公元前四千年末。 C.美索不达米亚南部的社会变得更加复杂，政府和社会控制的压力越来越大。这时，首先需要记录生产、货物、工作等情况，在这个意义上文字就诞生了。虽然人类发明文字的能力并不是在这一时期才出现的，但文字的大规模出现实际上与这一时期人类作为一个群体的发展有关。从计数到意义，从图形符号到与语音系统的整合。今天，回过头来看，从这个意义上说，写作作为人类集体知识结晶的一种方法，正式登上了历史舞台。我们的想象力正是从这个角度开始的。前面我提到，当我们谈论“淘草”时，我们领域的英文表达是“Token”。在现代大规模AI语言模型中，非常重要的一步实际上是标记化（单词标记化/分割）。受此启发，我开始思考这个想法。如果说人类已经完成了从具体计数到抽象符号、从桃潮到楔形文字再到文字发明的跨越，那么人工智能似乎正在通过抽象符号的处理回归到复杂、难以描述、具体的生活世界。人工智能需要理解人类语言，这在某些方面类似于逆向工程。这将语言划分为最小的有意义的单位。这称为标记化。第一次词形还原是在单词级别完成的，这意味着用空格或标点符号分隔单词。然而，这种方法有很多问题。例如，词汇量太大，无法处理不常见或未记录的单词。后来又发展了“字符级”词形还原，其中字符是基本处理单位。这样一来，词汇量就减少了，但缺点是同样明显的是：生成的序列长度太大，使得机器很难恢复语义信息。目前的主流是“子词”标题，比如BPE、WordPieza、SentencePieza，都是基于此发展起来的。它的特点是单词和字母之间的平衡。常见的单词可以保持完整，而罕见的单词可以分为子单元。基于令牌化，这些令牌的处理需要一个强大的模型，即所谓的 Transformer 架构。 Transformer 是一种基于自束缚机制的神经网络架构，专为自然语言处理任务而设计。在 Transformer 之前，通常使用循环神经网络架构来处理单词单元，但这有缺点。在处理长文本时，效率非常低，因为它必须一步步处理每个单词单元，并且无法并行计算。 Transformer 的不同之处在于它可以处理并行放置序列，同时捕获远程单词与单词的交互。这有点像阅读一篇文章时要注意上下文。事实上，我们看书的时候，并不是每一个字都读。我一页一页地读，一点一点地读。从这个意义上说，变形金刚似乎更“人性化”一点。可以同时处理整个文本序列，以更好地理解其语义。这也是决定像GPT这样的大规模语言模型能否产生统一、流畅的文本的关键。但是，事实上，在20世纪90年代，就有哲学家问，“人工智能如果使用语言模型，真的能理解语言并具有智能吗？”今天我们看到人工智能在语言处理方面取得了巨大成功，但哲学家们却提出了“符号基础问题”。即符号系统纯粹的内部运算真的能够赋予符号参考和意义吗？这是一个哲学问题。 AI真的理解语言吗或者它只是告诉了符号之间的关系？例如，当AI生成“苹果”时，它真的知道苹果是可以吃的、有红皮、有味道等吗？还是只知道“苹果”这个词与“水果”或“吃”这两个词相同？是因为他们经常一起出现吗？这是一个统计数据。我认为这是我们对大规模语言模型和人工智能的一个基本问题。这就是为什么现在李飞飞等教授提出，真正的人工智能应该通过“身体交互”来学习，即通过感知和行动与世界交互，从而解决符号基础的问题。同样，我们不仅通过书本上的文字来认识苹果，还通过触摸它们、品尝它们、观察它们来认识苹果。作为一名文科学生，目睹人工智能的这种“混乱”让我需要找到一个标准。什么样的人工智能是我能接受并愿意接受的？接受吗？然后我需要借鉴一些我自己的专业经验。为了确定人工智能（无论是基于大规模语言模型还是基于物理学习）是否真的具有与人类相当的智能水平，我们需要某种测试方案。但不幸的是，经过长时间的搜索，我发现确实没有一个公认的标准来测试人工智能的潜力。例如，配备人工智能程序的机器人是否应该被视为真正的智能代理，作为人类社会的成员？任何稍加留意的人都知道“图灵测试”。这是阿兰·图灵在 1950 年提出的一个著名测试。如果机器在基于文本的自然语言对话中的行为与人类没有区别，以至于测试人员无法区分，那么它可以被认为是智能的吗？然而，报告表明，许多人工智能系统目前正在尝试通过或声称已经通过图灵测试t。看来图灵测试本身就有问题。图灵通过对图灵测试的讨论，一些学者提出图灵测试的问题在于它应该被称为“Gnilt”测试（“Turing”倒着拼写）。因为图灵测试游戏其实就像一面镜子来测试出题者的水平。如果你很漂亮，它就会反映出你的美丽。如果你丑陋，它也会让你变得丑陋。它将反映为如果你问的问题很深入，那么人工智能的反应将会非常好。如果你的问题很愚蠢，那么你得到的答案也会很愚蠢。现在，考虑到图灵测试，特别是考虑到我上面提到的人工智能的“社会性”，我想提出以下内容。真的有一个具有最终意义的测试计划吗？这就是尼吉罗挑战。正如你所看到的，Nigiro 与《盗梦空间》相反，象征着人类智能的逆向探索。可以吗能否找到一种测试，不仅为测试人工智能的通用智能提供了可能的解决方案，而且让我们重新思考人类智能诞生和发展的历史？研究历史的人不可避免地会成为“自恋者”。人类的智力是在社会环境中逐渐发展起来的，文字的发明就是一个很好的例子。那么，具身人工智能能否系统性地重塑、创新、构建一个可以外化到模拟社会环境中记录文明历史的文本系统呢？ Nigiro挑战赛的内容其实很简单。这就是所谓的通用人工智能代理的“虚拟文字创造的社会证明”。想象一下，如果一个人工智能体社会能够在与其他智能体的社交互动中逐步发明自己的语言。如果他们能做到这一点，是否意味着他们拥有（类似人类的）智力？从写作的角度来说，我承认：我个人我相信，如果一群智能机器人发明了自己的书写系统，我们就可以接受这样的智能体将被接受为人类社会的“合格成员”。一个社会能否独立发明文字，或许不是人类文明的唯一标志，但它无疑是人类文明的具体结晶。我们从书写的起源开始，研究陶片、印章和楔形文字，以及自然语言处理中的标记和转换器。最后，我们提出了“Nigiro挑战”的想法。我们已经说过，文字的出现反映了人类智力的发展。事实上，人工智能的发展正在迫使我们回归智能本身的本质。让我来做吧。也许我们所有人都永远不会知道人类意味着什么，但这可能是个好主意。利用这个机会思考什么是智能。从楔形文字起源的历史，我们对此略知一二，逆向工程让你的专业看起来突然有了意想不到的高级用途。我是继续沿着大规模语言模型的道路发展还是通过实体学习的方式发展？这些都不是我的专长，所以我需要继续学习。但尼吉罗挑战至少可以提醒我们在迈向人工智能的过程中回顾人类智能的过去。当人类文明的历史只是智力的进步，当人工智能社会用自己的语言记录着我们无法认知的文明历史时，我们肉身人类真的能退却吗？我希望今天的交流有点有趣。谢谢。此文章为 Observer.com 独家报道。文章内容仅代表作者个人观点，代表平台观点，未经许可不得转载。无法重现无线将会导致法律责任。微信关注观察者网，每天阅读有趣的文章。
特别提示：以上内容（包括图片、视频，如有）由自有媒体平台“网易账号”用户上传发布。本平台仅提供信息存储服务。
注：以上内容（包括图片和视频，如有）由网易号用户上传发布，网易号是一个仅提供信息存储服务的社交媒体平台。

归档

分类

由 admin

发表回复取消回复

您错过了

ASML的下一代EUV光刻设备已准备好量产，据报道耗资约4亿美元。

苹果Xcode 26.3现已上线：AI编程从“给出建议”变成“写代码”

上海房地产市场规模在扩大，但对房地产行业的期望不宜过高。

AI恐慌平息！道琼斯指数上涨逾 300 点，半导体存储板块走强，黄金、白银尾盘暴跌

AI如何通过“终极考验”？让我们回到人类诞生的方式。

由 admin

相关文章

苹果Xcode 26.3现已上线：AI编程从“给出建议”变成“写代码”

AI恐慌平息！道琼斯指数上涨逾 300 点，半导体存储板块走强，黄金、白银尾盘暴跌

大使馆证实中国男子在巴士坠入尼泊尔河后死亡

发表回复 取消回复

您错过了

ASML的下一代EUV光刻设备已准备好量产，据报道耗资约4亿美元。

苹果Xcode 26.3现已上线：AI编程从“给出建议”变成“写代码”

上海房地产市场规模在扩大，但对房地产行业的期望不宜过高。

AI恐慌平息！道琼斯指数上涨逾 300 点，半导体存储板块走强，黄金、白银尾盘暴跌

发表回复取消回复