《西游记》里提到了孙悟空多少次?
2024-2-6 19:42:52 Author: mp.weixin.qq.com(查看原文) 阅读量:0 收藏

    这可能是人类历史上第一次数清楚《西游记》中孙悟空被提到了多少次,我相信即便是《西游记》的作者吴承恩都不知道自己的笔下提到了多少次这个古往今来最著名的猴子。

    在我的上篇文章发布后,半个宇宙官网hikos.cn正式上线,引起了业界极大的关注。目前我们开放邀请测试,许多朋友已经拿到了邀请码。在上篇文章中,我着重分析了当前大模型技术的缺陷,并定义了“AI精度”的概念来衡量它,以及我们原创的PAIC(个人AI计算机)架构给出了达到更高的AI精度的解决方案。在本周,我们正式将第一篇关于PAIC的学术paper投递到了arXiv,感兴趣的读者可以点击“阅读原文”查看(arxiv待发布,先给出GitHub的paper链接)。

    在今天,我们将公布一个新的ACT:数一数,它能自动化的数清楚任意给定文本中的人物数量,包括各种指代关系。从而“数一数”可以有机会真正解答本文标题中提到的问题:《西游记》里到底提到了孙悟空多少次?

    这个问题之所以难,是因为在《西游记》里,孙悟空大多数时候其实不叫“悟空”,而是叫“大圣”、“行者”、“猢狲”、“俺老孙”、“徒儿”、“大师兄”等等别名,这还得包括所有的“你”、“我”、“他”等指代。而当我们真的着手尝试处理这个问题时,发现比我们想象的要复杂得多,比如孙悟空拔下的毫毛幻化出来的悟空,还算不算是他?再比如,孙悟空给自己的旗子上写上了“齐天大圣”,但是玉帝还只封了他个弼马温,那这时候“齐天大圣”算不算是孙悟空?我们发现这些问题,即便是人来处理,也会存在一定的争议。

    但无论如何,我们真的尝试来数了,因为我们的目的,是要给出一种通用的算法,能够有效的分析指定文本内容里的数据结构,从而实现让AI系统可以自动化的精确处理数据。按照我们的想法,这个算法应该能通用的、自动的精确数人,进而推广到一般情况,可以精确的数任何对象、关系,从而实现自动化的structure-mining,这个过程,即我此前文中提到的“数据脱水”。

    这个“数猴子问题”之所以重要,是因为它很具有代表性。而且虽然没有证明,但我猜测“数猴子问题”可能是AI精度领域里的一个“完全问题”,许多具有实用价值的场景所要解决的技术问题,最后都可以归约到这个“数猴子问题”。比如AI写营销文案、AI做PPT、AI做绘本、AI练口语等等。这些AI应用都无一例外的要求对数据有精确的处理,如果大模型连数数都不清楚、不精确,怎么可能实现真正的实用价值呢?这就是为什么当前这些AI应用没有一个好用的原因,它们中没有一个能把“猴子”给数清楚了。

    比如我们想写个人工作总结报告,把写作要求和参考材料喂给大模型后,它开始做内容生成,得到了一篇约2000字的稿子。这时候你觉得引用的案例或者数据不太对,想让它改改,但却发现大模型只会重新生成一遍,或者它想改却又怎么都改不对。因为prompt会丢失很多细节,很难通过prompt再捕捉到。类似的,在做阅读理解的时候也会遇到同样的问题,比如分析论文或者是分析财报,大模型往往会泛泛而谈,而无法按照人类的思路和经验提取出关键的信息,归根结底,就是因为大模型缺乏“数清楚”的能力,AI精度太粗糙,所以人类指挥起AI来如隔靴搔痒,处理数据时很可能会漏掉关键的细节信息。

    为了表达清楚这一问题,我们看看OpenAI的ChatGPT最新版本的表现如何,我们把“数猴子问题”喂给它。为了测试,我们挑了一段《西游记》的原文,其中孙悟空被提到的次数为31次(包含各种指代):

    下面让ChatGPT-4试试:

    可以看到,ChatGPT在很好的prompt的前提下,依旧数错了。由于大模型是基于统计原理在一句句数,自然可能会漏掉。其他大模型我们也都测试过,全部阵亡,在这里就不展示出来了,免得伤了和气。感兴趣的读者可以自行测试。

    下面看看我们kOS的表现,在数一数ACT的加持下,任意文本内容会自动数出人物。目前这是第一个版本,支持数两千字以内、中文的人物和人物关系,以及所有的“你、我、他”这样的代词:

    可以看到,kOS成功的数出了正确答案。而且它返回了一张图,理清楚了人物关系。所以kOS“数一数”的原理和ChatGPT是很不一样的,我们会全自动的生成一张Graph,梳理清楚数据结构,未来所有图计算的能力就都有了用武之地,在推理上会相当灵活和强大。

    在这张graph中,括号里的数字是“数据坐标”,m-n表示第m段的第n句话。在这个测试里kOS把所有文字合并成了一段话。

    这样,我们通过反复调用数一数,就逐步数清楚了在《西游记》中,孙悟空这只猴子到底出现了多少次。由于《西游记》的版本众多,我们挑选了一个最大众化的:人民文学出版社2017年出版的黄肃秋注释版,其版次是“1955年2月北京第1版,2010年10月北京第3版,2017年12月第1次印刷”。最终数完正文的一百个回合后,我们得到的答案是孙悟空一共被提到了:11438 次,包含所有的别名和“你”、“我”、“他”的指代词。这个结果即便不是终极答案,也已经高度近似了。这可能是人类历史上第一次数清楚这只猴子,连作者吴承恩都不知道的答案,下次可以把这个结果烧纸给他祭奠了。

    这样,我们就让kOS具备了比ChatGPT更高的操作数据的AI精度。我们可以用一个函数来表示“AI精度”,假定这个函数用字母P表示,那么ChatGPT表现出来的AI精度可能介于P(1)到P(n)之间。

    P(1)是常数级,可以理解为大模型把大量数据压缩为一个Embedding再输出,如果是常数级,那这就是大模型幻觉的来源了,因为给它大量数据,它只给出了有限的输出。P(n)则意味着给它一个线性的列表,比如["悟空", "行者", "大圣"]它都能依次数出来,但是再带一点复杂关系的就不行了,比如指代词。我认为ChatGPT当前应该是处在P(1)到P(n)之间这个级别了。

    而kOS在AI精度上则达到了P(n^2)甚至是P(n!),这意味着kOS的“数一数”能够挖掘出文本数据里的结构,形成一张图(Graph)以后,在此之上进行推理,从而具备了更高的AI精度。而随着未来这张图建立得越来越准确,推理的“路线”能够在图上从某点出发游走得越来越远,AI精度就会逐渐从P(n^2)提升至P(n!)。这就是以上的实验结果所表达的含义。

    因此,以“数一数”作为基础,在kOS上开发的AI应用会更具备实用价值,未来可以用于严肃的工作场景。目前,这个“数一数”应该是全球独家的能力了。

    最后,欢迎普通用户来体验半个宇宙(hikos.cn),拥抱AI时代;欢迎开发者们来kOS上开发代码,帮助我们完善;欢迎投资人用钱砸晕我们,想想我们这样的公司十年、二十年后会值多少钱;欢迎媒体朋友们多来吹吹我们,支持AI的中国方案,因为外国的方案也没好到哪里去。


文章来源: https://mp.weixin.qq.com/s?__biz=MjM5NzA4ODc0MQ==&mid=2648629104&idx=1&sn=2b93de4a1a209980485c1675b7a679ae&chksm=bef523fa8982aaece5e1869ca2ee9411247e18c4c809b31edabf13a6d1480f1dd8d3e1d07b3b&scene=58&subscene=0#rd
如有侵权请联系:admin#unsafe.sh