【文研讲座297】胡明辉：人工智能时代的人文学科研究

2023年5月30日上午，“北大文研讲座”第297期在北京大学静园二院208会议室举行，主题为“人工智能时代的人文学科研究”。加州大学圣克鲁斯分校历史系副教授胡明辉主讲，北京大学历史学系副研究馆员史睿主持，中国人民大学国学院副教授华建光、北京大学外国语学院长聘副教授苏祺、北京大学中文系助理教授李林芳、北京大学历史学系助理教授吴靖远、北京大学《儒藏》编纂与研究中心副研究员沙志利、中国人民大学哲学院副教授张雪松、中国社会科学院哲学所副研究馆员胡士颍与谈。本次讲座为“数字人文与社会”系列讲座之一。

讲座伊始，胡明辉老师由科幻作品谈起，分析了科幻作品所反映出的人类面对人工智能的两种情绪。一方面，从《我，机器人》中人工智能自我意识觉醒后反击人类，到《机器人系列》里人类被困在由人工智能制造出的虚拟空间中，这类情节设计均传递出了部分人对迅速发展的人工智能的担忧与恐惧。另一方面，也有人将人工智能视作人类发展的希望，将影响大国博弈、推进科学研究。

▴

电影《我，机器人》（2004）剧照

情绪之外，也有学者对人工智能，尤其是新近出现的ChatGPT进行了严肃的反思。历史学家尤瓦尔·赫拉利（Yuval Noah Harari）警告，ChatGPT可能改变公共叙事，进而产生许多道德问题。语言学家诺姆·乔姆斯基（Noam Chomsky）指出，ChatGPT生成语言依赖于计算，与人类的思维方式并不相同，故不可能取代人类语言；此外，ChatGPT不具备分辨真伪的能力，若有人有意地向其输入错误信息，后者也将不加分辨地习得。政治学家大卫·帕纳吉亚（Davide Panagia）则与福柯的政治学理论进行对话，认为在人工智能时代，人的行为不再限于被监控，更是在被一个无处不在的程序不断地塑造与改变。

▴

ChatGPT图标

接下来，胡老师介绍了三个人文学科与人工智能，尤其是ChatGPT合作的实例。其一，加州大学为师生提供了免费的超级计算资源（super computer）,而人文学者碍于语言模型技术的困难和海量数据的难以取得，对此运用仍很不足。ChatGPT能够帮助人文学者克服上述两大困难。进一步的，不同于以往数据库只能支持关键词检索及在此基础之上的机械统计，ChatGPT能够在理解语义的基础上发现所有类似含义的语汇，进而更好地挖掘数字化史料的价值。其二，ChatGPT可以构建起虚拟的历史时空，并根据输入参数的不同，输出各式各样的模拟状况。这一功能既可用于历史教学使其更加生动，也可用于考古研究与史迹重现。其三，ChatGPT可以改变历史学习的模式。学生自身可以通过控制参数，在ChatGPT中模拟出各式各样的故事，并从中挑选出一个自己认为最符合历史真实的版本。

与谈环节

与谈环节，吴靖远老师首先发言。吴老师认为，在人文研究中使用ChatGPT存在四个风险。首先，ChatGPT不辨真伪，甚至会根据人的需要“伪造”史料，倘若与超级计算资源相连，其产生的错误量则更是不可预测。其次，ChatGPT可以生产研究问题，但对于人文学者而言，倘若没有自己感兴趣的问题，要在人工智能辅助下发现问题，恐怕不是一种理想的状态。再次，利用ChatGPT模拟历史场景，可能使得历史学习变成一种虚拟空间学习。最后，ChatGPT可能让学习者和资料彻底脱节。胡明辉老师作出了回应，针对ChatGPT不辨真伪的问题，胡老师认为应该发挥研究者的主体性，在不断地与ChatGPT互动、纠偏中提高其准确度；此外，ChatGPT只是帮助研究者搜寻材料的工具，不必然导致研究者与资料的脱节，研究者需要教会ChatGPT自己的思考模式，以提高其搜寻材料的效率与准确度。

李林芳老师指出，ChatGPT有其内在运作逻辑，在生成答案的过程中可能存在某种倾向性，进而造成人类认识的系统性偏差。此外，目前尚不存在区分由人写出的文章和ChatGPT生成文本的有效办法。倘若学生利用ChatGPT完成作业，作业的原创性将有所损失、不及预期，这为传统的教学方法带来了挑战。胡明辉老师则认为，即便学生在完成作业的过程中使用了ChatGPT，也能达到训练的效果，因为这要求学生有很好的提问能力、对ChatGPT给出的答案有较高的鉴别能力，并愿意投入时间完善之。此外，在新的技术背景下，传统的教学方法的确存在改变的空间。胡老师以自己的学习经验为例，指出自己过去学到的文献方法，主要是查字典、查索引，而今天的学生则更多地借用数据库等网络资源，查字典也便不再是必备技能。史睿老师也指出，一些创新性的想法是在组合的过程中产生的，如果可以比较快地完成组合工作、得到一个比较正确的有效数据集，当然会提升研究效率。不过，要保证数据集的正确性，必须通过反复训练、提升人工智能的模式识别能力。史睿老师相信，人工智能的引入将推高人文研究的基础，让学者围绕最具原创性的关节点发力，而不单纯满足于资料整理和排比的工作。

张雪松老师将ChatGPT比作一个高度服从的秘书团队。张老师认为，ChatGPT作为一个新出现的技术，势必有优点亦有局限；而其中最值得警惕的一个局限，则是它可能加剧学术霸权主义。它促使研究者问题意识趋同，所有研究者都关注所谓的热点，而只要数据库足够大、数据足够多，无论研究者持什么观点，总能找到支持观点的知识，组成一篇文章。这样的文章看似合理，实际缺乏学术价值。当然，依托ChatGPT的人文研究最终有可能像人类学研究那样，不同的人类学家即便在同一个田野点进行田野调查，也能看到截然不同的内容；但在短期内，它更大概率强化文科内部的学术霸权，摧毁学者的原创性。史睿老师补充道，因为ChatGPT按照众数进行归纳总结、形成答案，而数量上一定是低水平研究更多；ChatGPT不辨真伪，更不懂得区分高下，因此它归纳出来的结果大概率水平不高，可能对后来的研究者造成低水平干扰。

华建光老师首先谈到了ChatGPT可能对原有的学术评价体系带来的冲击。ChatGPT的出现，可能导致着力于实证研究、材料功底深厚的人文学者优势的丧失。老一辈学者完成一本年谱需要花费大量的时间与精力，而倘若清代的资料全部数字化，人工智能也能够将关联性最紧密的数据按照重要性排列、并学习了年谱的一般范式，人工智能势必能在很短的时间内完成年谱的写作。在这种情况下，年谱这类作品是否还能算学术成果，便成了可以进一步讨论的问题。华老师也指出，ChatGPT这一强大技术工具，可能使得一些宏大的人文问题再度进入研究者的视野。考据与阐释是人文学科中最核心的两种素养——考据的核心是发掘史料、关联结构化语义；阐释的核心是发掘文本之外的别的含义。比较而言，考据类研究更容易被人工智能取代，而通过文本间、思想间的关联挖掘出文本的言外之意，可能是人工智能时代更加宝贵的能力。

▴

中国历代人物传记资料库（China Biographical Database）

哈佛大学费正清中心、台湾中研院史语所与北大中古史研究中心合作建立

苏祺老师主要从技术的角度，分享了数字人文学者目前利用ChatGPT进行的一些探索。北京大学数字人文研究中心今年在CCL会议上举办了古籍命名实体识别评测，即让机器自动识别古籍中的人名、书名和官职名。此前数字人文中心用深度学习的方法做过类似的实验，但深度学习方法运作良好的前提是有大量已经标注好的数据来训练算法，因此深度学习方法在识别分布较为广泛的人名类实体时表现较好，而识别比较稀疏的书名、官职名时表现较差。而通过使用ChatGPT抽取信息，目前准确率已经超过95%。也就是说，人工智能虽然在生成信息时可能出现各种错误，但在比较基础的语料处理和知识抽取工作上，能够给予人文学者很多帮助。目前ChatGPT的训练中，英文语料占了98%以上，中文语料极少，因此，ChatGPT处理中文文本的表现可能不及使用了大量中文语料训练的ChatGLM。这为我们带来的启发是，人文学者可以用人文数据训练一个针对学术研究的大模型，并要求这个大模型标明其抓取到的信息的出处，供人文学者甄别。大模型的训练也需要人文学者的帮助，学习人文学者写出的模板（prompt），是模型准确抓取信息的前提。

沙志利老师对人工智能持比较开放的态度，认为它本质上是为人所用的工具，关键是要将其用好。沙老师以自己的研究工作为例，指出人工智能技术可能大幅提高《儒藏》全本的编纂、校对效率。沙老师进一步指出，研究分为资料、方法、目标三个层面，以这三个层面的变与不变为标准，可以推想出人工智能与人文研究合作的三种可能性。一是资料、方法、目标都不变，研究者只是使用人工智能提高从资料中抽取信息的效率，信息抽取出来后，仍使用原来的方法进行研究。二是资料、方法改变，目标不变，即研究者利用人工智能处理过去处理不了的资料、拓宽了资料的边界，而资料的扩大将进一步启发研究者思考新的研究方法。三是目标也发生改变，即研究者在人工智能给出信息的启发下产生新的问题意识。胡明辉老师针对人工智能的属性问题进行补充，指出围绕工具属性，学界存在两种观点：一种正如沙老师所言，认为工具本身是中性的；一种则认为有的工具具有毁灭性，如枪支、原子弹等，这类工具不是中性的。而人工智能是否具有内在的毁灭性，目前还未可知。

▴

互动电影游戏《底特律：化身为人》（2018）

胡士颍老师认为，我们不应当要求工具是万能的。数字人文进行的古籍点校工作也并非百分之百准确，同理，我们也不应对ChatGPT吹毛求疵。胡老师认为，ChatGPT就像是研究者的“玩伴”，尽管在一些专业性的问题上，它的回答不尽准确，但研究者亦不应以己之长比彼之短。关于研究者与人工智能的关系，胡老师认为二者应该是相互促进的，套用现在“鸡娃”的说法，研究者“鸡”人工智能，再通过发展了的人工智能“鸡”自己。在这个过程中，可能部分研究者会被淘汰，但这种淘汰不是坏事。正如汽车的发明表面上导致了马车夫的失业，但马车夫可以进入工厂谋生，且汽车产业吸纳就业的能力反而更强。对于学生使用ChatGPT写作业，胡老师也表示欢迎，因为能够学会并很好地使用新工具也是一种能力。不过，在拥抱人工智能这项新技术的同时，人类应该对人工智能给出的各种答案保有判断的主导权。

讲座结尾，与会学者围绕人工智能时代的学术规范、版权、人工智能与数字人文的关系问题展开了热烈的讨论。与会学者普遍赞同人工智能将对现有学术规则造成很大挑战，但具体如何规范，目前还没有一个完善的方案。人工智能与数字人文的侧重有所不同，二者不是相互取代的关系，而是并行不悖，共同助力人文学科的发展。