banner

【未名学者讲座126】位通:数字人文视角下的大规模文化遗产图像分析与利用

发布时间:2025-05-11

2025年4月3日晚,由文研院主办、兴证全球基金支持的未名学者讲座第126期“数字人文视角下的大规模文化遗产图像分析与利用”在北京大学静园二院208会议室举行。北京大学信息管理系助理教授位通主讲,山西省古建筑与彩塑壁画保护研究院研究员韩炳华评议,北京大学中古史中心副研究馆员史睿主持。





一、数字人文的学科史


讲座伊始,位通老师简要介绍了数字人文研究的基本情况,指出数字人文研究的学科发展可以大致划分为五个阶段。


在启蒙与萌芽阶段(1940s-1970s),1949年罗伯特·布萨与IBM合作处理拉丁文著作,最终耗时三十余年编制出《托马斯著作索引》,是数字人文学科起步的重要标志;1970年代,牛津大学使用标准通用标记语言(SGML)标记中世纪手稿,则是这一时期重要的学科成果。在这一阶段,数字人文的技术基础是机读文件格式和语料库建设,核心特征体现为“人文计算”(Humanities Computing)



《托马斯著作索引》使用的打孔卡片


在技术融合与学科拓展阶段(1980s-1990s),个人计算机普及推动人文研究的数字化转型,数据库工具成为这一时期数字人文研究的核心。这一时期产生了一系列标志性的研究项目,如聚焦古典文学数字化的帕尔修斯项目,聚焦构建交叉引用档案库并整合边缘作家作品的女性作家项目,以及数字化美国南北战争史料探索微观历史视角的暗影之谷项目。这一时期的重要特征是学术协作的兴起,学者可以与艺术家、程序员合作开发项目。此外,文本编码创始项目(TEI)在1987年诞生,并于1994年以印刷版和电子版两种形式发布了第一个完整版本的《电子文本编码与互换准则》,促使电子文本成为学术研究的领域,并由此促成了用于标记数字化文本的可拓展标记语言(XML)的诞生。


在网络化与全球化时代(1990s-2000s),数字人文的学科发展继续深入。一方面,互联网革命带来了全新的工具和协作平台,国际数字人文组织联盟(ADHO)于2005年成立;另一方面,在网络技术加持下,地理空间分析、虚拟现实、多媒体表达等新技术也得到应用。而在这一时期,数据格式和编码规则的统一则成为技术发展的关键挑战。


在学科化与多元化发展时代(2000s-2010s),随着“数字人文”(Digital Humanities)的概念在《数字人文指南》中正式提出,这一概念逐步取代了“人文计算”成为跨学科研究的领域。2009年,武汉大学王晓光教授全面解读“数字人文”概念并推动学科发展。



《数字人文指南》

布莱克维尔出版社,2001年


在学科成熟与深度整合阶段(2010s-至今),技术深化与研究多元化成为学科新趋势。就技术深化而言,大数据、人工智能、自然语言处理等技术正日益应用于古籍整理、文物分析等领域。就研究多元化而言,数字人文正渗透至历史学(如CBDB“中国历代人物传记资料库”)、文学(远读与文本挖掘)、艺术史(数字艺术档案)、文化遗产(数据化)、古籍(智能开发与利用)等领域。2010年后,中国的数字人文学科也迎来发展高峰期,一是发文量激增,二是学术会议频繁,2016年北京大学举办了首届“数字人文论坛”。



CBDB 中已知籍贯的 190,000 历史人物的地理分布图


当前,数字人文研究呈现出多模态资源整合应用的趋势。包括文本、图像、音频、视频、3D模型等多类型数据的多模态资源被广泛应用到数字人文研究中;数字人文研究的应用场景则主要关注文化遗产数字化和历史研究等;在研究方法上,自然语言处理(NLP)、计算机视觉(CV)、Graph RAG等得到更广泛的应用。


二、文本与图像的交叠


接下来,位老师区分了文本和图像两种不同的研究介质,并对其异同进行了比较。位老师指出,文本是一种显性介质。文本本身是人文的根基,是历史记录的载体,也是多学科交叉研究的基础。但与之相对,图像则是历史事件、文化现象和社会变迁的直观记录,能够揭示隐含在文化表象之下的深层次信息,还具有跨文化交流的功能。在前文字时代,图像扮演着“以图言说”的重要角色,成为人类记录所见所闻、所知所行、所想所信的基本手段。


实际上,传统史学也比较重视对图像资料的整理和运用:包括但不限于编纂历史(遗址、文物)图像专题图集;编选同历史文本内容相关的文物图像,用作文本附图(插图);写作以历史图像为主要内容的学术著作。近来,“历史图像学”以历史上的图像史料为基本的研究对象,坚持在历史语境中解读图像,建立了带有图像学研究方法的历史研究范式和叙事模式。


三、数字人文的实践:

以先秦青铜鼎研究为例


接下来,位老师以先秦时期的青铜鼎为例,介绍了如何应用数字人文技术进行图像驱动的人文研究。通过这一研究,位老师希望了解先秦时期青铜鼎的器形演化族群、先秦时期青铜鼎器形演化的时空活跃性以及先秦时期青铜鼎器形存续时长等内容。


这项研究的核心方法是本体工程与语义分割方法(Ontology Engineering and Semantic Segmentation,OE2S)。其中,本体工程是指构建一个结构化的知识框架,指导图像分割及将分割后的图像数据映射到特定的文化语境中;语义分割技术则是将图像中的每一个像素赋予特定的标签,从而在像素级别上实现对图像内容的精确分类和区域划分。具体而言,这项方法又可以划分为知识工程、数据处理和数据分析三个阶段以及在此基础上细分的构建图像数据集、识别器形特征、构建概念体系、构建训练数据集、训练语义分割模型、分割图像语义、图像向量化、筛选标准器向量、进行标准器相似度计算和社会网络分析等十个步骤。



运用模型对青铜鼎进行智能标注


基于此方法,位老师对先秦青铜鼎进行了系统研究,提出了“器形演化族群”(Morphological Evolution Group)的概念。器形演化族群是指在器形特征上具有相似性并共享某些关键构造要素的铜鼎群体;相较于传统类型学方法对学者经验的依赖以及由此可能产生的主观偏差,器形演化族群概念假设青铜鼎各个器形特征在分类时具有同等重要性,完全依赖计算机算法进行量化分析,以数据驱动的方式确定器形的演化归类方式。这一方法能够在大规模数据环境下系统性分析青铜鼎的器形演化规律,并识别出不同器形演化族群。


接下来,位老师展示了其研究结果。在演化族群方面,研究发现颈部是青铜鼎形态变异最活跃的部位,腹部形状、底部形状、足部形状和盖顶特征也较易发生变异,而耳部相对平稳,不易发生变化;在此基础上,位老师也对青铜鼎的足部、口部、体型、底部、腹部、耳部、盖顶的演化规律进行了分析。在时空活跃性方面,研究统计出32个演化族群中的第一次演化点,在此基础上绘制的时间-地点热力图揭示了青铜鼎演化呈现在商周交替期与春秋早期发生剧烈变化的双高峰模式。在存续时长方面,研究表明存续时长与青铜鼎的器形局部特征之间的相关性较弱,与器形传播广度和特定地域的相关性较强,河南和陕西作为传播中心具有关键作用。



先秦时期青铜鼎器型分布


此外,位老师还介绍支持这项研究的格图智能数据化平台(http://getu-client.dhontology.com/),并对这一平台的相关功能进行了演示,此平台主要解决大规模图像数据化问题,让人文学者也能通过训练模型抽取大规模图像知识,形成结构化数据,用于分析、图谱生成等研究场景,为文化遗产活化生产数据。作为总结,位老师提出,数字人文视角下数据驱动的人文研究的落地过程大致分为四步:第一步是将用于解决人文问题的文献进行数据化处理;第二步是采用多样的数据方法进行数据分析;第三步是对研究结果进行可视化呈现;最后是结合数据和人文理论进行阐释。


评议与讨论


在评议环节,韩炳华老师回顾了当前数字化在文化遗产领域的广泛应用,对位通老师的跨学科研究方法表示赞赏,认为其有助于减小当前类型学分类中的一些人为因素影响。在此基础上,韩老师提出了几点看法:一是要重视数据库可能存在的偏差对研究的影响,如带铭文的青铜器更多体现了都城的影响,但随时代发展铭文数量在减少,因此需要考虑数据库的代表性问题;二是需要重视演化规律和不均衡性,尤其是演化过程中的非均衡性特征;三是呼吁在当前数字化的大背景下,不同机构要加强文物数据的互通共享。



位通老师在讲座中


在讲座的最后阶段,位通老师与现场观众就不同大小青铜鼎对识别过程的影响、如何对图像和文字结合更加密切的资料进行识别分割、青铜鼎识别模型的训练方法等问题进行了交流。本次讲座在热烈的气氛中圆满结束。

s