今年以來,浙江省檔案館以檔案數字化深度轉型為抓手,利用大模型技術對館藏良渚遺址考古檔案進行知識化梳理,形成了良渚遺址考古檔案專題知識庫,全方位展示黨和政府以及社會各界發掘、保護良渚文化遺址的歷程全貌。這一創新舉措標志著我國檔案管理工作在人工智能技術應用方面邁出了重要一步。
良渚古城遺址自2019年列入世界遺產名錄后,愈發成為文明對話與文化研究的焦點。以其對實證中華五千年的文明史特殊的圣地地位和所蘊涵豐富的考古檔案價值而言,良渚遺址對我們了解新石器時代中原地區的社會政治、經濟、文化等各個方面都具有極高的歷史價值和極大的學術意義。然而,這些檔案體量龐大、類型復雜、資源分散,僅憑人工整理難以充分釋放其價值。浙江省檔案館通過引入大模型技術,成功解決了這一難題,為文化遺產保護提供了新的技術路徑。
專題知識庫基于檔案多模態數字資源治理平臺,利用大模型強大的語義分析理解能力,對800余份與良渚遺址考古有關的館藏檔案進行要素智能識別與知識關聯重構。具體技術實現包括:
要素抽取與知識關聯?:系統自動抽取檔案中的人物、機構、主題、事件、時間等要素及相互聯系,建立"實體—關系—實體"的語義三元組關聯關系,實現檔案資源從"文本存儲"到"數據可用"的轉變。
多維標簽體系?:按照"時間+事件、規范+技術"的雙軸整理邏輯,對檔案進行分類標注,建立主題、類型和實體的多維標簽體系,構建了知識分類庫。
可視化展示形式?:
以知識圖譜形式直觀呈現考古發掘、保護和開發的關聯網絡
以知識百科形式系統展現考古發掘的各類知識要點
以知識年表形式清晰再現考古發掘的歷史過程
浙江省檔案館還部署了檔案數字資源大模型底座,建成館藏檔案數據倉,采用檢索增強生成(RAG)技術,支持自然語言交互,實現文本、圖像等多模態智能檢索,大幅提升檔案檢索查全率和查準率。
良渚遺址考古檔案知識庫的建成具有多重價值:
學術研究?:為考古學家和歷史研究者提供了系統化的知識資源,能夠快速獲取良渚文化相關考古發現、研究成果和歷史脈絡,提高研究效率。
文化傳播?:通過可視化展示和智能問答功能,向公眾普及良渚文化知識,增強文化自信,促進中華優秀傳統文化的傳承與傳播。
檔案管理創新?:為全國檔案行業提供了大模型技術應用的典型案例,推動了檔案工作從數字化管理向知識化服務的轉型。
國際交流?:作為世界文化遺產,良渚遺址的國際關注度不斷提升,該知識庫為國際學術界提供了研究中國早期文明的重要數字資源。
浙江省檔案館表示,將繼續深化大模型技術在檔案管理中的應用,計劃將這一模式推廣到其他重要歷史檔案的整理工作中。不斷的對知識更新和完善使得我們的知識庫始終能保持著對最新的考古發現和研究進展的把握,從而始終保持其較高的學術前沿性。
依托于這一的創新實踐,不僅為我們對文化遺產的保護提供了更為先進的技術手段,也為人工智能的深入人文社科的應用開辟了廣闊的新天地,充分體現了“科技+文化”的高水平的融合發展典范。