今年的《政府工作報告》將“大力推進現代化產業體系建設,加快發展新質生產力”列為2024年政府工作十大任務之首。發展新質生產力是推動高質量發展的內在要求和重要著力點。依托前沿技術的革命性突破,對勞動者、勞動資料、勞動對象進行系統性、創新性配置和優化組合,能夠提升全要素生產率,催生新產業、新模式、新動能,從而推進傳統生產力躍升,支持高質量發展和社會主義現代化建設。
新質生產力的“新”主要體現在生產力基本要素的革新,可拆解為具有善用現代技術、知識快速迭代能力的新勞動者,數據等新型生產要素和新勞動對象,人工智能、虛擬現實和增強現實設備等新勞動工具,適應科技創新新需求的新型基礎設施。
運用數字人文理念和技術活化檔案數據,既適應新質生產力發展的要求,也為推動新質生產力發展提供有力支撐。
就勞動對象來看,檔案數據涵蓋歷史、文化、藝術、科學等方面的記錄,具有廣源性、累積性和擴展性等特征,可提供真實完整的數據資源作為新質生產力的生產要素。
就勞動工具來看,數字人文是信息技術和人文學科深度融合的新興領域,計算機技術思維、數據量化思維推動人文社會科學領域數字資源的知識化建設,為解決人文研究問題提供知識服務。關聯數據、數據挖掘、數據可視化等數字人文技術可為挖掘檔案數據的知識價值提供有效工具。
就基礎設施來看,傳統檔案數據化以及原生數字資源存檔形成的海量檔案數據得到整合與關聯,逐步推動全景式資源庫建設。開放互聯的資源庫為檔案數據共建共享提供基礎設施。
蘊含著知識價值的檔案數據、數字人文工具、檔案資源庫以及掌握數字人文技術的檔案資源開發者這4個要素優化組合、共同作用,建立檔案數據資源體系,供給高質量數據要素,基于價值挖掘方法釋放檔案價值,創新檔案信息服務方式衍生新型業態,進而驅動新質生產力的形成。
一、利用關聯數據進行整合 形成檔案數據全景
建設可持續、跨機構、跨領域、開放性的數據基礎設施,是文化記憶機構和數字人文領域的共識和發展方向。
在推動新質生產力發展的背景下,數字經濟蓬勃發展、數智技術取得革命性突破,這些變革催生海量原生檔案資源,并帶動檔案領域數字化、數據化轉型,形成了更多數據態檔案資源。
而只有經過篩選、序化和描述,將散亂、多模態的檔案數據按照一定的邏輯結構組織成有序化、結構化、系統化的資源體系,才能夠快捷精準地獲取數據,支持深入地挖掘與開發。
建設全景式資源庫,建立檔案數據的關聯關系,成為檔案領域借力數字人文開展檔案挖掘工作的重要一環。
從內容上看,有“一內一外”兩個面向。
一方面,做好國內各級各類檔案機構檔案數據資源的整合。通過采集、識別、著錄、標引、關聯等處理環節,將分散的檔案數據整合成資源集成的數據庫或語義關聯的知識庫,從而突破傳統物理空間的屬地化、層級化保管格局,促進檔案數據的整合與共享,真正滿足知識服務的需要。如,上海交通大學開發的中國地方歷史文獻數據庫收錄了來自浙江、安徽、江西、福建等地的地方歷史文獻,以地域為連接點形成關聯,并從內容特征、物理特征、身份識別特征3個方面標引元數據,提供多元檢索和全文檢索服務。
另一方面,加快我國流散在國外的離散檔案資源的“數字回歸”。通過移交離散檔案數字副本、構建離散檔案數據庫等方式,實現離散檔案以數字形式回歸,達到內容信息回歸和利用的目的,既維護我國檔案數據資源體系的完整性,也為構建完整的民族記憶充實素材。
從技術上看,多維技術應用日趨成熟。如,本體模型將領域關鍵概念和術語組織成概念體系,在語義層面為來源各異的檔案數據提供了組織框架。關聯數據技術則將跨機構跨領域的檔案數據組織成計算機可讀的語義數據網絡,在數據標準描述、多維揭示、資源聚合和知識服務等方面展現出巨大潛力等。
全景式資源庫是推動新質生產力發展的基礎設施,通過實現跨機構、跨領域的互通與共享,為社會公眾獲取利用、多主體協同開發提供了基礎平臺。既能促進多主體參與構筑檔案數據全景,不斷增加資源庫的內容數量,又能拓寬開發的思路和方式,帶動創新應用鏈條完善發展,促進開發提質增效,也為和其他領域數據融合應用創造條件,在數據的驅動下推動跨界融合和協同發展。
開放的檔案數據平臺、協同的開發環境為知識生產創造了無限可能,既擴展了檔案數據價值釋放的途徑,又提升了價值形成的持續性,還為新質生產力的發展提供了新動力。
二、活化檔案數據 釋放知識價值
檔案數據記錄歷史發展和社會活動的過程信息,憑借其原始記錄性為國家和社會提供可靠的信息,不僅具有重要憑證價值,還具有巨大知識價值。
數字人文為檔案數據資源提供重構策略。基于“數據識別—數據組織—數據挖掘與呈現”的檔案數據價值挖掘模式,運用數字人文技術,將處于信息孤島的檔案數據組織成語義關聯的知識網絡,能夠推動檔案內容信息的知識發現和價值洞察。
如,針對檔案文本內容,可運用詞頻分析、共現分析、聚類分析等文本分析方法,繪制檔案信息的詞云圖、關鍵詞共現矩陣、聚類譜系圖等,幫助厘清特定檔案中的關鍵信息、內容要義和語詞共現關系。
又如,聚焦檔案中的“人、地、時、事、物、情感”等記憶要素,運用社會網絡分析、地理位置分析、時序分析、情感分析等方法,可梳理人物網絡關系、時空演化、情感傾向、事件脈絡等,通過對記憶要素的組織與關聯,再現記憶場景,闡釋記憶內涵和情感取向。
再如,在生成式人工智能的引領下,人工智能技術加速發展,語音識別、圖像識別、機器學習等技術支持文本類、聲像類多模態檔案的內容提取和挖掘日益深入,實現多媒體檔案數據的檢索與利用。
生成式人工智能的自然語言處理技術還可提高文本類檔案數據實體識別和語義關系揭示的效率。可將真實可靠、完整優質的檔案數據作為訓練語料,抽取檔案內容中的事件、內容摘要等,基于預訓練模型和抽取內容數據庫,實現根據提問自動完成智能語義檢索、智能檔案編研、智能數據生成等任務,推動檔案數據挖掘的效率提升、深度凸顯。
可以看出,作為新質生產力勞動工具的數字人文技術,賦能作為勞動對象的檔案數據,推動其挖掘重構、知識化、故事化,既創新價值釋放方式,又有力推動價值釋放,為發展提供參考信息和決策支持。
一方面,數字人文技術從描述、組織與系統化開發等層面突出了檔案數據的知識價值,創新其價值釋放方式。通過可獲取的途徑,傳遞可理解的檔案數據資源,能夠降低檔案信息獲取成本,提供數據資源以支持提高全社會創新效率,加速推動新質生產力發展。
另一方面,檔案數據中潛藏的知識得到充分挖掘與釋放。如,提煉蘊含在檔案中的生產方式、技術發展、創新成果等方面的經驗或規律,為新質生產力發展提供借鑒與啟示,為決策提供依據,有助于優化資源配置,激發創新思維,推動科技進步。
三、創新檔案信息服務方式 推動文化服務業態升級
檔案數據只有通過知識服務的方式向社會提供利用,才能夠真正釋放其價值,讓其活起來。培育新質生產力的環境下,社會公眾的數據意識不斷提升,信息需求呈現出多元化、個性化、精細化特點。基于高質量的檔案數據,開發檔案數據類產品和服務,成為滿足公眾日益升級的信息需求的重要途徑。
數字人文技術,如可視化技術、虛擬現實技術、沉浸式體驗等的發展,為檔案數據的服務方式注入新活力,在挖掘內容深度和強化知識屬性的同時,兼顧形式的多樣性、互動性和可體驗性。
數字人文環境下檔案數據價值釋放的方式有:建設主題數字平臺、制作可視化展示項目、設計互動式檔案游戲和歷史場景虛擬重現等。
檔案數字平臺。挖掘檔案的隱性關系提供資源的關聯訪問,從外部特征的分類聚類逐漸發展為基于語義的連接整合。
可視化項目。以可視化的方式統一展示多源異構的檔案數據,如時間軸、地理信息系統、社會關系網絡等,促進檔案價值的發現。上海圖書館開發了盛宣懷檔案知識庫,根據其日記、文稿、信札、電報等記錄中的共現關系,繪制可根據時間軸調整的人物關系圖,展現不同時期的人物社交網絡,便是典型例證。
檔案游戲。融入大量互動形式開展沉浸式教育,傳播檔案知識,因其引人入勝的故事情節和交互體驗而提高公眾參與的積極性。如,蘇州中國絲綢檔案館打造了“第七檔案室”IP,融紅色歷史、檔案知識、解謎游戲等內容為一體,開發了解謎書、大型實景解謎活動、互動密室、劇本殺等劇情聯動、類型多樣、系列互補的檔案游戲。
歷史場景虛擬重現。基于多模態檔案記憶資源的沉浸式體驗,借助VR、數字孿生等技術對歷史空間或歷史場景進行虛擬復原,拓寬了檔案利用服務的深度與廣度,帶給用戶身臨其境的歷史場景感。如,《古籍尋游記》系列VR紀錄片之《居延漢簡》,以居延漢簡的相關史料、考古遺存等為依托,利用6DoF交互技術、三維重建及視頻掃描技術,構建漢代邊塞場景,設計劈柴、射擊、喂豬等交互動作,再現檔案文獻中記載的邊塞生活面貌以及將士保家衛國經歷。
歷史場景虛擬重現的方式塑造沉浸式的檔案數據呈現空間,再現歷史場景,還原檔案生成背景或內容背景,融入趣味互動體驗表達檔案內容知識,激活多感官體驗,強化具身認知,破除平面化數據呈現存在的互動壁壘和理解阻礙,推動檔案知識理解和價值傳播。
數字人文技術創新檔案數據呈現形式,推動檔案數據從可識別可理解發展為可感知可體驗,促進檔案數據價值釋放。
其一,檔案信息服務方式的延展滿足社會公眾日益增長的多樣化信息需求。依托用戶行為、用戶畫像、用戶偏好等數據要素,借助大數據技術深化對用戶需求的理解,促進生產端與消費端的匹配,提高整個產業鏈的生產效率。同時,刺激公眾擴大對檔案數據知識服務的需求,倒逼檔案機構不斷提高生產效率、優化服務水平,供給高質量的檔案信息產品和服務,推動檔案領域實現新質生產力的發展。
其二,檔案信息服務方式的創新激發文化服務行業新產業新業態的涌現。借助人工智能等技術,推動編研、展覽等傳統的檔案信息服務產品轉型升級,向沉浸性、互動性、知識性的服務類體驗類產品創新發展。同時,注重文化內涵和情感體驗的傳播,提高檔案信息服務產品的附加值,培育強大的生產力潛能,推動新質生產力發展。
數字人文賦能之下,檔案數據的組織、開發和服務朝著知識化方向深入發展。在檔案數據的活化開發中,形成了致力于知識服務的問題導向和借力數字技術的數據導向思維。通過構筑語義關聯的檔案數據全景、挖掘檔案數據中的隱性知識和價值、創新兼具知識性和體驗性的檔案信息服務方式,檔案數據的知識價值得到充分呈現和闡釋,既為新質生產力的發展提供高質量的數據基礎和知識支撐,也通過數據驅動、技術引領、效率提升、服務升級為新質生產力的發展創造新的驅動力。