今年的《政府工作報告》將“大力推進現(xiàn)代化產(chǎn)業(yè)體系建設,加快發(fā)展新質(zhì)生產(chǎn)力”列為2024年政府工作十大任務之首。發(fā)展新質(zhì)生產(chǎn)力是推動高質(zhì)量發(fā)展的內(nèi)在要求和重要著力點。依托前沿技術的革命性突破,對勞動者、勞動資料、勞動對象進行系統(tǒng)性、創(chuàng)新性配置和優(yōu)化組合,能夠提升全要素生產(chǎn)率,催生新產(chǎn)業(yè)、新模式、新動能,從而推進傳統(tǒng)生產(chǎn)力躍升,支持高質(zhì)量發(fā)展和社會主義現(xiàn)代化建設。
新質(zhì)生產(chǎn)力的“新”主要體現(xiàn)在生產(chǎn)力基本要素的革新,可拆解為具有善用現(xiàn)代技術、知識快速迭代能力的新勞動者,數(shù)據(jù)等新型生產(chǎn)要素和新勞動對象,人工智能、虛擬現(xiàn)實和增強現(xiàn)實設備等新勞動工具,適應科技創(chuàng)新新需求的新型基礎設施。
運用數(shù)字人文理念和技術活化檔案數(shù)據(jù),既適應新質(zhì)生產(chǎn)力發(fā)展的要求,也為推動新質(zhì)生產(chǎn)力發(fā)展提供有力支撐。
就勞動對象來看,檔案數(shù)據(jù)涵蓋歷史、文化、藝術、科學等方面的記錄,具有廣源性、累積性和擴展性等特征,可提供真實完整的數(shù)據(jù)資源作為新質(zhì)生產(chǎn)力的生產(chǎn)要素。
就勞動工具來看,數(shù)字人文是信息技術和人文學科深度融合的新興領域,計算機技術思維、數(shù)據(jù)量化思維推動人文社會科學領域數(shù)字資源的知識化建設,為解決人文研究問題提供知識服務。關聯(lián)數(shù)據(jù)、數(shù)據(jù)挖掘、數(shù)據(jù)可視化等數(shù)字人文技術可為挖掘檔案數(shù)據(jù)的知識價值提供有效工具。
就基礎設施來看,傳統(tǒng)檔案數(shù)據(jù)化以及原生數(shù)字資源存檔形成的海量檔案數(shù)據(jù)得到整合與關聯(lián),逐步推動全景式資源庫建設。開放互聯(lián)的資源庫為檔案數(shù)據(jù)共建共享提供基礎設施。
蘊含著知識價值的檔案數(shù)據(jù)、數(shù)字人文工具、檔案資源庫以及掌握數(shù)字人文技術的檔案資源開發(fā)者這4個要素優(yōu)化組合、共同作用,建立檔案數(shù)據(jù)資源體系,供給高質(zhì)量數(shù)據(jù)要素,基于價值挖掘方法釋放檔案價值,創(chuàng)新檔案信息服務方式衍生新型業(yè)態(tài),進而驅(qū)動新質(zhì)生產(chǎn)力的形成。
一、利用關聯(lián)數(shù)據(jù)進行整合 形成檔案數(shù)據(jù)全景
建設可持續(xù)、跨機構、跨領域、開放性的數(shù)據(jù)基礎設施,是文化記憶機構和數(shù)字人文領域的共識和發(fā)展方向。
在推動新質(zhì)生產(chǎn)力發(fā)展的背景下,數(shù)字經(jīng)濟蓬勃發(fā)展、數(shù)智技術取得革命性突破,這些變革催生海量原生檔案資源,并帶動檔案領域數(shù)字化、數(shù)據(jù)化轉(zhuǎn)型,形成了更多數(shù)據(jù)態(tài)檔案資源。
而只有經(jīng)過篩選、序化和描述,將散亂、多模態(tài)的檔案數(shù)據(jù)按照一定的邏輯結(jié)構組織成有序化、結(jié)構化、系統(tǒng)化的資源體系,才能夠快捷精準地獲取數(shù)據(jù),支持深入地挖掘與開發(fā)。
建設全景式資源庫,建立檔案數(shù)據(jù)的關聯(lián)關系,成為檔案領域借力數(shù)字人文開展檔案挖掘工作的重要一環(huán)。
從內(nèi)容上看,有“一內(nèi)一外”兩個面向。
一方面,做好國內(nèi)各級各類檔案機構檔案數(shù)據(jù)資源的整合。通過采集、識別、著錄、標引、關聯(lián)等處理環(huán)節(jié),將分散的檔案數(shù)據(jù)整合成資源集成的數(shù)據(jù)庫或語義關聯(lián)的知識庫,從而突破傳統(tǒng)物理空間的屬地化、層級化保管格局,促進檔案數(shù)據(jù)的整合與共享,真正滿足知識服務的需要。如,上海交通大學開發(fā)的中國地方歷史文獻數(shù)據(jù)庫收錄了來自浙江、安徽、江西、福建等地的地方歷史文獻,以地域為連接點形成關聯(lián),并從內(nèi)容特征、物理特征、身份識別特征3個方面標引元數(shù)據(jù),提供多元檢索和全文檢索服務。
另一方面,加快我國流散在國外的離散檔案資源的“數(shù)字回歸”。通過移交離散檔案數(shù)字副本、構建離散檔案數(shù)據(jù)庫等方式,實現(xiàn)離散檔案以數(shù)字形式回歸,達到內(nèi)容信息回歸和利用的目的,既維護我國檔案數(shù)據(jù)資源體系的完整性,也為構建完整的民族記憶充實素材。
從技術上看,多維技術應用日趨成熟。如,本體模型將領域關鍵概念和術語組織成概念體系,在語義層面為來源各異的檔案數(shù)據(jù)提供了組織框架。關聯(lián)數(shù)據(jù)技術則將跨機構跨領域的檔案數(shù)據(jù)組織成計算機可讀的語義數(shù)據(jù)網(wǎng)絡,在數(shù)據(jù)標準描述、多維揭示、資源聚合和知識服務等方面展現(xiàn)出巨大潛力等。
全景式資源庫是推動新質(zhì)生產(chǎn)力發(fā)展的基礎設施,通過實現(xiàn)跨機構、跨領域的互通與共享,為社會公眾獲取利用、多主體協(xié)同開發(fā)提供了基礎平臺。既能促進多主體參與構筑檔案數(shù)據(jù)全景,不斷增加資源庫的內(nèi)容數(shù)量,又能拓寬開發(fā)的思路和方式,帶動創(chuàng)新應用鏈條完善發(fā)展,促進開發(fā)提質(zhì)增效,也為和其他領域數(shù)據(jù)融合應用創(chuàng)造條件,在數(shù)據(jù)的驅(qū)動下推動跨界融合和協(xié)同發(fā)展。
開放的檔案數(shù)據(jù)平臺、協(xié)同的開發(fā)環(huán)境為知識生產(chǎn)創(chuàng)造了無限可能,既擴展了檔案數(shù)據(jù)價值釋放的途徑,又提升了價值形成的持續(xù)性,還為新質(zhì)生產(chǎn)力的發(fā)展提供了新動力。
二、活化檔案數(shù)據(jù) 釋放知識價值
檔案數(shù)據(jù)記錄歷史發(fā)展和社會活動的過程信息,憑借其原始記錄性為國家和社會提供可靠的信息,不僅具有重要憑證價值,還具有巨大知識價值。
數(shù)字人文為檔案數(shù)據(jù)資源提供重構策略?;凇皵?shù)據(jù)識別—數(shù)據(jù)組織—數(shù)據(jù)挖掘與呈現(xiàn)”的檔案數(shù)據(jù)價值挖掘模式,運用數(shù)字人文技術,將處于信息孤島的檔案數(shù)據(jù)組織成語義關聯(lián)的知識網(wǎng)絡,能夠推動檔案內(nèi)容信息的知識發(fā)現(xiàn)和價值洞察。
如,針對檔案文本內(nèi)容,可運用詞頻分析、共現(xiàn)分析、聚類分析等文本分析方法,繪制檔案信息的詞云圖、關鍵詞共現(xiàn)矩陣、聚類譜系圖等,幫助厘清特定檔案中的關鍵信息、內(nèi)容要義和語詞共現(xiàn)關系。
又如,聚焦檔案中的“人、地、時、事、物、情感”等記憶要素,運用社會網(wǎng)絡分析、地理位置分析、時序分析、情感分析等方法,可梳理人物網(wǎng)絡關系、時空演化、情感傾向、事件脈絡等,通過對記憶要素的組織與關聯(lián),再現(xiàn)記憶場景,闡釋記憶內(nèi)涵和情感取向。
再如,在生成式人工智能的引領下,人工智能技術加速發(fā)展,語音識別、圖像識別、機器學習等技術支持文本類、聲像類多模態(tài)檔案的內(nèi)容提取和挖掘日益深入,實現(xiàn)多媒體檔案數(shù)據(jù)的檢索與利用。
生成式人工智能的自然語言處理技術還可提高文本類檔案數(shù)據(jù)實體識別和語義關系揭示的效率??蓪⒄鎸嵖煽俊⑼暾麅?yōu)質(zhì)的檔案數(shù)據(jù)作為訓練語料,抽取檔案內(nèi)容中的事件、內(nèi)容摘要等,基于預訓練模型和抽取內(nèi)容數(shù)據(jù)庫,實現(xiàn)根據(jù)提問自動完成智能語義檢索、智能檔案編研、智能數(shù)據(jù)生成等任務,推動檔案數(shù)據(jù)挖掘的效率提升、深度凸顯。
可以看出,作為新質(zhì)生產(chǎn)力勞動工具的數(shù)字人文技術,賦能作為勞動對象的檔案數(shù)據(jù),推動其挖掘重構、知識化、故事化,既創(chuàng)新價值釋放方式,又有力推動價值釋放,為發(fā)展提供參考信息和決策支持。
一方面,數(shù)字人文技術從描述、組織與系統(tǒng)化開發(fā)等層面突出了檔案數(shù)據(jù)的知識價值,創(chuàng)新其價值釋放方式。通過可獲取的途徑,傳遞可理解的檔案數(shù)據(jù)資源,能夠降低檔案信息獲取成本,提供數(shù)據(jù)資源以支持提高全社會創(chuàng)新效率,加速推動新質(zhì)生產(chǎn)力發(fā)展。
另一方面,檔案數(shù)據(jù)中潛藏的知識得到充分挖掘與釋放。如,提煉蘊含在檔案中的生產(chǎn)方式、技術發(fā)展、創(chuàng)新成果等方面的經(jīng)驗或規(guī)律,為新質(zhì)生產(chǎn)力發(fā)展提供借鑒與啟示,為決策提供依據(jù),有助于優(yōu)化資源配置,激發(fā)創(chuàng)新思維,推動科技進步。
三、創(chuàng)新檔案信息服務方式 推動文化服務業(yè)態(tài)升級
檔案數(shù)據(jù)只有通過知識服務的方式向社會提供利用,才能夠真正釋放其價值,讓其活起來。培育新質(zhì)生產(chǎn)力的環(huán)境下,社會公眾的數(shù)據(jù)意識不斷提升,信息需求呈現(xiàn)出多元化、個性化、精細化特點?;诟哔|(zhì)量的檔案數(shù)據(jù),開發(fā)檔案數(shù)據(jù)類產(chǎn)品和服務,成為滿足公眾日益升級的信息需求的重要途徑。
數(shù)字人文技術,如可視化技術、虛擬現(xiàn)實技術、沉浸式體驗等的發(fā)展,為檔案數(shù)據(jù)的服務方式注入新活力,在挖掘內(nèi)容深度和強化知識屬性的同時,兼顧形式的多樣性、互動性和可體驗性。
數(shù)字人文環(huán)境下檔案數(shù)據(jù)價值釋放的方式有:建設主題數(shù)字平臺、制作可視化展示項目、設計互動式檔案游戲和歷史場景虛擬重現(xiàn)等。
檔案數(shù)字平臺。挖掘檔案的隱性關系提供資源的關聯(lián)訪問,從外部特征的分類聚類逐漸發(fā)展為基于語義的連接整合。
可視化項目。以可視化的方式統(tǒng)一展示多源異構的檔案數(shù)據(jù),如時間軸、地理信息系統(tǒng)、社會關系網(wǎng)絡等,促進檔案價值的發(fā)現(xiàn)。上海圖書館開發(fā)了盛宣懷檔案知識庫,根據(jù)其日記、文稿、信札、電報等記錄中的共現(xiàn)關系,繪制可根據(jù)時間軸調(diào)整的人物關系圖,展現(xiàn)不同時期的人物社交網(wǎng)絡,便是典型例證。
檔案游戲。融入大量互動形式開展沉浸式教育,傳播檔案知識,因其引人入勝的故事情節(jié)和交互體驗而提高公眾參與的積極性。如,蘇州中國絲綢檔案館打造了“第七檔案室”IP,融紅色歷史、檔案知識、解謎游戲等內(nèi)容為一體,開發(fā)了解謎書、大型實景解謎活動、互動密室、劇本殺等劇情聯(lián)動、類型多樣、系列互補的檔案游戲。
歷史場景虛擬重現(xiàn)?;诙嗄B(tài)檔案記憶資源的沉浸式體驗,借助VR、數(shù)字孿生等技術對歷史空間或歷史場景進行虛擬復原,拓寬了檔案利用服務的深度與廣度,帶給用戶身臨其境的歷史場景感。如,《古籍尋游記》系列VR紀錄片之《居延漢簡》,以居延漢簡的相關史料、考古遺存等為依托,利用6DoF交互技術、三維重建及視頻掃描技術,構建漢代邊塞場景,設計劈柴、射擊、喂豬等交互動作,再現(xiàn)檔案文獻中記載的邊塞生活面貌以及將士保家衛(wèi)國經(jīng)歷。
歷史場景虛擬重現(xiàn)的方式塑造沉浸式的檔案數(shù)據(jù)呈現(xiàn)空間,再現(xiàn)歷史場景,還原檔案生成背景或內(nèi)容背景,融入趣味互動體驗表達檔案內(nèi)容知識,激活多感官體驗,強化具身認知,破除平面化數(shù)據(jù)呈現(xiàn)存在的互動壁壘和理解阻礙,推動檔案知識理解和價值傳播。
數(shù)字人文技術創(chuàng)新檔案數(shù)據(jù)呈現(xiàn)形式,推動檔案數(shù)據(jù)從可識別可理解發(fā)展為可感知可體驗,促進檔案數(shù)據(jù)價值釋放。
其一,檔案信息服務方式的延展?jié)M足社會公眾日益增長的多樣化信息需求。依托用戶行為、用戶畫像、用戶偏好等數(shù)據(jù)要素,借助大數(shù)據(jù)技術深化對用戶需求的理解,促進生產(chǎn)端與消費端的匹配,提高整個產(chǎn)業(yè)鏈的生產(chǎn)效率。同時,刺激公眾擴大對檔案數(shù)據(jù)知識服務的需求,倒逼檔案機構不斷提高生產(chǎn)效率、優(yōu)化服務水平,供給高質(zhì)量的檔案信息產(chǎn)品和服務,推動檔案領域?qū)崿F(xiàn)新質(zhì)生產(chǎn)力的發(fā)展。
其二,檔案信息服務方式的創(chuàng)新激發(fā)文化服務行業(yè)新產(chǎn)業(yè)新業(yè)態(tài)的涌現(xiàn)。借助人工智能等技術,推動編研、展覽等傳統(tǒng)的檔案信息服務產(chǎn)品轉(zhuǎn)型升級,向沉浸性、互動性、知識性的服務類體驗類產(chǎn)品創(chuàng)新發(fā)展。同時,注重文化內(nèi)涵和情感體驗的傳播,提高檔案信息服務產(chǎn)品的附加值,培育強大的生產(chǎn)力潛能,推動新質(zhì)生產(chǎn)力發(fā)展。
數(shù)字人文賦能之下,檔案數(shù)據(jù)的組織、開發(fā)和服務朝著知識化方向深入發(fā)展。在檔案數(shù)據(jù)的活化開發(fā)中,形成了致力于知識服務的問題導向和借力數(shù)字技術的數(shù)據(jù)導向思維。通過構筑語義關聯(lián)的檔案數(shù)據(jù)全景、挖掘檔案數(shù)據(jù)中的隱性知識和價值、創(chuàng)新兼具知識性和體驗性的檔案信息服務方式,檔案數(shù)據(jù)的知識價值得到充分呈現(xiàn)和闡釋,既為新質(zhì)生產(chǎn)力的發(fā)展提供高質(zhì)量的數(shù)據(jù)基礎和知識支撐,也通過數(shù)據(jù)驅(qū)動、技術引領、效率提升、服務升級為新質(zhì)生產(chǎn)力的發(fā)展創(chuàng)造新的驅(qū)動力。