首頁 >> 圖書情報學
              語義網環境下敘詞表構建方法研究
              2018年09月12日 14:22 來源:情報科學 作者:宋培彥 陳白雪 王星 字號

              內容摘要:【目的/意義】通過研究語義網環境下敘詞表的構建方式,促進敘詞表的共建和共享。【方法/過程】敘詞表是進行知識組織的有效工具。從知識工程的角度,對語義網環境下敘詞表的基本特征和構建方式進行分析,研究敘詞表構建的技術模型與演進路徑,為敘詞表的編制、使用和維護提供新的思路和視角。進而,結合知識的多維度描述方法,對語義網環境下敘詞表構建的有效性進行實證研究和展望。【結果/結論】《漢語主題詞表》研究和實踐表明,語義網環境下敘詞表的共建共享在機制和技術上是可行的。

              關鍵詞:

              作者簡介:

                 1 引言

                

                 敘詞表作為一種輕量級的知識組織工具,側重于對概念和概念關系的描述,在圖書情報領域得到了廣泛的應用,特別是在紙質文獻信息標引、檢索與服務等方面發揮了重要作用。近30年來,我國陸續編制了《漢語主題詞表》《軍用主題詞表》等各種類型的敘詞表,具有概念規范、語義關系嚴密、簡單易用等諸多優點,成為圖書情報領域開展知識組織與知識服務的基礎性、支撐性知識工程。同時,隨著互聯網的深入發展,用戶群體的知識需求和使用習慣已經發生了顯著變化,不僅突破了傳統圖書館在時間、地域、資源載體等方面的物理限制,而且更加迫切地需要對知識內容進行有效組織和獲取。敘詞表作為計算機可讀的專業知識庫,如何主動適應用戶需求的變化,形成數據、技術和用戶需求多重驅動的編制新模式,更加有效支撐海量專業知識的細粒度標引、推薦與服務,實現知識內容快速、精準服務,是當前知識組織領域面臨的重要研究課題。

                

                 語義網(semantic web)為敘詞表的編制提供了更為豐富的理論視角、技術條件和數據資源。語義網以知識組織為基礎,側重于知識的表示、推理、存儲等,形成便于計算機使用的知識庫資源,提高計算機的智能化水平,形成了值得借鑒的范式。因此,本文試圖對語義網環境下敘詞表的基本模型、構建方法、應用領域、維護更新機制和相關技術進行引介和探討,為敘詞表的良性發展與應用提供借鑒。

                

                 2 研究現狀

                

                 網絡環境下,語義的重要性正在日益凸顯,國內外學術界對敘詞表編制方法和技術進行了較為深入的研究。常春等學者研究了網絡環境下敘詞表編制與更新維護中概念及關系的獲取方法[1];曾建勛等對網絡環境下敘詞表表現形態、編制維護方式和功能定位進行了研究,提出了“基礎詞庫-范疇體系-概念關系網絡”三級聯動機制[2];邰楊芳等提出基于受控詞表的Folksonomy優化系統方案,以提高web2.0環境下網絡信息資源的組織管理和檢索效率[3];曾文等研究了敘詞表自動構建、詞間關系、可視化等多個方面[4];滕廣青等對知識組織體系的結構和演進路徑進行了梳理,指出知識組織體系正在向柔性化、復雜化方向發展[5];司莉等對網絡敘詞表的現狀進行了調研,對網絡敘詞表的用戶服務界面提出了構建策略[6-7];歐石燕研究了通過SKOS對敘詞表進行轉化和共享的方法與技術[8];曹樹金對網絡敘詞表的結構模式進行了分析,并提出了優化建議[9]。在國際上,也進行了相應的研究,Berners-Lee于2000年提出了語義網(semantic web),試圖通過機器可理解的本體知識實現知識之間的語義互通,被萬維網聯盟W3C廣泛推廣,語義已經成為知識互聯互通的必要基礎[10]。Almeida等在語義網環境下通過上下文語境對知識組織系統中的語義關系進行界定[11]。De Luca等從詞匯關聯的角度,展示了如何重用語義關系并實現語義推理[12]。Hernandez從用戶交互需求角度提出了知識建模技術,實現對碎片化知識的集成和推理[13]。特別在大數據背景下,關聯數據理論在圖書情報界形成研究熱潮,借助本體、敘詞表等語義資源,實現對各類知識語義層面的管理和服務,語義在知識聚合方面起到了不可替代的作用[14]。在工程實踐方面,美國國立醫學圖書館開發的一體化醫學語言系統UMLS集成了150余部醫學主題詞表,用于對互聯網文獻的挖掘和服務,已經在概念融合、語義推理等方面取得突破性進展[15]。此外,IEEE推出的頂層本體SUMO(Suggested Upper Merge Ontology)也在試圖將包括敘詞表在內的知識組織工具進行融合,以支持語義網的構建[16]。

                

                 敘詞表與語義網具有天然緊密的聯系。語義網環境下,敘詞表的基本理念和結構仍然基本保持,并具有更豐富的社會需求和應用場景。同時,敘詞表的構建方式、技術方法、應用方式也必然要主動適應語義網環境的需求,在語義結構、數據格式、互操作等方面加以改進,以適應語義網環境的需求。

                

                 可以說,語義網將對敘詞表的構建與發展起到積極的促進作用,如何順應互聯網向語義網轉變這一總體趨勢,對敘詞表編制技術和方式進行完善并形成良性循環,是本文的主要研究目的。

                

                 3 敘詞表基本特征

                

                 為了便于稱謂和比較,本文根據敘詞表的載體類型,分為以紙質版為載體的傳統敘詞表和以網絡方式為載體的網絡敘詞表。雖然“網絡敘詞表”目前尚無統一的定義,但學術界已經對其形態、功能和應用有了一些共識。它不是簡單地將傳統敘詞表進行數字化,轉移到網上,而是在敘詞表基本原理和整體框架的基礎上,根據新的信息對象采用相應的技術手段進行有機整合與改進,對敘詞表的結構、方法和技術加以優化與發展。兩者在很大程度上仍有基本的共性。語義網環境下,敘詞表的構建一方面需要繼承傳統敘詞表的經驗和成果,例如概念遴選原則、概念關系類型等,另一方面也需要對編制技術和方法創新,形成適合語義網信息環境的有效組織工具。見表1。

                

                在工程實踐中,敘詞表在語義網時代的發展已經呈現出一些新的特點和趨勢,其主要特征有三點:一是敘詞表構建方式網絡化與半自動化,包括基于網絡環境的多用戶協同編制組織方式、適于網絡信息資源的詞表結構組織框架調整以及計算機輔助編制技術開發,輔助人工提高編制效率,突破了傳統上以手工或者計算機操作的局限,編制效率大大提高;二是敘詞表更新維護的動態化,借助數據挖掘技術從大規模語料庫中進行敘詞表知識內容的動態更新,以及基于用戶交互的敘詞表動態維護更新,知識可快速更新,敘詞表的時效性大大增強;三是敘詞表應用方式的多樣化,包括采用敘詞表進行語義關聯以及在網絡中的開放式應用和規范化共享,用于網絡環境下各類數字化文獻的有效組織和管理,并支撐術語服務、知識圖譜構建等應用。總之,語義網時代,敘詞表構建的自動化、更新的時效性和應用的多樣化,都大大有別于傳統的手工與紙質方式,展現出良好的發展前景。

              作者簡介

              姓名:宋培彥 陳白雪 王星 工作單位:

              轉載請注明來源:中國社會科學網 (責編:閆琪)
              W020180116412817190956.jpg
              用戶昵稱:  (您填寫的昵稱將出現在評論列表中)  匿名
               驗證碼 
              所有評論僅代表網友意見
              最新發表的評論0條,總共0 查看全部評論

              回到頻道首頁
              QQ圖片20180105134100.jpg
              jrtt.jpg
              wxgzh.jpg
              777.jpg
              內文頁廣告3(手機版).jpg
              中國社會科學院概況|中國社會科學雜志社簡介|關于我們|法律顧問|廣告服務|網站聲明|聯系我們
              1 3 8 24 72倍投