對從事大數據技術研究論證的人來說,想了解大數據術語可以依靠《數典》。
“數典”這一概念由貴陽市首次提出?!稊档洹肥侨蚴撞咳嫦到y(tǒng)研究大數據標準術語的多語種專業(yè)工具書,涵蓋大數據基礎、大數據戰(zhàn)略、大數據技術、大數據經濟、大數據金融、大數據治理、大數據標準、大數據安全、大數據法律九個方面的體系架構。
“在這個架構基礎上,《數典》的詞條選擇堅持專家選詞和權威數據庫相結合,聚焦SCI、SSCI、EI和ISTP四大權威檢索數據庫,并結合中國知網知識發(fā)現網絡平臺中的大數據相關文獻資料,構建了基礎語料庫,同時以專家研究成果為參考,力求詞目的準確性、科學性和實用性。”
《數典》編纂委員會總主編、大數據戰(zhàn)略重點實驗室主任連玉明表示,《數典》從提出到策劃、從研究到出版,涉及研究機構、翻譯機構和專家學者數百人,歷時300多天。開創(chuàng)性地提供11種語言對照,覆蓋全球4大語系、11大語種,語言使用范圍覆蓋全球6大洲的200余個國家和地區(qū),對提升中國大數據的國際話語權和規(guī)則制定權起到了積極作用,也讓貴陽成為了中國大數據發(fā)展的重要策源地。
聯合國教科文組織國際工程科技知識中心在《數典》推薦語的結尾說:“這部《數典》的出版,不僅僅是一部工具書,更是從大數據時代邁向大知識時代的基石之一。”
以《數典》為基礎,貴陽隨即以數典工程為主攻方向開展系列后續(xù)行動,包括加快推進“數典云平臺”“絲路數典通”“數典術語在線”三大平臺研發(fā)。
數典云平臺——
以數典術語庫、數典語音庫、數典知識庫、數典語料庫四大基礎性數據庫為支撐,旨在為世界各國政策制定者、科技工作者和社會公眾,提供便捷、準確、及時的多語種大數據術語知識服務,建立公共數據服務平臺和協同服務環(huán)境,共享前瞻理論研究與技術應用,構建集知識生產、交流協作、咨詢服務為一體的開放式生態(tài)系統(tǒng)。
絲路數典通——
是面向全球各國特別是“一帶一路”沿線國家的大數據多語種標準術語翻譯服務平臺,涵蓋漢語、阿拉伯語、英語、法語、德語、意大利語、日語、韓語、葡萄牙語、俄語和西班牙語等20種語言的標準術語表達,是“一帶一路”數據文化交流的基礎性工程,為世界各國用戶提供便捷、準確的大數據術語知識服務。
數典術語在線——
是全世界中文術語數據規(guī)模最大、數據質量最高、系統(tǒng)性最強的大數據術語權威知識服務平臺,為國內外大數據領域的科研工作者,政府、企事業(yè)單位中從事大數據相關研究和應用的人士提供術語檢索、術語管理(糾錯、征集、分享)、術語提取與標注、術語校對等多元知識服務。該平臺將上線多語種術語譯文,為促進中國科技知識發(fā)展進程、推動大數據標準術語普及、開展海外交流互鑒等作出貢獻,將打造成為中國大數據科技名詞最具權威性和專業(yè)化的服務平臺。
目前,這三大平臺已啟動建設,貴陽還將開發(fā)建設致力于成為中國大數據發(fā)展和全球大數據發(fā)展風向標的“數典貴陽指數”,以及實現文獻內容完全以知識點的形式展現的“數典圖書館”。
(貴州日報天眼新聞記者 楊唯)