【数谷贵阳·故事汇】《数典》成为首部大数据工具书

对从事大数据技术研究论证的人来说,想了解大数据术语可以依靠《数典》。

“数典”这一概念由贵阳市首次提出。《数典》是全球首部全面系统研究大数据标准术语的多语种专业工具书,涵盖大数据基础、大数据战略、大数据技术、大数据经济、大数据金融、大数据治理、大数据标准、大数据安全、大数据法律九个方面的体系架构。

“在这个架构基础上,《数典》的词条选择坚持专家选词和权威数据库相结合,聚焦SCI、SSCI、EI和ISTP四大权威检索数据库,并结合中国知网知识发现网络平台中的大数据相关文献资料,构建了基础语料库,同时以专家研究成果为参考,力求词目的准确性、科学性和实用性。”

《数典》编纂委员会总主编、大数据战略重点实验室主任连玉明表示,《数典》从提出到策划、从研究到出版,涉及研究机构、翻译机构和专家学者数百人,历时300多天。开创性地提供11种语言对照,覆盖全球4大语系、11大语种,语言使用范围覆盖全球6大洲的200余个国家和地区,对提升中国大数据的国际话语权和规则制定权起到了积极作用,也让贵阳成为了中国大数据发展的重要策源地。

联合国教科文组织国际工程科技知识中心在《数典》推荐语的结尾说:“这部《数典》的出版,不仅仅是一部工具书,更是从大数据时代迈向大知识时代的基石之一。”

以《数典》为基础,贵阳随即以数典工程为主攻方向开展系列后续行动,包括加快推进“数典云平台”“丝路数典通”“数典术语在线”三大平台研发。

数典云平台——

以数典术语库、数典语音库、数典知识库、数典语料库四大基础性数据库为支撑,旨在为世界各国政策制定者、科技工作者和社会公众,提供便捷、准确、及时的多语种大数据术语知识服务,建立公共数据服务平台和协同服务环境,共享前瞻理论研究与技术应用,构建集知识生产、交流协作、咨询服务为一体的开放式生态系统。

丝路数典通——

是面向全球各国特别是“一带一路”沿线国家的大数据多语种标准术语翻译服务平台,涵盖汉语、阿拉伯语、英语、法语、德语、意大利语、日语、韩语、葡萄牙语、俄语和西班牙语等20种语言的标准术语表达,是“一带一路”数据文化交流的基础性工程,为世界各国用户提供便捷、准确的大数据术语知识服务。

数典术语在线——

是全世界中文术语数据规模最大、数据质量最高、系统性最强的大数据术语权威知识服务平台,为国内外大数据领域的科研工作者,政府、企事业单位中从事大数据相关研究和应用的人士提供术语检索、术语管理(纠错、征集、分享)、术语提取与标注、术语校对等多元知识服务。该平台将上线多语种术语译文,为促进中国科技知识发展进程、推动大数据标准术语普及、开展海外交流互鉴等作出贡献,将打造成为中国大数据科技名词最具权威性和专业化的服务平台。

目前,这三大平台已启动建设,贵阳还将开发建设致力于成为中国大数据发展和全球大数据发展风向标的“数典贵阳指数”,以及实现文献内容完全以知识点的形式展现的“数典图书馆”。(贵州日报天眼新闻记者 杨唯)