中新社贵阳5月27日电 (记者 张伟)2021中国国际大数据产业博览会26日至28日在贵阳举行。“面向南亚东南亚语言资源库”在2021中国国际大数据产业博览会“激活数据要素潜能,加速数字化发展”论坛上正式对外发布。
面向南亚东南亚语言资源库由昆明理工大学、小语智能信息科技(云南)有限公司、提升政府治理能力大数据应用技术国家工程实验室共同发布。
随着“一带一路”建设深入推进,中国和南亚东南亚互动与合作日益紧密,经济走廊建设、国际产能合作、人文交流等领域不断取得新进展。面向南亚东南亚语言的机器翻译有着重要的应用前景。
成果发布单位表示,面向南亚东南亚等资源稀缺语言构建大规模资源库,充分挖掘语言数据资源,提升南亚东南亚语言机器翻译效果对于促进国家之间的政治、经济、文化交流有着重要的作用。
据了解,成果研发机构面向南亚东南亚语言构建了2亿多条双语平行语料、200多万条的双语词典及实体语料库,研发了面向南亚东南亚语言的机器翻译引擎——云岭翻译,该引擎支持中文翻译越南语、泰语等108个语种的双向翻译,翻译准确率高。
成果研发机构还研发了云岭翻译web系统、翻译APP、翻译机、翻译耳机等软硬件产品可以满足不同场景下的应用需求。该项成果已经在网信、旅游等领域得到很好的应用,日均调用量超7.8亿字符。