本报讯(记者 任洁)教育部、国家语委、中央网信办近日联合印发《关于加强数字中文建设 推进语言文字信息化发展的意见》(以下简称《意见》),提出多项重点任务,到2027年,国家数字中文建设行动取得重要成效,基本建成国家语言文字大数据中心,初步建成国家关键语料库和国家战略语言资源信息库。
在新时代以来语言文字信息化工作成果的基础上,《意见》首次凝练语言文字信息化建设体系的概念,特别提出创新应用自然语言处理、大语言模型、多模态信息处理、知识图谱、语料加工等五项前沿技术,重点服务大语言模型等人工智能技术创新应用“制高点”、夯实国家关键语料基础设施“新基建”。
《意见》提出,加快建设国家语言文字大数据中心,以国家语言资源服务平台建设为基础,带动地方语言资源平台建设。推动基础性语言资源建设,实施国家关键语料库共建共享计划,重点支持建设大规模中文语料库及高质量民族语言文字语料库、手语盲文语料库、行业领域语料库、语言监测动态语料库等。开展战略性语言资源建设,建设国家战略语言资源信息库,重点建设支撑国家安全与发展、服务共建“一带一路”等语言资源。重点推进中国语言资源保护工程数字化建设,开发利用好国家语言地图、中国语言知识图谱、中华精品字库等。
建立产学研用协同培养语言文字信息化相关人才的机制,建设高水平人才队伍。依托国家语言文字关键研究领域领航计划,培养精通语言文字信息化建设的高层次紧缺急需人才。支持高等学校语言学科与多学科深度交叉融合发展,加强“语言+人工智能”复合型人才培养。面向语言文字信息技术产业及未来发展方向,加强高素质技能人才培养。