标准编号:T/GBC 122-2026
标准名称:东盟国家语料库 建设规范
发布部门:广西物品编码与标准化促进会
起草单位:中国—东盟信息港股份有限公司、广西壮族自治区标准技术研究院、老挝科技与通信部数字政府管理中心、老挝工业与贸易部标准化与计量司、阿里云计算有限公司、科大讯飞股份有限公司、浪潮云信息技术股份公司、联通数据智能有限公司、北京面壁智能科技有限责任公司、三六零科技集团有限公司、中国移动通信集团广西有限公司、中兴通讯股份有限公司、广西达译科技有限公司、安徽飞数信息科技有限公司、老挝国立大学、北京海天瑞声科技股份有限公司、杭州君同未来科技有限公司、广西民族大学、北京晴数智慧科技有限公司、数据堂(北京)科技股份有限公司、整数智能信息技术(杭州)有限责任公司、马来西亚Maxeon科技、北京智源研究院、北京火山引擎科技有限公司、马来西亚Agmo集团、印度尼西亚AiSENSUM公司、广西大学、越南河内国家大学所属社会科学与人文大学、泰国INTERVECCenter、上海人工智能创新中心、泰中科技协会、泰国清迈职业技术学院、泰国北部职业教育推广与发展中心、央视国际网络有限公司、北京邮电大学、泰国彭世洛职业学院、人工智能省部共建协同创新中心(浙江大学)
发布日期:2026-03-31
实施日期:2026-04-30
标准状态:现行
标准格式:PDF
文件大小:486.36 KB
内容简介
本文件提供了东盟国家文本及语音语料库建设全生命周期的指导和建议,规定了建设规划、语料采集、语料预处理、语料标注、验证集构建、语料质检和语料存储和管理等内容。
本文件适用于东盟国家语料库的建设工作。
本文件适用于东盟国家语料库的建设工作。
下载地址
