标准编号:T/AI 115.2-2024
标准名称:信息技术 神经网络表示与模型压缩 第2部分:大规模预训练模型
发布部门:中关村视听产业技术创新联盟
起草单位:北京大学、鹏城实验室、华为技术有限公司、北京百度网讯科技有限公司、厦门大学、杭州海康威视数字技术股份有限公司、中国电子技术标准化研究院、铁塔智联技术有限公司、中国科学院自动化研究所、中科南京人工智能创新研究院、北京智源人工智能研究院、美的集团股份有限公司
发布日期:2024-12-30
实施日期:2024-12-30
标准状态:现行
标准格式:PDF
文件大小:2.10 MB
内容简介
本文件规定了适应多种计算机要求的大规模预训练的基础表示、压缩表示和封装表示,以及其对应的压缩流程、适配流程、封装流程和模型传输与分发。
本文件适用于大规模预训练模型的研制、开发过程,以及在端云领域的高效应用。注:对于本文件规定的表示与模型压缩方法不要求机器学习框架原生支持,可以通过转换、工具包等形式支持。
本文件适用于大规模预训练模型的研制、开发过程,以及在端云领域的高效应用。注:对于本文件规定的表示与模型压缩方法不要求机器学习框架原生支持,可以通过转换、工具包等形式支持。
下载地址