“ChatGPT、DeepSeek引爆全球AI新浪潮,算力、算法、数据三要素中,数据已成决定模型性能的天花板,AI落地到哪里,高质量数据集就必须同步到哪里。”陶涛说。
陶涛认为,当前,数据供给正从“大而全”转向“优而精”,追求高精度、多模态、严治理;从“烟囱孤岛”走向“可信共享”,构建隐私保护、流通有序的开放体系;从“支撑应用”升级为“驱动智能”,让数据成为模型持续进化的核心引擎。
面向高质量的数据供给,中国移动提出并实践了“5个1”的高质量数据集质量体系。一是高质量数据集的治理方案,包括体系化、工程化、场景化的生产流程;二是建立一支数据标注力量;三是自主研发了一套高质量数据供给管理平台,包括汇聚、清洗、管理的供应链;四是产出高质量的数据集,包括通识、行业专识不同层次的高质量数据集;五是建立跨域共建的产业生态,希望产业各方共同建立高质量数据集。
(《数据供给从“大而全”走向“优而精”》由贵阳日报为您提供,转载请注明来源,未经书面授权许可,不得转载或镜像。)