海天瑞声CEO李科:数据产业正从劳动密集型向技术和知识密集型转变
2025外滩大会探讨数据与AI融合,引领智能时代创新增长
在2025 Inclusion·外滩大会上,业界专家共同探讨了数据与AI的融合,指出数据驱动AI发展,AI推动数据进化,双引擎融合是未来演进方向,专家们分享了关于大模型数据科学、数据质量分析以及数据产业发展趋势的见解。 2025 Inclusion·外滩大会“Data meets AI:智能时代的双引擎”见解论坛上,复旦大学教授肖仰华、上海交通大学特聘教授翟广涛、海天瑞声CEO李科以及上海库帕思科技有限公司董事长山栋明等业界权威专家,就数据与AI的融合发表了精彩观点。
肖仰华教授指出,当前大模型发展面临“数据墙”困境,无标签语料对模型性能提升的贡献逐渐减弱,他认为,大模型数据科学需要从专家经验阶段发展到量化科学、直至自进化阶段,肖教授还分享了通过语法复杂度指标和累积分布采样方法筛选高质量语料的实践,实验结果表明,在领域问答任务上的准确率提升1.7%。

翟广涛教授强调,无论是精炼数据还是合成数据,都需要质量优先,数据质量分析要从“体验质量”入手,考虑人的体验和机器的体验,进而提升大模型性能。
李科CEO从产业实践角度分享了全球AI数据行业的发展趋势,他认为,数据产业正在经历从劳动密集型向技术密集型和知识密集型的重大转型,李科通过动捕数据、自动驾驶标注、思维链数据集等多个实际案例,展示了高质量数据如何服务千行百业。
山栋明董事长表示,模型之变引领“数据质变”,他认为,高质量数据集应满足VALID²(鲜活度、真实性、大样本、完整性、多样性、高知识密度)要求,并详细介绍了语料数据在方法论、基础设施和行业生态三个方面的体系化重构探索。
数据与AI的融合是智能时代创新增长的重要驱动力,在2025外滩大会上,业界专家们共同为数据与AI的融合发展提供了有益的见解和思路,为我国智能产业迈向更高水平奠定了基础。
相关文章:
文章已关闭评论!