你有没有发现,现在 AI 越来越懂我们?能精准听懂我们的语言,快速识别图片内容,背后全靠“数据”在发力。
简单说,数据就是让 AI 变聪明的“燃料”——就像汽车要跑需要汽油,AI 要好用就得靠海量、准确的数据。数据越全、越靠谱,AI 就越聪明,越能帮产业提效升级。现在,杭州上城区已经抢先一步,开始给 AI、给相关产业准备“高品质燃料”了。昨天,上城区和火山引擎要一起建“杭州高端数据标注基地”,首期 1.3 万平方米的场地已经正式投入使用。
什么是数据标注?其实就是给“杂乱的数据”做“分类整理”。比如把一堆照片里的人物、物品分别标出来,把一段语音里的文字准确转写出来,把零散的信息梳理成有价值的“术语集”。这些整理好的数据,才能真正赋能企业、赋能产业。
现场还发布上城区首批数据企业“伙伴圈”,共 8 家成员单位,涵盖头部数据企业、行业协会及本土科技公司,比如为杭州火山引擎科技有限公司、北京海天瑞声科技股份有限公司、国际数据管理协会(DAMA)大中华区等。 火山引擎浙苏皖区域负责人陈虔炜介绍,火山不仅是技术提供者,更是“链主”生态构建者,将联动超过 300 家生态合作伙伴,为上城导入优质产业资源,形成技术、数据、场景协同发展的产业网络。
“我们对海量数据进行分类、清洗,通过标注识别有价值的高质量术语集,让这些数据赋能数据产业链上下游发展。”北京海天瑞声科技股份有限公司浙江区总经理韩义武介绍,“以前我们专注于数据服务,现在有了算力伙伴、应用场景伙伴,大家一起协作,产业效率会更高。”
有了智能“引擎”,更需配套“跑道”与“燃料”。上城区推出全方位“数据产业服务包”:释放 20 个数据应用场景;升级“上城‘数十二条’”,算力补贴最高 2000 万元,领军人才安家补助 600 万元;火山引擎开放 Coze 智能体平台、TRAE 智能编码等高端工具,惠及中小企业;联合杭州联合银行推出“上城・创享贷”,启动期纯信用贷最高 50 万元。
当前,国家明确提出“深入推进数字中国建设,提升数智化发展水平”,聚焦高质量数据集建设、AI“模芯云用”协同创新。上城区目前已集聚超4000家数据企业,此次布局高端数据标注基地,也是上城探索数据产业发展的先行先试,旨在构建数据采集、标注、应用、治理一体化的完整产业生态高地。