东谈主工智能正重构民众产业格式,同期也带动一些新兴产业快速发展,数据标注即是其中之一,阛阓已对此展现出强盛需求。
3月20日,由工业和信息化部电子第五征询所、中国出动通讯集团信息时刻中心、航天科工收集信息发展有限公司联结主理的“2025年数据标注产业供需对接会”在四川成都召开。
供需对接会现场,12亿元数据标注业务协作意向签约。其中,由韶关市推动的策略协作以6600万元的签约金额成为本日单体金额最大协作技俩。
自动驾驶、医疗医药等行业已初始探索
所谓数据标注,是指对数据进行筛选、清洗、分类、精明、象征和质料闇练等加工处理的进程。国度发展翻新委等部门旧年底发布《对于促进数据标注产业高质料发展的实施见解》(以下简称《见解》),明确将数据标注称为新兴产业。
“数据标注是擢升数据供给质料的要津轨范,是擢升东谈主工智能产业竞争力的先手棋。”四川省大数据中心副主任、四川省大数据尺度化时刻委员会主任委员周学立在对接会现场说。
工信部电子五所东谈主工智能中心主任孔德智对《逐日经济新闻》记者示意,数据标注将无序的“潜在资源”改造为可被算法联接的“优质原料”,为机器学习提供精确的学问标签,胜利决定模子教师的质料和效果。举例,OpenAI在教师ChatGPT时干预数千东谈主力和数亿资金用于标注,确保模子联接东谈主类教导的准确性和可靠性。
“在阛阓和政府的协同作用下,我国的标注产业照旧进入快速发展阶段。”国度数据发展征询院院长胡坚波现场示意,数据标注在自动驾驶、医疗医药等界限,结合东谈主工智能大模子,已构建起面向企业和个东谈主的诈欺模式,成为在数据标注产业中较早的探索,且已较隆重。
胡坚波还提到,动力、交通、矿产、地质勘测等行业积聚了大量专科数据,这些行业资金基础较好、专科团队完善,通过东谈主工智能惩办行业性全局问题的后劲壮健,他们在数据标注界限正快速发力。低空经济、具身智能等昔日产业,也在积极开展关系责任。
加速鼓动数据标注表率化与尺度化
2024年4月,国度数据局笃定了7个数据标注基地,诀别是成都、沈阳、合肥、长沙、海口、保定、大同。抑制当今,七地数据标注总范围达到17282TB,配资门户额外于中国国度藏书楼数字资源总量的6倍把握。
国度数据局示意,7个数据标注基地的标注从业东谈主员达5.8万东谈主,带动数据标注行业关系产值杰出83亿元。
不外,天然数据标注在快速发展,但仍处于初期阶段,仍有不少方面待完善。
胡坚波提议,要加速鼓动行业数据标注责任的表率化与尺度化,带领数据尺度高下流轨范对接和协作;况且要加强数据标注时刻的研发和本质,加强对基于生成式AI的合成数据的自动化标注。
孔德智示意,我国正通过政策带领和时刻攻关,推动数据标注从服务密集型向学问密集型转型,为东谈主工智能创新发展提供要津撑合手。
他提议,现时数据标注产业应强化时刻创新,要点粉碎跨模态语义对王人、大模子标注等中枢时刻,研发智能化标注用具,擢升标注效果;同期,优化生态布局,种植龙头企业与中小企业协同发展的产业链,推动数据标注基地诞生,变成区域示范效应。
他还提到,应支合手高校开设标注关系课程,联动需求企业确立产教交融实训基地,惩办东谈主才缺口问题。另外,还应保险数据安全,构建分类分级保护轨制,强化秘籍保护和风险防控,推动标注数据合规流畅。