近日,国家发展改革委、国家数据局、财政部、人力资源社会保障部联合印发《关于促进数据标注产业高水平发展的实施建议》(以下简称《实施意见》)。
《实施意见》提出,到2027年,数据标注产业专业化、智能化及科学技术创新能力显著提升,产业规模大幅跃升,年均复合增长率超过20%,培育一批具有影响力的科技型数据标注企业,打造一批产学研用联动的创新载体,建设一批成效明显、特色鲜明的数据标注基地,形成相对完善的数据标注产业生态,构建创新要素聚集、产业链上下游联动、区域协同发展的新格局。
据悉,数据标注产业是对数据来进行筛选、清洗、分类、注释、标记和质量检验等加工处理的新兴起的产业。培育壮大数据标注产业对于提升数据供给质量,推动AI创新发展具备极其重大支撑作用。
《实施意见》围绕深化需求牵引、增强创新驱动、繁荣产业生态、优化产业支撑四个方面,提出13条举措。
在深化需求牵引方面,《实施意见》提出,释放公共数据标注需求,深化AI在政务服务、城市治理、乡村振兴等领域应用,编制公共数据标注目录,依法依规有序推动公共数据标注与开发利用。挖掘企业数据标注需求,支持数据要素赋能产业转型升级,深挖公司制作管理全流程数据标注需求。
在增强创新驱动方面,《实施意见》提出,开展关键技术攻关,依托国家重点研发计划、国家科技重大专项等,加强跨领域跨模态语义对齐、4D标注、大模型标注等数据标注领域的关键技术攻关应用。健全数据标注标准,围绕数据标注关键环节,结合文本、图像、视频、语音等多模态数据标注需求,建立数据标注标准体系框架,制定数据标注技术、质量、能力等国家标准。打造高水平创新载体,培育建设数据标注领域重点实验室、技术创新中心等,加强基础研究和前沿技术探索。
在培育繁荣生态方面,《实施意见》提出,着力壮大经营主体,培育一批数据标注有突出贡献的公司,鼓励通过资源整合、并购重组等方式做大做强。积极完善产业生态,畅通数据采集、标注、AI应用产业链,推动数据标注产业上下游协同发展。强化带动引领作用,鼓励和支持数据标注基地先行先试,打造一批科学技术水平高、资源集聚强、辐射带动广的典型样板。深化国际交流合作,开展数据标注科学技术人才国际交流。深化数据标注领域技术及产业国际合作。
在优化支撑体系,《实施意见》提出,加大财税金融支持力度,提升标注公共服务能力,加强标注人才队伍建设,并促进标注产业安全发展,建立完整数据标注安全性风险识别、监测预警、应急响应等相关规范,落实数据标注全过程相关主体的安全责任。
注:数据标注到底是做什么的?今天的数据标注产业和过去有什么不同?为啥说数据标注产业是新兴产业?
数据标注,简单来说,就是给文本、语音、图片、视频等各种各样的数据“打标签”。
这里是北京的一个数据标注基地,每天要处理的数据量非常大,但这里的人实际上并不多。这是因为很多数据标注工作都交给机器来干了。差不多三年前,这个行业的自动化率只有30%左右,现在,平均的自动化超过60%。数据标注产业正在从传统的劳动密集型产业转向知识密集型产业。
数据标注员是一个新工种,已经被国家认可。现在这个行业又招了不少有医疗、金融、法律等等专业背景的人才。这是因为这一些年,智慧医疗、金融科技等等的应用愈来愈普遍,那就需要给医学影像、金融文本等等做数据标注。有一个测算,未来五年,我们的祖国专业数据标注人才的需求将达到100万人以上。
语音转写、图片文字识别、购物网站上的个性化推荐等等,这些都是要使用到数据标注的传统领域。而现在,数据标注企业接到的大量订单都来自垂直大模型公司,包括做AI助手的、做文生视频的,标注的内容也更丰富,有时候还要对一段视频的情感色彩、人物行为意图等等做标注。
特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。
真在偷听!一聊啥手机App就推啥,上海市政协常委:处罚太轻!主管部门回应
原本计划一年卖100万辆的Cybertruck,现在一年卖了3万5?为什么
3-0!英超最火队刹不住:6轮全胜,狂野18-1,7500万锋霸12场13球
5-2!5-1!疯狂巴萨2场10球,59岁弗里克神了:场均3球 66年神迹