人工智能大模型是目前数字经济发展新的行业风口,离不开数据、算力、算法的强力支撑。数据,是人工智能最关键的要素,而数据标注员则是人工智能的老师。在贵州,不仅有行业领先的数据标注企业,还有易地扶贫搬迁社区的AI豆计划,不同地区、不同行业的他们如何拥抱“人工智能+”,一起来看。
贵州梦动科技有限公司实训研发部负责人 赵杰
贵州梦动科技有限公司实训研发部负责人赵杰:现在我们看到的大模型,从原来传统的只是指令性的,比如1+1=2这样的一种方式,现在转变为我们给了一些情感类的关键词的时候,它能够输出适配我们当下心情的内容,比如说“今天的天气很明媚,我的心情很好”,就这几个关键词,它就给我们生成这样一个听上去很愉悦的歌曲。
当前,大模型正处在产业落地前期,高质量的数据,是大模型实现产业化的关键要素。生成式AI不仅需要海量的数据训练,更需要人工不断标注,对大模型生成的内容进行评价、反馈,让大模型学习人类的思维方式,更加智能。
贵州梦动科技有限公司实训研发部负责人 赵杰
赵杰告诉记者,这些大模型的背后需要不断去训练,原来20公里的地图,可能需要50万的数据,但是现在大模型至少要达到百万级的数据才能够把它训练好。
百鸟河数字小镇
梦动科技位于惠水县百鸟河数字小镇,2014年创立至今已成为国内数据处理服务行业的第一梯队企业,年营收过亿,客户包括百度、阿里、亚马逊、美团等众多互联网大厂,而拿下这些大客户的秘诀就是校企合作。对于数据标注这样的企业来说,人越多,意味着可以处理的数据就越多。
贵州梦动科技有限公司创始人 盛华
贵州梦动科技有限公司创始人盛华介绍,梦动的核心优势是把客户对于做数据服务的需求,创新做了产教深度融合的人力资源解决方案,公司每年会吸纳五六百个学生到企业实习,全职人员每年都有上百个以上的岗位提供给毕业生。
梦动科技与盛华职业学院深度合作,成立了项目班,采取项目驱动化教学,这也给梦动科技提供了丰富的人力资源。对于学生来说,上课就是上班,老师就是经理,业绩就是成绩。
贵州盛华职业学院产创班学生 罗佳铭
贵州盛华职业学院产创班学生罗佳铭说,早上上课、下午就做项目实践,整个项目是真实要交付的,而且还有补贴,所以来实习提升得很快,对他们以后找工作会有很大的帮助。
惠水县依托梦动科技公司的资源优势,打造了国家级高校毕业生见习基地,以数字小镇、创业孵化基地为载体,正积极创建全省数据标注产业发展示范区。
惠水县工业和信息化局副局长 李惠忠
惠水县工业和信息化局副局长李惠忠介绍,百鸟河数字小镇已经入驻的数据标注企业达到14家,从业人员超过1000人,目前县内拥有的3所高校有4万人左右,惠水有信心把数据标注行业做到全省最大的数据标注基地。
惠水县副县长 金梅
惠水县副县长金梅表示,目前整个数字小镇的产值是6个亿左右,在下一步的工作当中,以人工智能支撑产业为重点来培育数字经济新质生产力,准备精准谋划一批能落地见效的企业,招引一批在数字经济,有核心资源和关键技术的优质企业,进一步壮大数字经济创新的人才队伍。
在铜仁市,也有一群人从事着数据标注产业。2019年,阿里巴巴联合中国妇女发展基金会启动AI豆计划,并将万山区作为全国第一个试点,吸纳当地易地扶贫搬迁户从事数据标注工作。除了提供技术和培训支持外,每年还向试点基地输送近1000万元产值标注订单,而数据标注师的工作就是将图形的关键点一一标注,让计算机建立起对图形的认知。
铜仁旺家信息技术有限公司标注师、搬迁群众 陈霞
铜仁旺家信息技术有限公司标注师、搬迁群众陈霞告诉记者,教无人驾驶怎么去行驶,怎么去辨别东西,就像教小孩一样,从它什么都不会到它什么都会的一个过程,让她很有成就感。并且她的收入高的时候每月拿1万多元,平均值都是在5千多元。
在这家公司,像陈霞一样的标注师有80多个,其中一半是社区的易地扶贫搬迁户,女性员工占比超过一半。公司成立五年来,一路成长。
铜仁旺家信息技术有限公司技术主管 安永军
铜仁旺家信息技术有限公司技术主管安永军介绍,自己刚接触这个行业的时候是从2D图片开始,现在在做3D,也在逐步去探索关于4D的一些项目,3D扫描最远的可能就在300米左右,但是4D能达到1.5公里,百度的萝卜快跑、无人驾驶出租车等等一些数据是由他们提供标注的。
铜仁旺家信息技术有限公司经理 白松
铜仁旺家信息技术有限公司经理白松表示,随着技术的不断积累,公司也得到了市场的认可,在数据饱和的情况下,每年至少能创造500万的产值。
目前,铜仁市的数据标注场景主要应用于自动驾驶领域,未来,当地将扩展大模型、智慧安防、新零售、AI教育等应用领域,打造数据标注新场景。
铜仁市大数据发展管理局副局长 王贵
铜仁市大数据发展管理局副局长王贵表示,下一步他们工作的重点是整合人才、能源、住房等要素保障,打造数据标注产业园,通过对接东莞、苏州、北京、上海等地与华为、百度、京东等大型互联网企业,人工智能创新型企业共同合作,培育高中低多层次的数据标注产业,探索开展数据标注相关标准制定,打造铜仁数据标注产业品牌。
今年的政府工作报告提出,贵州将抓住人工智能重大机遇,推动数字经济实现质的突破,数字经济占比达45%以上、规模突破万亿元。贵州将加快抢占未来产业新赛道,加快发展数据标注、模型训练等人工智能基础产业,力争新兴数字成长型企业突破800家,塑造数字经济发展新优势。
来源:铜仁台 万山融媒 黔南台 惠水融媒