记者近日从贵阳市大数据交易所获悉,在第七届数字中国建设峰会上,贵数所携手19家数商生态共同发布633个人工智能高质量训练数据集。发布当天就收到多家大模型厂商采购需求,截至目前,已完成2家供需撮合。
本次发布的633个高质量训练数据集,超过75%为全球首发,即首次发布至数据交易场所。这些训练数据来自贵州勘设、贵州新气象、CnOpenData、曼孚科技、中文在线、海天瑞声、中财数碳、晴数智慧、拓尔思、星尘数据、粟特方舟、中国知网、国信数据、药融云、北方健康、数联铭品、宽科、香侬、中科富创19家企业和机构,覆盖 “数据要素×”交通运输、金融服务、工业制造、科技创新等多个重点领域,涉及文字、音频、图片、视频等多种模态,以及TTS、ORC等跨模态数据,为大模型厂商提供了数据养料,降低了采集、清洗、加工、治理模型训练数据的成本。