【资料图】
2023世界人工智能大会期间,由上海数据交易所、大数据流通与交易技术国家工程实验室承办的“大模型时代下的数据要素流通”主题论坛7月8日在上海世博中心举行。记者从论坛上获悉,上海数交所官网已经于7月7日正式上线语料库,累计挂牌近30个语料数据产品,包含文本、音频、图像等多模态,覆盖金融、交通运输和医疗等领域。
据悉,语料库建设是一件长期性、专业性的工作,需要遵循相应的质量标准和规范,并保持持续更新和扩充,以适应大模型发展的新需求和新挑战。上海数交所作为全国数据要素市场核心枢纽,在助力大模型语料库建设上具有天然的优势。
为更好打造高质量语料库、围绕语料数据共建数商生态,上海数交所牵头发起语料数据生态创新合作伙伴计划,携手首批合作伙伴上海人工智能实验室、商汤科技、中国知网、澜舟科技、OpenKG、拓尔思、新致和蜜度正式启动该计划,积极引导不同行业、不同领域、具有一定规模的高质量语料数据产品挂牌交易,推动人工智能大模型技术创新与应用落地,进一步丰富语料库多样性,助力数据要素市场建设。
上海数交所总经理汤奇峰表示,大模型建设中,语料库是一个非常重要的方向,语料库采购已经在不少大模型企业成本中占据重要比重,上海数交所希望以市场配置的方式组织数据要素推动语料库建设。上海数交所建设语料库主要考虑两个维度,一是语料库的质量,另一个是语料库的开放程度。“比如有的企业具有海量高质量数据资源,开放意愿度也很高,但需要组织大量社会第三方企业帮助组织相关的大模型训练,我们针对四类数据产品开发情况不同、实际需求不同的供方企业制定了差异化工作策略,着力打造语料数据生态。”
(文章来源:上海证券报·中国证券网)
关键词:
- 上海数交所7日正式上线语料库 近30个语料数据产品挂牌
- 西峡县:强化专项整治 构筑安全防线
- 防暑降温费发几个月?防暑降温费的标准是什么?
- 虹瓷科技:淋浴房自清洁涂料的应用前景是什么
- 小米11ultralog
- 古都文旅消费向深度沉浸式转变 新职业、新商圈、新产业链应运而生
- 《原神》琉形蜃境全地图限时挑战位置大全
- 王府井预计上半年净利润同比增29%-42%
- “空天地”一体化监测 野生大熊猫普查不靠“数”要靠“算”
- 【何以中国】文脉颂中华·国潮少年派|从非遗音乐里,听见中华文明的心跳
- 第六届进博会吸引世界500强和行业龙头企业超280家
- 九年建设解决全线“拦路虎” 丽香铁路将于今年内建成通车
- 打通过境通关难点 “澜湄蓉欧快线”构建经济、快捷、稳定通道
- 生态环境部拟出台管理办法规范全国温室气体自愿减排交易
- 美媒:至少38个人权组织反对美向乌提供集束弹药 称将威胁平民生命
- “空天地”一体化监测 野生大熊猫普查不靠“数”要靠“算”
- 市中心20辆车参与飙车,还有啦啦队?警方重拳整治
- 打通过境通关难点 “澜湄蓉欧快线”构建经济、快捷、稳定通道
- 乌克兰总统泽连斯基到访蛇岛
- 形成促进节能与新能源汽车协调发展的市场化机制——新能源汽车积分新规出台