【大河财立方 记者 王宁宁 深圳报谈】9月11日,大河财立方记者从深圳数据来回所获悉,近日深译科技在深圳数据来回所换取下发布了寰球首个高价值、多模态、多语种AI算料数据钞票包,估值逾越2亿元。
动作珠海市新质坐褥力及东谈主工智能数据身分代表性企业,深译科技将充分剖析数据身分乘数效应,进一步鼓动东谈主工智能技能生态的发展与确立,为珠海“云上智城”奠定AI产业数据身分基础。
鼓动寰球首批大模子产物上市来回
自2023年ChatGPT 4.0版块追究发布以来,我国东谈主工智能产业步入高速发展阶段,截止2023年底,中国东谈主工智能中枢产业的界限已接近6000亿元,如盘古、智谱AI、文心一言等通用型大模子与细分行业大模子商用化日益老到。
据寰球组织机构长入社会信用代码数据作事中心统计,2024年上半年我国东谈主工智能企业数目同比增长35.65%,而AI赋能千行百业的中枢基础恰是语料数据的束缚丰富与完善。
面前国内语料数据文本量仅占寰球的1.3%,自2023年4月以来,深圳数据来回所加速鼓动国表里高质地语料数据网罗,先后联合深译科技、华为、华傲科技等语料与东谈主工智能优质厂商构建“怒放算料定约”,发布涵盖12个“数据身分×”界限,包括文本、图像、音频、视频、多模态、3D、GIS等多种数据模态,由42家不同的数据商提供的1000个非开源、可商用的垂直行业多模态算料集,其中大部分算料为寰球首发。
与此同期,深圳数据来回所改进鼓动了东谈主工智能数据专区、怒放群岛开源社区大模 SIG确立,领先罢了首批国度备案大模子公司入场,鼓动寰球首批大模子产物上市并完成场内数据商品来回。
体系化赋能“数据丝绸之路”高质地确立
动作深圳数据来回所东谈主工智能语料界限的重心团合资伴,深译科技董事长林余楚在举止中示意,公司依托澳门大学、澳门科技大学等澳门高校的科研力量和东谈主才体系,束缚改进打造了自研的数据引擎——深数引擎(Deep Data Engine),构建了闭环数据采标SOP、海外化众包平台、AI标注等坐褥历程和用具,并千里淀辘集大批自有产权AI大模子全产业拓荒磨真金不怕火的多言语数据集。
动作深耕大语种专科界限及小语种语料数据的数据身分企业,深译科技已罢了“一带一都”沿线产业整合,在葡语系、一带一都小语种界限,数据集数目和质地均处于行业第一梯队。同期,通过产业体系构建,深圳数据来回所与深译科技正在加速鼓动沿线“数据丝绸之路”确立。
为反馈国度数据身分市集发展,构建踏实高效的数据身分产业链,深圳数据来回所抓续谀媚优质数据钞票化第三方作事生态。
记者获悉,2024年7月,深圳数据来回所与深译科技联袂法律合规机构、钞票评估机构、数据质地评估机构等生态团合资伴,共同围绕深译科技现存超40pb高质地语料数据开展由资源盘货与合规审核上市到数据钞票入表的全历程归拢,鼓动深译科技数据资源向数据身分到数据钞票的体系化蜕变。
林余楚示意,在深圳数据来回所的主导下,历时近一年时分,深译科技两个模态的数据钞票包顺利完成合规审查、上市入表等责任,并通过中评协评估估值2.04亿元。举止现场,深译科技还展示了公司的数据身分一张图及深译科技大模子平台Deepaas等产物。
责编:刘安琪 | 审校:陈筱娟 | 审核:李震 | 监审:万军伟