>首页> IT >

大模型带火数据训练 AI原生向量数据库趋热|热推荐

时间:2023-07-04 22:23:29       来源:腾讯网

《科创板日报》7月4日讯(记者 张洋洋)大模型正在带火多个细分赛道。


(相关资料图)

今日下午,腾讯云发布AI原生(AI Native)向量数据库Tencent Cloud VectorDB,该数据库面向大模型场景,8月将在腾讯云官网正式上线。

据介绍,向量数据库是专门用来存储和查询向量的数据库,利用这类数据库来存储和查询数据,可以极大提升效率和降低成本。

腾讯云数据库副总经理罗云称,腾讯云发布的AI原生向量数据库,面向大模型训练、推理和知识库补充等场景,并且在接入层、计算层、存储层均已实现了全面AI化。

大模型正在加速进入各行业,但这些模型往往包含数十亿甚至更高参数,参数规模较大训练成本高昂,并且都是预训练模型,对于训练截止日之后发生的事情一无所知。

根据腾讯给出的数据,腾讯云向量数据库用于大模型预训练数据的分类、去重和清洗,相比传统方式可以实现10倍效率的提升,如果将向量数据库作为外部知识库用于模型推理,则可以将成本降低2-4个数量级。企业原先接入一个大模型需要花1个月左右时间,使用向量数据库后,3天时间即可完成,极大降低了接入成本。

与腾讯的大模型发展路径类似,本次面向大模型场景的向量数据库,也是首先在腾讯生态内产品得到应用。

据腾讯PCG大数据平台部搜索推荐Senior Tech Lead郑伟介绍,腾讯云向量数据库目前已经应用在了腾讯视频、QQ浏览器、QQ音乐等30多款腾讯生态产品中,能有效助力产品提升运营效率

数据显示,使用腾讯云向量数据库后,QQ音乐人均听歌时长提升3.2%、腾讯视频有效曝光人均时长提升1.74%、QQ浏览器成本降低37.9%。

在大模型的数据训练需求催化之下,向量数据库概念于今年4月开始走红市场。

首先,今年4月多家向量数据库创业公司获大额新融资,引发市场热议。据华福证券梳理,随着大模型带来的应用需求提升,4月以来多家海外知名向量数据库创业企业获得融资。

4月6日Chroma获1800万美元种子轮融资;

4月19日Qdrant获750万美元种子轮融资;

4月22日,向量数据库平台Weaviate宣布获得5000万美元(约3.5亿元)B轮融资,由Index Ventures领投,Battery Ventures等跟投;

4月28日,向量数据库平台Pinecone宣布获得1亿美元(约7亿元)B轮融资,由Andreessen Horowitz领投,ICONIQ Growth等跟投。

行情方面,星环科技、北交所云创数据等公司股价连续异动,其中云创数据自底部以来股价已接近翻倍。

腾讯向量数据库产品的酝酿,几乎与市场时间同步。

罗云在《科创板日报》等媒体采访时表示,3月份,在看到向量数据库能够支持大模型做信息召回、弥补没有长期记忆等问题时,当时团队就判断,基于腾讯的积累对外单独提供一个更大规模企业级的向量数据库,有优势,市场也有需求。

东北证券指出,向量数据库市场空间巨大,目前处于从0-1阶段,预测到2030年,全球向量数据库市场规模有望达到500亿美元,国内向量数据库市场规模有望超过600亿人民币。

商业模式上,罗云表示,腾讯云的向量数据库会作为一个单独的产品在官网售卖,也可能会与其他解决方案和产品打包一起售卖,两种模式并不冲突。

一定程度上,腾讯云向量数据库的推出,是跟随大模型的浪潮,细分行业未来的发展路径也将受制于此。

罗云表示,向量数据库的能力已经能够适应客户诉求了,核心卡点就在于,如何去用好AI,国内大模型的发展,其实都还有一个时间周期,外部的市场环境会导致向量数据库的大规模发展应用还没有那么快。

(科创板日报记者 张洋洋)

关键词: