向量数据库的应用场景包括哪些?

向量数据库的应用场景包括哪些?

最佳答案 匿名用户编辑于2022/11/30 10:47

向量数据库主要的应用领域如人脸识别、推荐系统、图片搜索、视频指纹、语音处理、自然语言处理、文件搜索等。

1.语音、图像、视频检索

向量检索的第一大类应用就是对语音、图 像、视频这些人类所接触到的,也最为常 见的非结构化数据的检索。 以图片搜索为例,先以离线的方式对所有 历史图片进行机器学习分析,将每一幅图 片抽象成高维向量特征,然后将所有特征 构建成高效的向量索引,当一个新查询 (图片)来的时候,对其进行分析并产出 一个表征向量,然后用这个向量在之前构 建的向量索引中查找出最相似的结果,这 样就完成了一次以图片内容为基础的图像 检索。

2.搜索、推荐、广告

在电商领域的搜索/推荐/广告业务场景中, 常见的需求是找到相似的同款商品和推荐 给用户感兴趣的商品,这种需求绝大多数 都是采用商品协同和用户协同的策略来完 成的。新一代的搜索推荐系统吸纳了深度 学习的 Embedding 的能力, 通过诸如 Item-Item (i2i)、User-Item (u2i)、User- User-Item (u2u2i)、User2Item2Item (u2i2i) 等向量召回的方式实现快速检索。

3.文本检索

上左图以搜索“浙一医院”为例,如果使 用文本分词“浙一”和“医院”,是搜索 不到结果的。如果能够利用对人们历史语 言,甚至历史的点击关联进行分析,建立 起语义相关性的模型,把所有的地址都用 高维特征来表达,那么“浙一医院”和 “浙江大学医学院附属第一医院”的相似 度可能会非常高,因此可以被检索出来。 上右图以搜索“杭州阿里巴巴”的地址为 例,在仅使用文本召回的时候,几乎没办 法找到相似的结果,如果通过对海量用户 的点击行为进行分析,将点击行为加上地 址文本信息合并形成高维向量,这样在检 索的时候就可以天然的将点击率高的地址 召回并排列在前面。

4.几乎覆盖了所有的 AI 场景

向量检索几乎覆盖了大部分的可以应用AI 的业务场景。 例如广告反作弊、人群分析、视频指纹、 版权保护、语音识别、智能问答、地址标 准化、多语言翻译、地理信息、分子结构 分析、生物群落分析等。

参考报告

中国数据库行业分析报告:向量启航,引擎加持.pdf

中国数据库行业分析报告:向量启航,引擎加持。2022年10月的墨天轮中国数据库流行度排行榜火热出炉,本月共有245个数据库参与排名,相比上月新增七个数据库,本月排行榜前十名变动较大:达梦数据库上市程序恢复,热度大涨,排名反超openGauss,重回第三;华为旗下两大数据库品牌名次均下降;云原生数据库PolarDB、TDSQL再创佳绩,名次均上升一位。本月排行榜从第十一名至第三十名,竞争激烈,归属变动较大。在这一赛道中,本月也崛起了一批数据库新秀,拥有亮眼的表现。本月报告中墨天轮发布了最新向量数据库全球产业图谱,国内典型向量数据库代表有Milvus、Vearch、TensorDB、Om-iBAS...

查看详情
相关报告
我来回答