🗒️Milvus向量数据库常见用法
00 分钟
2023-7-2
2024-6-29
type
status
date
summary
slug
tags
category
password
URL
icon

创建/断开客户端连接

管理Collection

创建Collection

主要参数:
Parameter
Description
Option
using (optional)
By specifying the server alias here, you can choose in which Milvus server you create a collection.
N/A
shards_num (optional)
Number of the shards for the collection to create.
[1,16]
num_partitions (optional)
Number of logical partitions for the collection to create.
[1,4096]
*kwargs: collection.ttl.seconds (optional)
Collection time to live (TTL) is the expiration time of a collection. Data in an expired collection will be cleaned up and will not be involved in searches or queries. Specify TTL in the unit of seconds.
The value should be 0 or greater. 0 means TTL is disabled.

重命名Collection

修改Collection属性

获取Collection各类属性

删除一个集合(集合内的所有数据都被删除)

管理分区(Partitions)

使用分区可以更有效地组织和查询数据:我们可以将数据插入到特定的分区中,然后可以在查询时只查询和加载该分区,从而提高查询效率和减少资源占用。

创建分区

判断分区是否存在

删除分区(先释放再删除)

加载分区

释放分区

管理数据

插入数据

删除数据

管理索引

矢量索引是用于加速矢量相似性搜索的元数据的组织单元。如果没有基于向量构建的索引,Milvus将默认执行暴力搜索

创建矢量索引

创建标量索引

标量索引不需要设置索引类型以及索引参数,直接创建即可。

删除索引

删除索引是删除该集合下的所有索引文件

搜索与查询

向量相似性搜索

Milvus中的向量相似度搜索会计算查询亮相与具有指定相似度度量的集合中的向量之间的距离,并返回最相似的结果。
必要的搜索参数
范围
描述
data
用于搜索的向量。
anns_field
要搜索的字段的名称。
param
特定于索引的搜索参数。有关详细信息,请参阅https://milvus.io/docs/index.md
offset
返回集中要跳过的结果数。该值与“limit”之和应小于 16384。
limit
要返回的最相似结果的数量。该值与“offset”之和应小于 16384。
expr
用于过滤属性的布尔表达式。有关详细信息,请参阅https://milvus.io/docs/boolean.md
partition_names(选修的)
要搜索的分区名称列表。
output_fields(选修的)
要返回的字段的名称。当前版本不支持矢量场。
timeout(选修的)
允许 RPC 的持续时间(以秒为单位)。当设置为 None 时,客户端会等待服务器响应或发生错误。
round_decimal(选修的)
返回距离的小数位数。
consistency_level(选修的)
搜索的一致性级别。

向量标量查询

上一篇
国庆AIGC小结
下一篇
langchain简版教程附案例