心情随笔
💯个人开源工具
00 分钟
2024-7-3
type
status
date
summary
slug
tags
category
password
URL
icon
 

SemanticSearch

SemanticSearch 是一个用于计算语义相似度的 Java SDK,开源且免费。它默认使用 Hugging Face 的模型(Nomic-embed-text-v1,强于OPENAI的text-embedding-ada-002和text-embeddings-v3-small)来生成句子的向量表示,并计算字符串之间的语义相似度,您可以根据实际情况切换任意ONNX格式的模型。详情可见https://github.com/luxinfeng/SemanticSearch
Name
SeqLen
MTEB
LoCo
Jina Long Context
Open Weights
Open Training Code
Open Data
nomic-embed-text-v1
8192
62.39
85.53
54.16
jina-embeddings-v2-base-en
8192
60.39
85.45
51.90
text-embedding-3-small
8191
62.26
82.40
58.20
text-embedding-ada-002
8191
60.99
52.70
55.25
上一篇
数据增强——在图片中添加遮挡物
下一篇
ThreadLocal里的变量一定是线程独享的吗?