2 篇文章带有标签 “Faiss”

Private GPT

Chroma 向量数据库依赖于 sqlite3,而且需要 sqlite3 >= 3.35.0。

制作镜像时,使用的是 python:3.10python:3.10-slim,使用 apt install sqlite3 能够安装的 sqlite3 最高版本是 3.34.1,所以会出现下面的错误。

    import chromadb
  File "/usr/local/lib/python3.10/site-packages/chromadb/__init__.py", line 69, in <module>
    raise RuntimeError(
RuntimeError: Your system has an unsupported version of sqlite3. Chroma requires sqlite3 >= 3.35.0.
Please visit https://docs.trychroma.com/troubleshooting#sqlite to learn how to upgrade.

Troubleshooting LangChain Chroma LangChain Chroma - load data from Vect

OpenAI API Documentation Embeddings

嵌入是浮点数的向量(列表)。两个向量之间的距离衡量它们的相关性。小距离表示高相关性,大距离表示低相关性。

注意这上下界对任何维度的向量空间中都适用,而且余弦相似性最常用于高维正空间。例如在信息检索中,每个词项被赋予不同的维度,而一个文档由一个向量表示,其各个维度上的值对应于该词项在文档中出现的频率。余弦相似度因此可以给出两篇文档在其主题方面的相似度。

OpenAI 推荐余弦相似度计算距离。距离函数的选择通常无关紧要,但是,余弦相似度计算距离的速度比欧几里得距离快得多,因为它不需要计算平方根。此外,余弦相似度的范围是[-1,1],而欧几里得距离的范围是[0,∞)。因此,余弦相似度的范围更适合于搜索。

好评例子的评分 : 0.036553
差评例子的评分 : -0.026165

{% highlight wjj %} 值 = 评论的embedding与好评embedding的余弦相似度 - 评论embedding与差评embedding的余弦相似度 值 > 0,倾向于好评 值 < 0,倾向于差评 {% endhighlight %}

comment evaluation
0 买的银色版真的很好看,一天就到了,晚上就开始拿起来完系统很丝滑流畅,做工扎实,手感细腻,很精致哦苹果一如既往的好品质
1 降价厉害,保价不合理,不推荐

{% highlight wjj %} distanc