1 篇文章带有标签 “OpenAI-API-Embedding”

OpenAI API Documentation Embeddings

嵌入是浮点数的向量(列表)。两个向量之间的距离衡量它们的相关性。小距离表示高相关性,大距离表示低相关性。

注意这上下界对任何维度的向量空间中都适用,而且余弦相似性最常用于高维正空间。例如在信息检索中,每个词项被赋予不同的维度,而一个文档由一个向量表示,其各个维度上的值对应于该词项在文档中出现的频率。余弦相似度因此可以给出两篇文档在其主题方面的相似度。

OpenAI 推荐余弦相似度计算距离。距离函数的选择通常无关紧要,但是,余弦相似度计算距离的速度比欧几里得距离快得多,因为它不需要计算平方根。此外,余弦相似度的范围是[-1,1],而欧几里得距离的范围是[0,∞)。因此,余弦相似度的范围更适合于搜索。

好评例子的评分 : 0.036553
差评例子的评分 : -0.026165

{% highlight wjj %} 值 = 评论的embedding与好评embedding的余弦相似度 - 评论embedding与差评embedding的余弦相似度 值 > 0,倾向于好评 值 < 0,倾向于差评 {% endhighlight %}

comment evaluation
0 买的银色版真的很好看,一天就到了,晚上就开始拿起来完系统很丝滑流畅,做工扎实,手感细腻,很精致哦苹果一如既往的好品质
1 降价厉害,保价不合理,不推荐

{% highlight wjj %} distanc