2 篇文章带有标签 “Embedding”
OpenAI API Documentation Embeddings
嵌入是浮点数的向量(列表)。两个向量之间的距离衡量它们的相关性。小距离表示高相关性,大距离表示低相关性。
注意这上下界对任何维度的向量空间中都适用,而且余弦相似性最常用于高维正空间。例如在信息检索中,每个词项被赋予不同的维度,而一个文档由一个向量表示,其各个维度上的值对应于该词项在文档中出现的频率。余弦相似度因此可以给出两篇文档在其主题方面的相似度。
OpenAI 推荐余弦相似度计算距离。距离函数的选择通常无关紧要,但是,余弦相似度计算距离的速度比欧几里得距离快得多,因为它不需要计算平方根。此外,余弦相似度的范围是[-1,1],而欧几里得距离的范围是[0,∞)。因此,余弦相似度的范围更适合于搜索。
好评例子的评分 : 0.036553
差评例子的评分 : -0.026165
{% highlight wjj %} 值 = 评论的embedding与好评embedding的余弦相似度 - 评论embedding与差评embedding的余弦相似度 值 > 0,倾向于好评 值 < 0,倾向于差评 {% endhighlight %}
| comment | evaluation | |
|---|---|---|
| 0 | 买的银色版真的很好看,一天就到了,晚上就开始拿起来完系统很丝滑流畅,做工扎实,手感细腻,很精致哦苹果一如既往的好品质 | 好 |
| 1 | 降价厉害,保价不合理,不推荐 | 坏 |
{% highlight wjj %} distanc