LLM Leaderboard

2023-09-09 less than 1 minute read

LLM

Embedding 模型

Massive Text Embedding Benchmark (MTEB) Leaderboard

piccolo是一个通用embedding模型(中文), 由来自商汤科技的通用模型组完成训练。piccolo借鉴了E5以及GTE的训练流程，采用了两阶段的训练方式。在第一阶段中，我们搜集和爬取了4亿的中文文本对(可视为弱监督文本对数据)，并采用二元组的softmax对比学习损失来优化模型。在第二阶段中，我们搜集整理了2000万人工标注的中文文本对(精标数据)，并采用带有难负样本的三元组的softmax对比学习损失来帮助模型更好地优化。

BAAI/bge-large-zh

FlagEmbedding 将任意文本映射为低维稠密向量，以用于检索、分类、聚类或语义匹配等任务，并可支持为大模型调用外部知识。

不同的任务

google/owlvit-base-patch32

参考资料

Open LLM 排行榜近况
LLM-Leaderboard
LLM Leaderboard
Llama 2 来袭 - 在 Hugging Face 上玩转它
Awesome-Chinese-LLM

LLM Leaderboard

Leaderboards

LLM

Open LLM Leaderboard

Qwen-7B

ChatGLM2-6B

Embedding 模型

Massive Text Embedding Benchmark (MTEB) Leaderboard

sensenova/piccolo-large-zh

BAAI/bge-large-zh

不同的任务

参考资料