2 篇文章带有标签 “pretraining”

2024年9月22日星期日

Qwen2.5-Coder Technical Report

Abstract(摘要)

In this report, we introduce the Qwen2.5-Coder series, a significant upgrade from its predecessor, CodeQwen1.5. This series includes two models: Qwen2.5-Coder-1.5B and Qwen2.5-Coder-7B. As a code-specific model, Qwen2.5-Coder is built upon the Qwen2.5 architecture and continues pretrained on a vast corpus of over 5.5 trillion tokens. Through meticulous data cleaning, scalable synthetic data generation, and balanced data mixing, Qwen2.

2024-09-22 08:00

qwen2.5-coder code-llm code-generation pretraining instruction-tuning benchmarks 代码大模型技术报告

2024年2月15日星期四

Hugging Face NLP Course

NLP Course

1. TRANSFORMER 模型

自然语言处理

NLP 是语言学和机器学习交叉领域，专注于理解与人类语言相关的一切。 NLP 任务的目标不仅是单独理解单个单词，而且是能够理解这些单词的上下文。

以下是常见 NLP 任务的列表：

对整个句子进行分类:
- 获取评论的情绪
- 检测电子邮件是否为垃圾邮件
- 确定句子在语法上是否正确
- 确定两个句子在逻辑上是否相关
对句子中的每个词进行分类:
- 识别句子的语法成分（名词、动词、形容词）
- 识别句子的命名实体（人、地点、组织）
生成文本内容:
- 用自动生成的文本完成提示
- 用屏蔽词填充文本中的空白
从文本中提取答案:
- 给定问题和上下文，根据上下文中提供的信息提取问题的答案
从输入文本生成新句子:
- 将文本翻译成另一种语言
- 总结文本
语音识别:
- 生成音频样本的转录
计算机视觉:
- 生成图像描述
- 目标检测

Transformers 能做什么？

Transformers 库中最基本的对象是 pipeline() 函数。它将模型与其必要的预处理和后处理步骤连接起来，使我们能够通过直接输入任何文本并获得最终的答案：

2024-02-15 08:00

huggingface nlp transformers transfer-learning fine-tuning pretraining language-models text-generation machine-learning