code-llm - 标签 - 军舰的日志

2024年9月22日星期日

Qwen2.5-Coder Technical Report

Abstract(摘要)

In this report, we introduce the Qwen2.5-Coder series, a significant upgrade from its predecessor, CodeQwen1.5. This series includes two models: Qwen2.5-Coder-1.5B and Qwen2.5-Coder-7B. As a code-specific model, Qwen2.5-Coder is built upon the Qwen2.5 architecture and continues pretrained on a vast corpus of over 5.5 trillion tokens. Through meticulous data cleaning, scalable synthetic data generation, and balanced data mixing, Qwen2.

2024-09-22 08:00

2024年6月1日星期六

LLM 技术栈

框架

[SGLang][SGLang]

SGLang 是一种专为大型语言模型 (LLM) 设计的结构化生成语言。它通过共同设计前端语言和运行时系统，使您与 LLM 的交互更快、更可控。

平台

[Dify][Dify]

Dify 是一个 UI 驱动的用于开发大语言模型应用程序的平台，它使原型设计更加容易访问。它支持用户使用提示词模板开发聊天和文本生成应用。此外，Dify 支持使用导入数据集的检索增强生成（RAG），并且能够与多个模型协同工作。我们对这类应用很感兴趣。不过，从我们的使用经验来看，Dify 还没有完全准备好投入大范围使用，因为某些功能目前仍然存在缺陷或并不成熟。但目前，我们还没有发现更好的竞品。

工具

[Continue][Continue]

Continue 使您能够在 IDE 中创建自己的 AI 代码助手。使用 VS Code 和 JetBrains 插件保持开发者的流畅体验，这些插件可以连接到任何模型、任何上下文以及任何其他你需要的东西。Continue 使您能够使用适合工作的模型，无论是开源还是商业，本地运行还是远程运行，用于聊天、自动完成或嵌入。它提供了许多配置点，以便您可以自定义扩展以适应您现有的工作流程。

[Ollama][Ollama] Ollama 是一个在本机上运行并管理大语言模型的工具。

2024-06-01 08:00

llm tech-stack sglang dify ollama continue qwen code-llm mllm keycloak

2024年4月7日星期日

Continue - It’s time to collect data on how you build software

是时候收集关于你们如何构建软件的数据了。

It’s time to collect data on how you build software

Development data engine (开发数据引擎)

LLM more helpful with coding (LLM在编码方面更有帮助)
Developers use LLM while coding more (开发者在编码时更多地使用LLM)
Better data collected on how software is built (收集到更好的关于软件构建方式的数据)
Better LLM is trained or fine-tuned (训练或微调更好的LLM)

下一代开发者使用大型语言模型（LLMs）而不是谷歌搜索+ Stack Overflow。

随着时间的推移，开发者的偏好和使用的工具也在不断演进。当前一代的开发者正在用大型语言模型（LLMs）取代之前的Google和Stack Overflow，就像之前的一代人用Google和Stack Overflow取代了传统的参考手册一样。在这个过渡期中，能够保留和吸引开发者的组织将会：

首先，理解他们的开发者如何使用LLMs，并通过收集开发数据——即他们组织构建软件的方式——来展示使用LLMs的投资回报率（ROI）。

2024-04-07 10:00

continue llm development-data-engine software-engineering ai-coding-assistant data-collection open-source code-llm

Continue Code LLM Autopilot

Continue

注册 deepseek 的开发平台

OpenAI API

DeepSeek API 使用与 OpenAI 兼容的 API 格式，通过修改配置，您可以使用 OpenAI SDK 来访问 DeepSeek API，或使用与 OpenAI API 兼容的软件。

参数值 base_url https://api.deepseek.com/v1 api_key 申请 api_key

参数	值
base_url	https://api.deepseek.com/v1
api_key	YOUR_API_KEY

模型

模型	描述	上下文长度
deepseek-coder	擅长处理编程任务	16K
deepseek-chat	擅长通用对话任务	16K

安装 IntelliJ IDEA 插件 Continue

Continue

配置 deepseek-coder { "models": [ { "title": "deepseek api", "provider": "openai", "model": &quot

2024-04-07 08:00

continue deepseek code-llm ai-coding-assistant intellij-idea openai-api plugin llm

2024年2月29日星期四

DeepSeek-Coder 论文解读

论文

模型的性能

多语言基准性能

训练数据集

数据来源：2023年2月之前在GitHub上创建的公共仓库。

数据集创建过程

GitHub数据抓取
规则过滤
依存分析
仓库级重复数据删除
质量筛选

规则过滤过滤掉平均行长度超过100个字符或最大行长度超过1000个字符的文件。移除了字母字符少于25%的文件。除了XSLT编程语言外，过滤掉在前100个字符中出现字符串 "<?xml_version=" 的文件。对于HTML文件，考虑可见文本与HTML代码的比例，保留可见文本占代码至少20%且不少于100个字符的文件。对于包含更多数据的JSON和YAML文件，只保留字符计数在50到5000个字符范围内的文件。

2024-02-29 08:00

deepseek-coder code-llm paper-interpretation code-intelligence training-data fill-in-the-middle data-cleaning model-architecture

2024年1月15日星期一

Tabby 的基准测试

wrk

HTTP 基准测试工具

安装

git clone https://github.com/wg/wrk.git
cd wrk
#使用多线程（机器的处理器核数）加速编译，
make -j $(nproc)
cp wrk /usr/local/bin/

Tabby Server

服务器：NVIDIA T4 16GB X 4

部署

模型：TabbyML/DeepseekCoder-6.7B

docker run -d --gpus all -p 8080:8080 \
  -v /data/zhw/tabby/data:/data \
  tabbyml/tabby:latest \
  serve --model TabbyML/DeepseekCoder-6.7B \
  --device cuda --parallelism 4

模型：TabbyML/DeepseekCoder-1.3B

docker run -d --gpus all -p 8080:8080 \
  -v /data/zhw/tabby/data:/data \
  tabbyml/tabby:latest \
  serve --model TabbyML/DeepseekCoder-1.3B \
  --device cuda --parallelism 12

curl 测试 curl http://127.0.0.

2024-01-15 10:00

tabby benchmark wrk deepseek-coder code-llm ai-coding-assistant nvidia-tesla-t4

2024年1月13日星期六

人工智能编码助手（AI Coding Assistant）功能

交互方式

代码自动完成

AI 聊天

核心功能

功能	说明
代码补全	基于海量数据提供实时地代码补全服务，包括行内补全（单行补全）和片段补全（多行补全）。
添加注释	智能为选定的代码生成注释，目前在整个函数级别的生成注释效果较好。
解释代码	智能解析代码意图，为选定的代码生成解释，辅助阅读并理解代码。
生成单测	在写完业务逻辑后，为选定的代码生成单测，即可智能生成具备业务语义的测试用例，从而提升问题发现的效率。
代码优化	基于大模型的代码理解能力和静态源码分析能力，支持对选定的代码片段进行分析理解并提出优化、改进建议，还能直接基于改进建议生成代码补丁。

代码补全

添加注释

解释代码

代码大模型

模型的评估
模型的参数
模型的训练
模型的推理
最大 Token (CodeFuse)
- 输入：1280 Tokens
- 输出：1024 Tokens

模型下载

编程语言

Python
Java
JavaScript
TypeScript
C
C++
C#
Go
Rust
PHP
Ruby
Swift
Kotlin
Scala
SQL
HTML
CSS
Shell
Markdown
JSON
YAML
XML

存储库 (Repository)

GitHub
GitLab
Bitbucket
SVN

IDE JetBrains IntelliJ IDEA PyCharm Web

2024-01-13 08:00

ai-coding-assistant code-llm code-completion code-generation code-explanation unit-test-generation codefuse cody

2024年1月10日星期三

在 GeForce GTX 1060 上部署 Tabby - AI编码助手

我的 GPU：GP106 [GeForce GTX 1060 6GB]

安装 NVIDIA 驱动

查看哪些进程正在使用 NVIDIA 设备

lsof -n -w /dev/nvidia*

lsof 是一个在 Unix 和类 Unix 系统（如 Linux）上的命令行工具，用于列出当前系统打开的文件。在这里，"文件" 的概念很广泛，除了常见的文件和目录，还包括网络套接字、设备、管道等。

-n 参数告诉 lsof 不要将网络号转换为主机名，这可以加快 lsof 的运行速度。
-w 参数告诉 lsof 不要抑制警告信息。
/dev/nvidia* 是要查看的文件的路径，* 是通配符，表示所有以 /dev/nvidia 开头的文件。在这里，这些文件通常代表 NVIDIA 的设备。

所以，sudo lsof -n -w /dev/nvidia* 命令的作用是查看哪些进程正在使用 NVIDIA 设备。

杀死使用 NVIDIA 设备的进程或停止服务

kill -9 <pid>
sudo systemctl stop <service_name>

列出系统中所有需要驱动的设备 sudo ubuntu-drivers devices WARNING:root:_pkg_get_support nvidia-driver-525: package has invalid

2024-01-10 12:00

tabby ai-coding-assistant code-llm deepseek-coder docker cuda nvidia-container-toolkit geforce-gtx-1060

基于 VSCode 使用 Tabby 插件搭建免费的 GitHub Copilot

使用的模型

代码生成 Tabby 使用的是 Deepseek Coder 6.7B 模型。

部署服务器端

基于 PyCharm 使用 Tabby 和 CodeGPT 插件搭建免费的 GitHub Copilot

安装 Visual Studio Code

Tabby 安装

Tabby 配置

单击状态栏中的 Tabby 图标，打开 Tabby 配置页面。

参数

EndPoint: http://172.16.33.66:8080

使用 Tabby

代码生成

2024-01-10 10:00

github-copilot vscode tabby openai code-llm llm deepseek-coder code-completion ai-coding-assistant

基于 IntelliJ IDEA 使用 Tabby 和 CodeGPT 插件搭建免费的 GitHub Copilot

使用的模型

代码生成 Tabby 使用的是 Deepseek Coder 6.7B 模型。
AI 聊天 CodeGPT 使用的是 ChatGLM3-6B 模型。这个后面考虑使用 Deepseek Coder 6.7B 来替换。

部署服务器端

基于 PyCharm 使用 Tabby 和 CodeGPT 插件搭建免费的 GitHub Copilot

安装 InteliJ IDEA

安装插件

插件

代码生成：Tabby
AI 聊天：CodeGPT

安装

打开 IntelliJ IDEA，选择 Settings 菜单，选择 Plugins，搜索 Tabby 和 CodeGPT，点击 Install 安装。

Tabby

CodeGPT

配置插件

Tabby

参数

Endpoint: http://172.16.33.66:8080

CodeGPT

参数

Service: OpenAI Service
API key: NULL
Model: GPT-3.5(4k)
Base host: http://172.16.33.66:8000

使用插件

AI 聊天

代码生成

2024-01-10 08:00

github-copilot intellij-idea tabby codegpt openai code-llm llm deepseek-coder chatglm3 ai-coding-assistant

2024年1月9日星期二

基于 PyCharm 使用 Tabby 和 CodeGPT 插件搭建免费的 GitHub Copilot

使用的模型

代码生成 Tabby 使用的是 Deepseek Coder 6.7B 模型。
AI 聊天 CodeGPT 使用的是 ChatGLM3-6B 模型。这个后面考虑使用 Deepseek Coder 6.7B 来替换。

部署服务器端

Tabby 服务

docker run -d --runtime nvidia --name tabby -p 8080:8080 \
  -e TABBY_DOWNLOAD_HOST=modelscope.cn \
  -e NVIDIA_VISIBLE_DEVICES=3 \
  -e RUST_BACKTRACE=1 \
  -v `pwd`/.tabby:/data tabbyml/tabby \
  serve --model TabbyML/DeepseekCoder-6.7B  --device cuda

OpaneAI 服务

启动服务 Controller

python -m fastchat.serve.controller

启动服务 Model Worker

python -m fastchat.serve.model_worker \
  --model-path THUDM/chatglm3-6b --port 21002 \
  --worker-address http://localhost:21002 \
  --model-names chatglm3-6b,gpt-3.5-turbo

2024-01-09 08:00

github-copilot pycharm tabby codegpt fastchat openai code-llm llm deepseek-coder chatglm3

2024年1月5日星期五

Tabby - GitHub Copilot 的开源替代解决方案

Tabby

Coding LLMs Leaderboard (TabbyML Team)

Introducing the Coding LLM Leaderboard

更新日期：2023-11-13

Next Line Accuracy

什么是 Next Line Accuracy ？

在代码补全中，模型预测的是跨越多行的代码块。一种朴素的方法是直接将预测的代码块与实际提交的代码进行比较。虽然这种方法看起来理想，但它通常被认为是一个“过于稀疏”的度量标准。另一方面，下一行准确度可以作为整体代码块匹配准确度的可靠代理。

只有红色框内的内容被用于与真实值进行比较，以计算准确度指标。

安装 Tabby

Homebrew (Apple M1/M2)

安装 tabby brew install tabbyml/tabby/tabby ==> Fetching tabbyml/tabby/tabby ==> Downloading https://github.com/TabbyML/tabby/releases/download/v0.7.

2024-01-05 10:00

tabby github-copilot code-llm deepseek-coder ide vscode intellij-idea cuda leaderboard tabnine

2024年1月4日星期四

DeepSeek Coder: Let the Code Write Itself

DeepSeek Coder

Code LLM 排行榜

Leaderboard

Big Code Models Leaderboard

选择了两个通用基准来评估:

HumanEval: 用于测量从文档字符串合成程序的功能正确性的基准。它由 164 个 Python 编程问题组成。
MultiPL-E: 将 HumanEval 翻译为 18 种编程语言。

下面显示了 OctoCoder vs Base HumanEval prompt 的示例，在这里可以找到它。

CanAiCode Leaderboard

Coding LLMs Leaderboard

LLM 排行榜

Open LLM Leaderboard

LLM-Perf Leaderboard

介绍 DeepSeek Coder 由一系列代码语言模型组成，每个模型都在 2T 令牌上从头开始训练，其中 87% 是英文和中文的代码，13% 是自然语言。我们提供各种尺寸的代码模型，范围从 1B 到 33B 版本。

2024-01-04 08:00

deepseek-coder code-llm leaderboard humaneval multipl-e code-completion code-infilling fine-tuning quantization transformers

2024年1月2日星期二

CodeFuse

CodeFuse 代码领域大模型

CodeFuse 的使命是开发专门设计用于支持整个软件开发生命周期的大型代码语言模型（Code LLMs），涵盖设计、需求、编码、测试、部署、运维等关键阶段。我们致力于打造创新的解决方案，让软件开发者们在研发的过程中如丝般顺滑。

2024-01-02 08:00

codefuse code-llm ai-coding-assistant github-copilot mftcoder devops rag multi-agent humaneval codefuseeval

2024年1月1日星期一

AI 大模型基础服务架构图

大模型基础服务架构图

<center>
<div class="mermaid">
%%{init: {"flowchart": {"htmlLabels": false}} }%%
flowchart TB
  subgraph tool[聊天工具]
    direction TB
    chatgpt-next(ChatGPT Next Web)
    langchain-chatchat(Langchain-Chatchat)
    wechat(chatgpt-on-wechat)
  end
  subgraph business-application[业务应用层]
    direction TB
    app1(发电)
    app2(调度)
    app3(输变电)
// ...

代码大模型基础服务架构图

2024-01-01 10:00

llm code-llm 大模型基础服务架构图 fastchat tabby llmops dify openai-api chatglm3

AI 大模型

🔶 大模型

SLM

LLM

对话 LLM 排行榜 (Open LLM Leaderboard)

2024-01-01 08:00

llm slm code-llm embedding-llm 大模型 leaderboard gguf huggingface qwen

16 篇文章带有标签 “code-llm”

2024年9月22日 星期日

2024年6月1日 星期六

2024年4月7日 星期日

2024年2月29日 星期四

2024年1月15日 星期一

2024年1月13日 星期六

2024年1月10日 星期三

2024年1月9日 星期二

2024年1月5日 星期五

2024年1月4日 星期四

2024年1月2日 星期二

2024年1月1日 星期一

2024年9月22日星期日

2024年6月1日星期六

2024年4月7日星期日

2024年2月29日星期四

2024年1月15日星期一

2024年1月13日星期六

2024年1月10日星期三

2024年1月9日星期二

2024年1月5日星期五

2024年1月4日星期四

2024年1月2日星期二

2024年1月1日星期一