local-llm - 标签 - 军舰的日志

2026年1月26日星期一

iFlow CLI

iFlow 登录

OpenAI 兼容 API

可以手动修改配置文件：~/.iflow/settings.json

{
  "cna": "dp3vIQIkkhcCAXyAlGrAY4my",
  "selectedAuthType": "openai-compatible",
  "searchApiKey": "sk-72c24939a1ac137a28e990cdee4d5d7f",
  "baseUrl": "http://localhost:11434/v1",
  "apiKey": "NONE",
  "modelName": "qwen3-coder:latest",
  "bootAnimationShown": true
}

不能使用工具（todo, write_file 等），不可用。

参考资料

iFlow CLI

2026-01-26 10:00

2025年4月3日星期四

Continue Agent 使用 GitHub MCP Server

Continue 智能体

必须使用 Agent 模式才支持 MCP Server。
Agent 模式不支持 DeepSeek 系列的模型（包括官方API和开源）。
大模型使用本地 Ollama 的模型：qwen2.5-coder:32b 和 qwq:latest。

申请 GitHub 个人访问令牌（Personal Access Token）

访问 GitHub 的 Settings 页面，点击 Developer settings。
点击 Personal access tokens，然后点击 Tokens (classic)。
点击 Generate new token 按钮。

Continue 配置

config.yaml 文件配置如下：

name: Local Assistant
version: 1.0.0
schema: v1
models:
  - name: Autodetect
    provider: ollama
    model: AUTODETECT
  - name: DeepSeek Chat
    provider: deepseek
    model: deepseek-chat
    apiKey: sk-xxx
  - name: DeepSeek Coder
    provider: deepseek
    model: deepseek-coder
    apiKey: sk-xxx
// ...

2025-04-03 10:00

continue github-mcp-server mcp ollama deepseek ai-coding-assistant agent-mode qwen code-review local-llm

2024年8月28日星期三

Tabby 使用指南

Tabby

Demo
Blog

安装 Tabby (macOS)

brew install tabbyml/tabby/tabby

更新

brew upgrade tabbyml/tabby/tabby

安装 Tabby VSCode 扩展

Tabby VSCode Extension

模型

Models Registry

Codestral 的优点

与其他编码 LLM 相比，Codestral 的独特之处在于其单一模型同时支持 指令跟随 和 中间填充 兼容性。这是通过在两个数据集上同时微调基础模型实现的。这种 双重微调策略 使同一个模型在 代码补全 和 对话任务 中都能表现出色，大大简化了模型部署堆栈。

此外，Codestral 在包含 80 多种编程语言的多样化数据集上进行训练，确保了开发人员在使用各种语言时的高质量体验。

Introducing the Codestral Integration in Tabby

运行 Tabby Server

命令行指定参数

2024-08-28 08:00

tabby ai-code-assistant vscode-extension codestral context-provider code-search code-chat ollama local-llm code-completion

2024年7月25日星期四

GraphRAG

GraphRAG 项目是一个数据管道和转换套件，旨在利用大型语言模型（LLMs）的力量从非结构化文本中提取有意义的结构化数据。

若要了解更多关于 GraphRAG 以及它如何用于增强您的大型语言模型（LLMs）对您的私有数据进行推理的能力，请访问 Microsoft Research Blog Post。

Get Started

构建虚拟环境

cd /Users/junjian/GitHub/microsoft/graphrag

python -m venv env
source env/bin/activate

安装 GraphRAG

pip install graphrag

准备数据 mkdir -p ./ragtest/input curl https://www.gutenberg.

2024-07-25 08:00

graphrag rag ollama xinference local-llm knowledge-graph embeddings getting-started

2024年6月3日星期一

Continue

介绍

Continue 使您能够在 IDE 中创建自己的 AI 代码助手。使用 VS Code 和 JetBrains 插件保持开发者的流畅体验，这些插件可以连接到任何模型、任何上下文以及任何其他你需要的东西。

轻松理解代码部分
Tab 自动完成代码建议
重构您正在编码的函数
询问代码库相关问题
快速使用文档作为上下文
使用斜线命令启动操作
将类、文件等添加到上下文
立即了解终端错误

Continue 使您能够使用适合工作的模型，无论是开源还是商业，本地运行还是远程运行，用于聊天、自动完成或嵌入。它提供了许多配置点，以便您可以自定义扩展以适应您现有的工作流程。

开发语言

语言	占比
TypeScript	74.0%
Kotlin	11.8%
Rust	4.9%
CSS	3.6%
Scheme	2.5%
JavaScript	2.4%
Other	0.8%

贡献（Contributing）

使用

2024-06-03 08:00

continue ai-coding-assistant ollama vscode jetbrains code-completion rag embeddings local-llm slash-commands

2024年6月2日星期日

Ollama

开放 Ollama 服务

环境变量

OLLAMA_HOST: Ollama 服务器的 IP 地址（默认 127.0.0.1:11434）
OLLAMA_NUM_PARALLEL: 最大并行请求数（默认 1）
OLLAMA_MAX_LOADED_MODELS: 最大加载模型数量（默认 1）
OLLAMA_KEEP_ALIVE: 模型在内存中保持加载的持续时间（默认 5m），-1 表示永久保持加载。

Linux

安装 Ollama 服务。

curl -fsSL https://ollama.com/install.sh | sh

编辑 systemd 服务，调用 systemctl edit ollama.service。这将打开一个编辑器。 sudo systemctl edit ollama.service 对于每个环境变量，在 [Service] 部分下添加一行 Environment： [Service] Environment="OLLAMA_HOST=0.0.0.

2024-06-02 08:00

ollama llm local-llm embedding ollama-sdk vision linux systemd

6 篇文章带有标签 “local-llm”

2026年1月26日 星期一