8 篇文章带有标签 “GPT”

2024年1月3日星期三

CodeGPT: 智能辅助编程

打开 IntelliJ IDEA，选择 Settings 菜单，选择 Plugins，搜索 CodeGPT，点击 Install 安装。

这里访问的 OpenAI 服务是我自己搭建的，使用的是 FastChat + ChatGLM3-6B。

模型缓存到 ~/.codegpt/models/gguf 目录下，如果模型不存在，可以单击 Download Model 下载。

也可以自己到 HuggingFace 下载模型，然后放到 ~/.codegpt/models/gguf 目录下。

单击 Start server 启动服务。

查看缓存的模型

ls ~/.codegpt/models/gguf

deepseek-coder-6.7b-instruct.Q5_K_M.gguf

codegpt/CodeGPTPlugin.java

可以到 HuggingFace 下载 LLaMA 2-7B-Chat 模型的 GGUF格式。

Service: LLaMA C/C++ Port (Free, Local)
Use custom model
- Model path: 您下载的 LLaMA 2-7B-Chat 模型的路径
- Prompt template: Llama

单击 Start server 启动服务。

2024年1月3日 1 分钟 293 字

2023年12月18日星期一

使用 Ollama 构建本地聊天服务

Llama 2

ollama pull llama2

LLaVA: Large Language and Vision Assistant

ollama pull llava

模型版本化

这里我使用了本地的 GGUF 模型进行构建。

编辑 Modelfile 文件 From /Users/junjian/.cache/lm-studio/models/TheBloke/Llama-2-7B-chat-GGUF/llama-2-7b-chat.Q4_K_M.

2023年12月18日 1 分钟 105 字

Ollama OllamaHub OllamaWebUI GPT

2023年12月6日星期三

基于 ChatGLM3 8k 和 32k 的文档问答对比

这里使用的文档是：合作方人员出勤及结算管理信息化支撑规则

一、出勤打卡
出勤打卡包括：正常出勤打卡、出差打卡、外出打卡、加班打卡。

1. 正常出勤打卡：指正常的出勤办公打卡。
（1）全天出勤打卡：上班打卡：8点30分之前打卡。下班打卡：17点30分之后打卡。
（2）半天出勤打卡。上午打卡时间段：8点30分之前、12点之后。下午时间段：13点之前，17点30分之后。
（3）打卡(考勤机或企业微信打卡)形式按部门要求为准，最小半天为统计单位。

2. 出差打卡：指出差地出勤办公或在途期间打卡。
（1）固定出差地打卡：打卡时间参照第1条正常出勤上下班打卡；无法定位有效范围的找部门管理员修改工作打卡位置。(具体按照各部门要求执行)
（2）出差在途打卡(使用手机外出打卡)。到车站坐车前打外出打卡一次，到达目的地后打外出打卡一次(往返同理)。下午出差的，上午需打正常出勤卡(上午正常出勤须闭环打卡)；上午到达出差地的，下午需打一次外出打卡或上下班打卡。

3. 外出打卡：指外出办事打卡。提外出申请后，可以打外出卡，打外出卡时间需在申请时间内：
（1）半天外出：如外出时间在上午(12点前) 或者下午(12点后)，则另外半天需正常出勤打卡。
（2）跨12点外出：如外出跨度期间包含12点，则12点前、12点后分别打外出卡即可记为合格出勤。
// ...

2023年12月6日 11 分钟 3,101 字

GPT ChatGLM3 ChatGLM3-6B-32K bge-base-zh

2023年9月2日星期六

Private GPT

Chroma 向量数据库依赖于 sqlite3，而且需要 sqlite3 >= 3.35.0。

制作镜像时，使用的是 python:3.10 和 python:3.10-slim，使用 apt install sqlite3 能够安装的 sqlite3 最高版本是 3.34.1，所以会出现下面的错误。

    import chromadb
  File "/usr/local/lib/python3.10/site-packages/chromadb/__init__.py", line 69, in <module>
    raise RuntimeError(
RuntimeError: Your system has an unsupported version of sqlite3. Chroma requires sqlite3 >= 3.35.0.
Please visit https://docs.trychroma.com/troubleshooting#sqlite to learn how to upgrade.

Troubleshooting LangChain Chroma LangChain Chroma - load data from Vect

2023年9月2日 2 分钟 397 字

Chroma Faiss Gunicorn Uvicorn SQLite3 GPT Shell PrivateGPT

2023年7月24日星期一

AI 大模型

GLUE 基准测试的格式与模型无关，因此任何能够处理句子和句子对并产生相应预测的系统都有资格参与。选择基准任务是为了支持使用参数共享或其他迁移学习技术跨任务共享信息的模型。 GLUE 的最终目标是推动通用且强大的自然语言理解系统的开发研究。

2023年7月24日 2 分钟 506 字

LLM GPT Data SAM ChatGPT

2023年5月30日星期二

State of GPT - Andrej Karpathy

了解 ChatGPT 等 GPT 助手的训练管道，从标记化到预训练、监督微调和人类反馈强化学习 (RLHF)。深入研究有效使用这些模型的实用技术和心智模型，包括提示策略、微调、快速增长的工具生态系统及其未来的扩展。

Data Collection

Tokenization

GPT3 vs LLaMa

Pretraining

Base models learn powerful

Base models in the wild

SFT Dataset

RM Dataset

RM Training

RL Training

RLHF

Assistant models in the wild

2023年5月30日 2 分钟 502 字

LLM SFT RM RLHF Fine-Tuning GPT

2023年4月14日星期五

AutoGPT

AutoGPT

Custom Search JSON API 每天免费提供 100 次搜索查询。

2023年4月14日 1 分钟 81 字

GPT OpenAI Google Pinecone ElevenLabs AutoGPT

2023年3月15日星期三

在 MacBook Pro M2 Max 上测试 LLaMA

bash download.sh

模型	大小	量化(4位)	内存
7B	13G	3.9G	4.0G
13B	24G	7.6G	7.8G
30B	61G	19G	19.4G
65B	122G	38G	38.5G

GGUF 是一种二进制格式，旨在快速加载和保存模型。它是 GGML、GGMF 和 GGJT 的后继文件格式，通过包含加载模型所需的所有信息来确保明确性。它还被设计为可扩展的，以便可以在不破坏兼容性的情况下将新信息添加到模型中。

GGML（无版本）：基线格式，没有版本控制或对齐。
GGMF（版本化）：与 GGML 相同，但具有版本化。
GGJT：对齐张量以允许与需要对齐的 mmap 一起使用。 v1、v2 和 v3 相同，但后面的版本使用与以前版本不兼容的不同量化方案。

What is GGUF and GGML?

REPO_ID=TheBloke/CodeLlama-7B-GGUF
FILENAME=codellama-7b.Q4_K_M.gguf

huggingface-cli download ${REPO_ID} ${FILENAME} \
    --local-dir . --local-dir-use-symlinks False

❶ 编译 llama.cpp git clone https://github.com/ggerganov/llama.cpp.

2023年3月15日 3 分钟 690 字

LLM GPT MacBookProM2Max LLaMA

8 篇文章带有标签 “GPT”

2024年1月3日 星期三

2023年12月18日 星期一

2023年12月6日 星期三

2023年9月2日 星期六

2023年7月24日 星期一

2023年5月30日 星期二

2023年4月14日 星期五

2023年3月15日 星期三