Letta (fka MemGPT) 是用于创建有状态 LLM 服务的框架
git clone https://github.com/cpacker/MemGPT
- Ollama
LETTA_LLM_ENDPOINT=http://host.docker.internal:11434
LETTA_LLM_ENDPOINT_TYPE=ollama
LETTA_LLM_MODEL=qwen2.5:7b-q6_K
LETTA_LLM_CONTEXT_WINDOW=32000
LETTA_EMBEDDING_ENDPOINT=http://host.docker.internal:11434
LETTA_EMBEDDING_ENDPOINT_TYPE=ollama
LETTA_EMBEDDING_MODEL=bge-m3
LETTA_EMBEDDING_DIM=1024
在下载 Ollama 模型时,请确保使用标签!
不要执行 ollama pull dolphin2.2-mistral,而是执行 ollama pull dolphin2.2-mistral:7b-q6_K。
如果您没有指定标签,Ollama 可能会默认使用高度压缩的模型变体(例如 Q4)。