6 篇文章带有标签 “retrieval-augmented-generation”

2025年9月27日星期六

【生成式人工智慧与机器学习导论2025】第二讲：上下文工程 (Context Engineering) — AI Agent 背后的关键技术

Context Engineering（上下文工程）是为解决 AI Agent 时代输入过长，避免塞爆 Context 的关键技术。其基本概念是 “把需要的放進去，不需要的清出來”。常用招数（基本方法）包括：

Select（挑选）：只挑选当下任务最关键的内容。这包括利用 RAG (检索增强生成) 检索额外资讯，并使用 Reranking 或 Small LLM 筛选关键词。此外，只挑选需要的工具（Tool RAG）和记忆（Memory RAG）。
Compress（压缩）：对冗长琐碎的内容进行精简和摘要。例如，将过去的对话历史或 Computer Use 产生的细节压缩，让遥远的记忆逐渐淡化，以节省 Context 空间。
Multi-Agent（多代理）：将复杂任务拆解并分派给多个子 Agent。子 Agent 独立处理细节，完成后只向 Lead Agent 回报最终结果，从而隔离复杂的互动过程，分散 Context 负担。

2025-09-27 20:00

context-engineering 上下文工程 ai-agent 智能体 rag retrieval-augmented-generation 李宏毅生成式人工智慧与机器学习导论2025

2025年4月6日星期日

RAGFlowAssistant

初始化

uv init RAGFlowAssistant
cd RAGFlowAssistant
uv add ragflow-sdk

运行

sh run.sh

RAGFlowAssistant

配置

知识库问答

核心代码

2025-04-06 08:00

ragflow ragflow-sdk rag knowledge-base chatbot python assistant streamlit retrieval-augmented-generation

2025年4月2日星期三

使用 Trae 开发 RAGFlow 助手

⚠️ Trae 试用感受

热门模型（Claude-3.7-sonnet）需要排队
在当前会话中，我引用过一个文件，接着提问还需要添加引用，太麻烦了。
都知道它是中国字节开发的，有一种亲切感，确让我翻墙来用她。

功能界面

操作

提示词

使用 Streamlit UI 库开发一个连接 RAGFlow 的客户端应用，左边列出可选的知识库，右边是聊天对话框。

2025-04-02 16:00

trae ragflow ai-coding-assistant streamlit knowledge-base chatbot retrieval-augmented-generation llm client-app bytedance

2025年3月22日星期六

RAG 2.0

参考资料 2024 年 RAG 的崛起与演变年度回顾所见即所得：多模态RAG正在向我们走来 What is Retrieval Augmented Generation (RAG)? Build with Claude - Prompt caching Introducing Contextual Retrieval Cookbook - Retrieval Augmented Generation with Contextual Embeddings Infinity Dense vector + Sparse vector + Full text search + Tensor reranker = Best retrieval for RAG? Sparse embedding or BM25?

2025-03-22 10:00

rag retrieval-augmented-generation llm hybrid-search embedding agentic-rag contextual-retrieval bm25

2024年8月25日星期日

Continue 源码分析 - RerankerRetrievalPipeline

RerankerRetrievalPipeline

源代码：core/context/retrieval/pipelines/RerankerRetrievalPipeline.ts

2024-08-25 08:00

continue reranker-retrieval-pipeline source-code-analysis fts vector-search lancedb retrieval-augmented-generation embeddings