安规 - 标签 - 军舰的日志

构建自主答题的智能体

目标

这里想探索使用多模态大模型答题的技术方案，包含单选题、多选题、判断题，最终构建自主答题的智能体。

工作流程：🏞️ -> MLM（多模态大模型）-> 答案

📝思路一

直接使用多模态大模型读题（转成文字），然后检索答案，把题和答案组合的提示词输入给语言大模型。

我使用了 Ollama 调用多模态大模型 minicpm-v:8b 来生成文字。llava:7b 的效果不好。

代码示例：

import ollama

response = ollama.chat(
	model="minicpm-v:8b",
	messages=[
		{
			'role': 'user',
			'content': '读取图像中的题。',
			'images': ['ti.png']
		}
	]
)

print(response['message']['content'])

2025-02-18 10:00

安规 agent ollama 多模态 llm prompt-engineering minicpm-v vision-language-model

2 篇文章带有标签 “安规”

2025年2月18日星期二

构建自主答题的智能体

2023年4月22日星期六

ChatGLM-6B 模型基于 P-Tuning v2 微调的自定义数据集

2 篇文章带有标签 “安规”

2025年2月18日 星期二

构建自主答题的智能体

2023年4月22日 星期六

ChatGLM-6B 模型基于 P-Tuning v2 微调的自定义数据集

2025年2月18日星期二

2023年4月22日星期六