Easy Dataset:基于 LLM 微调数据集的工具
架构

本地运行
使用 NPM 安装
- 克隆仓库:
git clone https://github.com/ConardLi/easy-dataset.git
cd easy-dataset
- 安装依赖:
npm install
- 启动开发服务器:
npm run build
npm run start
- 打开浏览器并访问
http://localhost:1717
使用本地 Dockerfile 构建
如果你想自行构建镜像,可以使用项目根目录中的 Dockerfile:
- 克隆仓库:
git clone https://github.com/ConardLi/easy-dataset.git cd easy-dataset - 构建 Docker 镜像:
docker build -t easy-dataset . - 运行容器:
docker run -d -p 1717:1717 -v {YOUR_LOCAL_DB_PATH}:/app/local-db --name easy-dataset easy-dataset注意: 请将
{YOUR_LOCAL_DB_PATH}替换为你希望存储本地数据库的实际路径。 - 打开浏览器,访问
http://localhost:1717
首页

项目
创建项目

模型配置

任务配置

提示词配置

文献处理
上传文件

智能分割

批量生成问题

领域分析
领域树

目录结构

问题管理
列表视图

领域树视图

问题编辑

数据集管理


导出 Alpaca

导出 ShareGPT

导出 LLaMA Factory

模型测试
