Easy Dataset:基于 LLM 微调数据集的工具
架构

本地运行
使用 NPM 安装
- 克隆仓库:
 
   git clone https://github.com/ConardLi/easy-dataset.git
   cd easy-dataset
- 安装依赖:
 
   npm install
- 启动开发服务器:
 
   npm run build
   npm run start
- 打开浏览器并访问 
http://localhost:1717 
使用本地 Dockerfile 构建
如果你想自行构建镜像,可以使用项目根目录中的 Dockerfile:
- 克隆仓库:
    
git clone https://github.com/ConardLi/easy-dataset.git cd easy-dataset - 构建 Docker 镜像:
    
docker build -t easy-dataset . - 运行容器:
    
docker run -d -p 1717:1717 -v {YOUR_LOCAL_DB_PATH}:/app/local-db --name easy-dataset easy-dataset注意: 请将
{YOUR_LOCAL_DB_PATH}替换为你希望存储本地数据库的实际路径。 - 打开浏览器,访问 
http://localhost:1717 
首页

项目
创建项目

模型配置

任务配置

提示词配置

文献处理
上传文件

智能分割

批量生成问题

领域分析
领域树

目录结构

问题管理
列表视图

领域树视图

问题编辑

数据集管理


导出 Alpaca

导出 ShareGPT

导出 LLaMA Factory

模型测试
