跳转到主内容
军舰的日志
工具 标签 关于
工具 标签 关于 搜索文章
目录
  • 参考资料

利用多张 GPU 训练大语言模型

参考资料

  • 李宏毅生成式 AI 时代下的机器学习(2025)助教课:利用多张 GPU 训练大型语言模型——从零开始介绍 DeepSpeed、Liger Kernel、Flash Attention 及 Quantization
  • 【生成式AI時代下的機器學習(2025)】助教課:利用多張GPU訓練大型語言模型—從零開始介紹DeepSpeed、Liger Kernel、Flash Attention及Quantization
  • Excalidraw
  • The Ultra-Scale Playbook: Training LLMs on GPU Clusters

相关文章

2023年7月24日

AI 大模型

2025年12月31日

2025 年大模型实践总结

2025年6月7日

【生成式AI时代下的机器学习(2025)】第十二讲:概述语音语言模型发展历程

2024年9月23日

Qwen2 Technical Report

打开 Markdown

标签

llm-trainingmulti-gpudeepspeedflash-attentionquantizationliger-kerneldistributed-traininggpu-cluster李宏毅2025

信息

2025年04月04日 04时00分

约 1 分钟阅读

阅读

© 2026 军舰的日志. All rights reserved. · 访问量 · 访客数

🤖

智能问答助手

⏳ 初始化...

💡 配置和聊天记录仅保存在本地浏览器中