1 篇文章带有标签 “liger-kernel”

2025年4月4日星期五

利用多张 GPU 训练大语言模型

参考资料

2025-04-04 12:00

llm-training multi-gpu deepspeed flash-attention quantization liger-kernel distributed-training gpu-cluster 李宏毅 2025