Unsloth Studio发布全球首个本地可视化大模型微调平台，显存降低70%

Unsloth Studio 正式发布：在自家电脑上微调 70B 大模型

你不用再为配 CUDA 环境熬通宵，也不用租云服务器花几千块跑一次微调了。Unsloth AI 推出的 Unsloth Studio，是一个完全开源、零代码、本地运行的可视化工具，让你用一块 RTX 4090 就能微调 Llama3.1、DeepSeek-R1 这类 70B 参数的大模型。

传统微调框架动不动就吃掉 80GB 以上的显存，跑个 8B 模型都得用 A100。Unsloth Studio 底层用 Triton 重写了反向传播核心，实测在相同硬件下：

我们测试了在 4090 上微调 Llama3-8B，全程显存占用稳定在 20GB 左右，训练 1 万条数据不到 3 小时。而用 Hugging Face 的标准流程，同样的数据要跑 6 小时以上，还经常爆显存。

数据准备不再是门槛。Unsloth Studio 内置可视化数据流编辑器，你只需要：

它集成了 NVIDIA DataDesigner 的部分能力，能自动从企业内部的说明书、客服记录、技术文档里生成高质量指令数据。你不再需要写 Python 脚本清洗数据，也不用请标注团队。

以前想让模型学会“分步骤思考”，得训练一个额外的“打分模型”（critic model），成本高、调起来复杂。Unsloth Studio 原生支持 GRPO（Grouped Relative Policy Optimization）——这是 DeepSeek-R1 背后用的技术。

你只需要提供带推理过程的样本（比如：“先分析需求，再拆解步骤，最后输出结果”），模型就能自动学习这种结构，不需要额外模型辅助打分。实测在数学题和代码生成任务上，推理正确率提升 18%–25%。

训练完成，别再手动转换格式了。Unsloth Studio 一键生成：

我们有用户把微调后的模型导出成 GGUF，放到自家 MacBook Pro 上，用 Ollama 启动，本地问答响应速度稳定在 1.2 秒/轮，完全满足内部知识库需求。

目前已有团队在用 Unsloth Studio 做：

他们共同的特点是：不想把数据传到云端，不想每月花上万块租算力，也不想雇专门的 AI 工程师。

目前已完整支持：

未来几周将支持 Llama 4、Gemma 3 和国内主流开源模型。所有模型都支持中文优化微调，无需额外语言适配。

Unsloth Studio 是 100% 开源（MIT 协议），所有代码在 GitHub 可查。安装仅需一条命令：

pip install unsloth-studio
unsloth-studio

完全离线运行，不上传你的数据，不连接任何远程服务器。你训练的模型，永远只属于你。

官网文档：https://unsloth.ai/docs/new/studio