Andrej Kaparthy 开源 nanochat:从零开始的极简全栈训练/推理方案
“Vibe Coding” 概念提出者 Andrej Karpathy 刚刚发布了名为「nanochat」的开源项目: nanochat 是类似于 ChatGPT 的 LLM 全栈实现,代码库单一、简洁、最小化、可定制且依赖极少。 nanochat 设计用于在单个 8XH100 节点上通过如 speedrun.sh 之类的脚本运行,实现从开始到结束的完整管道处理。这包括分词、预训练、微调、评估、推理以及通过简单的 UI 进行网络服务,这样你就可以像与 ChatGPT 交谈一样与自己的 LLM 交谈。 https://github.com/karpathy/nanochat 下面内容来自Andrej Kaparthy 的推特: 与我之前的项目 nanoGPT 不同——后者只涉及预训练部分——nanochat 是一个极简、从零构建的、完整的 ChatGPT 克隆版训练与推理全栈流程。整个系统被封装在一个几乎没有依赖的代码库中。 你只需要启动一台云端 GPU 服务器,运行一个脚本,大约 4 小时后,你就能在 ChatGPT 风格的网页界面上与自己的 LLM 对话。 整个项目约 8000 行代...
