Pantheon CLI - 科学 “聊天式分析” 类人框架
Pantheon-CLI 是专为科学研究打造的首个完全开源的“聊天式分析”类人框架。定义 AI 时代研究者与数据交互的新方式。
博士水平的科学助手
- Pantheon-CLI 是首个用于复杂真实世界分析的命令行智能(CLI)Agent 助手,能够像人类一样处理博士级别的单细胞与空间组学任务。这不仅是一个工具——它是一位加入你科研团队的 AI 科学家。
混合式编程
- 在同一个环境中,你可以:
- 第一行写 Python 代码
- 下一行使用自然语言描述
- 甚至混合使用 R/Julia 语言
科学家只需专注于探索,无需在不同工具与环境之间来回切换。
功能特性
用 Pantheon-CLI 的开源力量重塑你的数据分析工作流——它为多语言无缝集成、轻松数据分析与下一代科研发现而生。
3.1 与数据对话
- 使用 Pantheon-CLI,你可以处理任何本地数据,不局限于文本、CSV、Excel,还包括 anndata、pkl、torch,以及任何 Python/R/Julia 支持的数据格式。
- 你无需将任何数据上传至服务器——分析能力完全依赖于你的计算机。也可以将 Pantheon-CLI 安装在服务器上,解锁无限分析可能。
3.2 混合式编程
- 在 Pantheon-CLI 中,所有变量都保存在环境中,突破了传统编程的限制。你可以随时用自然语言“编程”,CLI 会自动生成 Python/R/Julia 代码并运行。
- 这是全球首个具备变量持久化支持的 Agent。在编码过程中,你可以随时输入自然语言,Pantheon-CLI 将自动执行你想要的分析。
- 通过 Pantheon-CLI,构建了一个具备人机交互全栈能力的助手:读写文件、创建文件、运行命令、生成代码、读取网页。
- 不同于传统 Agent,该项目几乎实现了 Claude Code 的所有能力,并进一步优化——致力于让 Pantheon-CLI 更适合数据分析,而非纯粹的代码编程。
3.4 类人行为
- 像人类科学家一样,Pantheon-CLI 可读取网页教程与 PDF 论文,然后开始规划分析。
- 给 LLM 输入教程常能得到更好的输出,但并非所有网页都易于访问。项目重构了更强大的网页抓取能力,尽可能复现人类在分析前会做的一切准备工作。
3.5 任务规划
- 在 Pantheon-CLI 中,可从论文中学习并自动规划、构建科学 Agent。学习论文的 Method 部分,像人类专家一样搭建逐步执行的 Agent。
- 对于数据科学任务,现有 Agent 的通用做法是“计划并逐步执行”,但这依赖于人类预先定义的步骤。Pantheon-CLI 则能从论文或教程中自动学习并规划工作流。这与人类专家的做法有何不同?
3.6 多模型提供商支持
- Pantheon-CLI 支持主流大模型提供商,包括 OpenAI、Anthropic、Gemini、Deepseek、Qwen 等,因此你不受制于任一模型。
- 这看似简单,却非常实用:支持任何大模型,且无需“Claude Code 风格”的专用 API——通用 LLM API 即可。
3.7 本地 LLM 支持
- 出于某些数据隐私合规需求,Pantheon-CLI 可基于 ollama 使用本地大模型离线完成数据分析。
- 在本地运行数据与本地运行模型,是 Pantheon-CLI 的另一个有趣优势。
3.8 多 RAG 支持
- 提供完整的预学习 RAG 方案。通过强大的网页爬虫汇集文档信息,构建一个“外置大脑”,随后将用户意图与之匹配,生成更可靠的输出。
- 虽然 RAG 仍在争论中,但很多时候用户找不到“合适教程”作为精确输入。在这种情况下,RAG 就很有价值——毕竟极长上下文也会消耗大量 tokens。后续会释放更大的 RAG 数据库供下载。
3.9 生物学支持
- 借助在生物组学分析方面的经验,预置了系统级组学工具集,帮助你完成上游测序比对、下游注释与差异分析,甚至完整复现一篇生物学论文中的全部分析。
3.10 Notebook Support
- 想象一下:从现在起,当你在笔记本中分析数据时,如果你有特定的需求,却不想翻阅复杂的文档,你只需要进行一次对话,分析工作就能瞬间完成。
- 它不仅用于编写代码,还能自动运行和修改代码以生成正确结果,甚至能够处理文件并从网站学习——这些功能是其他任何工具都无法比拟的。