DeepSeek “源神”启动!「GitHub 热点速览」
上周,DeepSeek 官方宣布将陆续发布 5 个开源项目 。本周一开源社区就迎来了首发之作------FlashMLA!该项目开源后,不到一天 Star 数已突破 6k,并且还在以惊人的速度持续飙升。
GitHub 地址:github.com/deepseek-ai/FlashMLA
FlashMLA 是一个针对 Hopper GPU 优化的高效 MLA(Multi-Head Latent Attention)解码内核,能够显著提升大规模语言模型(LLM)的推理效率。对于普通用户来说,就是用了 FlashMLA 同样的 GPU 硬件条件下,LLM 的聊天机器人不仅可以更快速地响应,还能处理更长的文本。
Tips:Hopper 是英伟达在 2022 年推出的 GPU 架构,采用 NVIDIA Hopper GPU 架构的显卡包括 H100、H200、H800 系列。
回顾上周的热门开源项目,微软开源的屏幕解析 AI 工具 OmniParser 表现亮眼(9k Star/周),它能够将用户界面的截图解析为结构化、易于理解的元素,提升 AI 理解 GUI 的能力。让 AI 能够像人类一样与网站进行交互的 Browser-use,能够在浏览器上自动完成搜索、数据提取和填表等操作。将代码仓库转化成一个文件的 Repomix,轻松打通代码与 AI 的桥梁。除了增强 AI 能力的开源项目,快速查看和管理 K8s 集群的命令行工具 K9s、开源协作式 Wiki 和文档平台 Docmost,也值得关注。
最后,是一本介绍大模型基础的开源书籍《大模型基础》,全面地介绍了入门大模型的核心知识,是不可错过的 LLM 学习资源!
- 本文目录
-
- 热门开源项目
- 1.1 让 AI 操作你的浏览器:Browser-use
- 1.2 开源协作式 Wiki 和文档平台:Docmost
- 1.3 快速查看和管理 K8s 集群的命令行工具:K9s
- 1.4 打通代码与 AI 的桥梁:Repomix
- 1.5 解析屏幕的 AI 工具:OmniParser
-
- HelloGitHub 热评
- 2.1 为开发者准备的速查表:Reference
- 2.2 《大模型基础》:Foundations-of-LLMs
-
- 结尾
-
- 热门开源项目
1.1 让 AI 操作你的浏览器:Browser-use
主语言:Python ,Star:32k ,周增长:4k
该项目通过 AI 代理实现自动化操作浏览器,让 AI 能够像人类一样与网站进行交互。它基于 Playwright 框架实现浏览器自动化操作,并通过 LangChain 和 LLM 等技术,将 AI 能力与浏览器的交互能力相结合,能够完成自动搜索、数据提取和表格填写等任务。用户可以通过简单的代码启动 AI 代理,并直观地测试和观察操作过程。
from langchain_openai import ChatOpenAI from browser_use import Agent import asyncio from dotenv import load_dotenv load_dotenv() async def main(): agent = Agent( task="Go to HelloGitHub, search for 'browser-use', click on the first post and return the publish comment.", llm=ChatOpenAI(model="gpt-4o"), ) result = await agent.run() print(result) asyncio.run(main())
GitHub 地址→github.com/browser-use/browser-use
1.2 开源协作式 Wiki 和文档平台:Docmost
主语言:TypeScript ,Star:10k ,周增长:1.3k
这是一款免费、开源的知识管理和文档协作平台,可作为 Confluence 和 Notion 的开源替代品。它界面清爽、功能丰富,提供类似维基(wiki)的结构化知识管理和多人实时协作编辑文档的功能,并支持画图、权限管理、评论、页面历史和搜索等,适用于企业内部的知识库、文档共享和协作等场景。
GitHub 地址→github.com/docmost/docmost
1.3 快速查看和管理 K8s 集群的命令行工具:K9s
主语言:Go ,Star:28k ,周增长:200
这是一款用于管理 Kubernetes 集群的命令行工具,帮助用户轻松监控和管理 K8s 集群。它提供直观的终端界面和交互体验,可实时跟踪集群中的应用运行状态,并支持多种资源管理(Pods、Deployments、Services 等)、查看日志、自定义配置和插件扩展等功能。
GitHub 地址→github.com/derailed/k9s
1.4 打通代码与 AI 的桥梁:Repomix
主语言:TypeScript ,Star:10k ,周增长:1k
该项目是用于将整个代码仓库打包成适合 AI 处理的单一文件(纯文本、Markdown、XML),支持远程仓库地址和本地仓库。它通过内置的安全检查和代码压缩技术,能够有效减少输出文件的上下文令牌(token)数量,并确保不泄漏敏感信息。生成的文件可以方便地输入到 ChatGPT、Claude、Llama 等 AI 工具中,适用于代码审查、文档生成和测试用例编写等任务。
GitHub 地址→github.com/yamadashy/repomix
1.5 解析屏幕的 AI 工具:OmniParser
主语言:Python ,Star:16k ,周增长:9k
这是一款微软开源的屏幕解析工具,能够将用户界面的截图解析为结构化且易于处理的元素。它采用 Python 开发,基于 YOLO、BLIP2 和 Florence 等模型,实现较为精准的图标识别并生成描述性文本,支持与多种主流大语言模型(GPT-4V)集成,适用于开发桌面自动化操作的应用。
GitHub 地址→github.com/microsoft/OmniParser
- HelloGitHub 热评
在此章节中,我们将为大家介绍本周 HelloGitHub 网站上的热门开源项目,我们不仅希望您能从中收获开源神器和编程知识,更渴望"听"到您的声音。欢迎您与我们分享使用这些开源项目的亲身体验和评价,用最真实反馈为开源项目的作者注入动力。
2.1 为开发者准备的速查表:Reference
主语言:Other
这是一份专为开发者准备的快速参考手册(cheat sheet)集合,旨在为开发者提供简洁、直观的速查表,内容涵盖多种编程语言、框架、Linux 命令和数据库等。
项目详情→hellogithub.com/repository/747de4f19b384ff197698089038f6e9e
2.2 《大模型基础》:Foundations-of-LLMs
主语言:Other
该书是由浙江大学 DAILY 实验室开源的大语言模型教材,内容涵盖传统语言模型、大语言模型架构演化、Prompt 工程、参数高效微调、模型编辑、检索增强生成等方面。
项目详情→hellogithub.com/repository/d3c56213ee644bfc8a34d5b6c395e7f2
- 结尾
以上就是本期「GitHub 热点速览」的全部内容,希望这些开源项目能激发你的兴趣,找到你下一个想去尝试的工具!如果你也发现了好玩、有趣的 GitHub 开源项目想要分享,欢迎来 HelloGitHub 与我们交流心得、讨论使用体验。
往期回顾

低调大师中文资讯倾力打造互联网数据资讯、行业资源、电子商务、移动互联网、网络营销平台。
持续更新报道IT业界、互联网、市场资讯、驱动更新,是最及时权威的产业资讯及硬件资讯报道平台。
转载内容版权归作者及来源网站所有,本站原创内容转载请注明来源。
- 上一篇
Elasticsearch 自动补全搜索 - autocomplete
作者:来自 ElasticAmit Khandelwal 探索处理自动完成的不同方法,从基础到高级,包括输入时搜索、查询时间、完成建议器和索引时间。 在本文中,我们将介绍如何避免严重的性能错误、Elasticsearch 默认解决方案为何不适用以及重要的实施注意事项。 所有现代网站都在其搜索栏上提供自动补全(autocomplete)功能(输入时搜索),以改善用户体验(没有人愿意输入整个搜索词……)。自动补全必须比标准搜索更快,因为自动完成的全部目的是在用户输入时开始显示结果。如果延迟较高,则会导致用户体验不佳。 以下是著名问答网站 Quora 上的自动完成搜索示例。这是一个很好的自动完成示例:搜索 “elasticsearch auto” 时,以下帖子开始显示在搜索栏中: 注意搜索结果中,有与 Elasticsearch 的自动扩展、自动标记和自动完成功能相关的问题。用户可以进一步输入一些字符来细化搜索结果。 Elasticsearch 中自动完成的各种方法/输入时搜索 有多种方法可以实现自动完成功能,大致分为四大类: Search-as-you-type Query time Co...
- 下一篇
图引擎在智能体开发场景的应用实践
导读 随着AGI理论的不断突破,智能体已经成为LLM在企业落地的最重要的形式之一。一个完备的智能体必须能实现:感知、推理、计划、执行等一套完整的功能,从工程的角度来看workflow特别适合这种复杂任务的分析、拆解、重组、执行, 再结合CoT技术, 实现LLM和业务功能完美契合的智能体应用。本文尝试用成熟的图引擎技术驱动workflow探索更多样性的拓展agent能力的方法,以更好应对各类业务场景。 01 简介 1.1 什么是智能体 以大模型(LLM)为核心, 具备以下特性的智能化系统: 交互性: 通过文字,语音,图像等多种交互方式来理解用户的持续性需求 (感知); 适应性: 感知环境的变化持续进化,以更好地完成任务和适应复杂环境 (记忆); 自主性: 能够自主学习,主动思考和决策 (推理); 1.2业务形态、流程 一个智能体生态平台,用户可以在上面体验功能各异的智能体app,同时也能让用户将自己的优秀想法以极低的成本(通过快速组装已有的插件、workflow、知识库、记忆) 快速实现成新的agent。 系统特色: 流程编排能力:支持可视...
相关文章
文章评论
共有0条评论来说两句吧...
文章二维码
点击排行
推荐阅读
最新文章
- Docker使用Oracle官方镜像安装(12C,18C,19C)
- CentOS6,CentOS7官方镜像安装Oracle11G
- CentOS关闭SELinux安全模块
- SpringBoot2配置默认Tomcat设置,开启更多高级功能
- CentOS7安装Docker,走上虚拟化容器引擎之路
- SpringBoot2更换Tomcat为Jetty,小型站点的福音
- CentOS8安装MyCat,轻松搞定数据库的读写分离、垂直分库、水平分库
- SpringBoot2整合Redis,开启缓存,提高访问速度
- SpringBoot2整合MyBatis,连接MySql数据库做增删改查操作
- Windows10,CentOS7,CentOS8安装Nodejs环境