零门槛的向量数据库「GitHub 热点速览」
上周,DeepSeek-V3 将训练大模型的成本给打下来了,但训练大模型对普通开发者来说仍然门槛很高。所以,本期的热门开源项目聚焦于降低 LLM 应用开发的入门门槛。
极易上手的向量数据库 chroma 用起来十分方便,只需一行命令 pip install chromadb
就能轻松拥有一个向量数据库,用于存储和检索向量数据。接下来是专为构建实时 AI 应用的 Python ETL 框架 pathway,它提供了简单易用的 Python API 和可视化监控界面,全面提升 LLM 应用处理数据的效率。同样开箱即用的 Rust 全栈 Web 框架 Loco,则将 Rails 的开发体验与 Rust 的高性能相结合,是快速开发 Web 应用不错的选择。
最后是两个相见恨晚的开源项目,Python 项目打包神器 pex,它为 Python 项目提供了一键部署的丝滑体验。以及可以轻松部署家庭多媒体中心的 docker-xiaoya。
- 本文目录
-
- 热门开源项目
- 1.1 极易上手的向量数据库:chroma
- 1.2 Rust 的全栈 Web 框架:Loco
- 1.3 开箱即用的端口扫描工具:RustScan
- 1.4 实时更新的轻量级推荐系统:monolith
- 1.5 构建实时 AI 系统的 Python 框架:pathway
-
- HelloGitHub 热评
- 2.1 相见恨晚的 Python 项目打包工具:pex
- 2.2 一键部署完整的家庭多媒体中心:docker-xiaoya
-
- 结尾
-
1. 热门开源项目
1.1 极易上手的向量数据库:chroma
主语言:Rust ,Star:16.3k ,周增长:400
这是一款专为 AI 应用设计的开源向量数据库(Embedding Database),支持 Python、JavaScript、Rust 等多种编程语言。它提供了简单易用的 API 和多种启动模式(内存、文件存储、服务器),支持基于 embedding 模型的自动向量化处理,以及查询、过滤、密度估计等操作,适用于快速构建基于语义的搜索和推荐等应用。
import chromadb client = chromadb.Client() collection = client.create_collection("all-my-documents") collection.add( documents=["This is document1", "This is document2"], # we handle tokenization, embedding, and indexing automatically. You can skip that and add your own embeddings as well metadatas=[{"source": "notion"}, {"source": "google-docs"}], # filter on these! ids=["doc1", "doc2"], # unique for each doc ) results = collection.query( query_texts=["This is a query document"], n_results=2, # where={"metadata_field": "is_equal_to_this"}, # optional filter # where_document={"$contains":"search_string"} # optional filter )
GitHub 地址→github.com/chroma-core/chroma
1.2 Rust 的全栈 Web 框架:Loco
主语言:Rust ,Star:6.4k ,周增长:600
该项目是受 Ruby on Rails 启发的 Rust Web 框架,专为帮助开发者快速构建 Web 应用而设计。它结合了类似 Rails 的开发体验和 Rust 的高性能优势,支持 ORM 集成、后台任务、中间件(认证、日志、错误处理)、生成部署配置等功能,适用于开发个人项目和初创企业的 Web 应用。
GitHub 地址→github.com/loco-rs/loco
1.3 开箱即用的端口扫描工具:RustScan
主语言:Rust ,Star:15k
这是一个用 Rust 开发的端口扫描工具,能够在 3 秒内扫描指定 IP 的所有端口。它提供了灵活的脚本引擎,支持 Python、Lua 和 Shell 脚本,开发者可以根据需求自定义脚本,实现个性化的扫描和处理逻辑。
GitHub 地址→github.com/RustScan/RustScan
1.4 实时更新的轻量级推荐系统:monolith
主语言:Python ,Star:6.6k ,周增长:2.4k
该项目是字节跳动开源的一款轻量级推荐系统,旨在提升推荐系统的准确性和实时性。它基于 TensorFlow 构建,支持无冲突嵌入表(collisionless embedding tables)、批量和实时训练等功能,能够快速响应用户的行为变化,并及时更新模型,提升推荐效果。
GitHub 地址→github.com/bytedance/monolith
1.5 构建实时 AI 系统的 Python 框架:pathway
主语言:Python ,Star:12k ,周增长:1.4k
这是一个专为流处理、实时分析、LLM 管道和 RAG 应用设计的 Python ETL 框架。它底层采用 Rust 引擎,具备高吞吐和低延迟的实时处理能力,同时提供简单易用的 Python API 和可视化监控面板,支持多种数据源、数据转换和持久化等功能。
GitHub 地址→github.com/pathwaycom/pathway
2. HelloGitHub 热评
在此章节中,我们将为大家介绍本周 HelloGitHub 网站上的热门开源项目,我们不仅希望您能从中收获开源神器和编程知识,更渴望"听"到您的声音。欢迎您与我们分享使用这些开源项目的亲身体验和评价,用最真实反馈为开源项目的作者注入动力。
2.1 相见恨晚的 Python 项目打包工具:pex
主语言:Python
这是一个开源的 Python 项目打包工具,专为跨环境部署和无法访问公网的部署场景设计。它能够将 Python 项目及其所有依赖,甚至是 Python 解释器(可选),打包成单个可执行文件(.pex),让开发者无需安装运行环境,即可直接运行 Python 程序,支持 Linux 和 macOS 系统。
项目详情→hellogithub.com/repository/5c47cbf587f448fd8c4106436b3de8e3
2.2 一键部署完整的家庭多媒体中心:docker-xiaoya
主语言:Shell
该项目提供了一键部署 Alist、Emby 和 Jellyfin 服务的解决方案,帮你轻松构建完整的家庭多媒体中心,支持 Linux、macOS、Windows 等平台。
项目详情→hellogithub.com/repository/c0360e74337e448b852ab96ea4382a62
3. 结尾
以上就是本期「GitHub 热点速览」的全部内容,希望这些开源项目能激发你的兴趣,成为你下一个值得尝试的工具!如果你有其他好玩、有趣的 GitHub 开源项目想要分享,欢迎来 HelloGitHub 与我们交流和讨论。
往期回顾

低调大师中文资讯倾力打造互联网数据资讯、行业资源、电子商务、移动互联网、网络营销平台。
持续更新报道IT业界、互联网、市场资讯、驱动更新,是最及时权威的产业资讯及硬件资讯报道平台。
转载内容版权归作者及来源网站所有,本站原创内容转载请注明来源。
- 上一篇
Gitee AI 发布一周年:用本土算力打造企业级 AI 开发加速器
欢迎来到 2025 年!你的 2024 年终总结都写好了吗?记得发博客,私信【开源中国编辑肖滢】哦! 想看大家的年终总结?请看专栏:【拜拜,2024!】 2023年12月31日,Gitee AI 正式开启内测。一年以来,Gitee AI 受到了国内诸多 AI 开发者及爱好者的关注,迅速成为国内开源 AI 生态的重要创新阵地。 Gitee AI 将继续秉持开放的心态,提供模型体验、推理、训练、部署和应用的一站式服务,提供充沛算力,努力做中国最好的 AI 社区,让 AI 应用开发从此简单! 顶尖国产算力厂商齐聚 Gitee AI 始终坚持使用国产算力,为国内开发者提供更高效、更自主的开源模型、数据集和应用落地场景服务。针对中国市场和用户需求,与本土的 AI 生态系统进行深度融合,通过构建一个自主、健康、可持续的 AI 生态系统,推动国产技术的创新与发展。 Gitee AI 已先后与天数智芯、沐曦 MetaX、华为昇腾、曙光智算、燧原科技、壁仞科技等国内顶尖算力厂商达成合作关系(更多国产算力正洽谈接入中),共同推动算力资源普惠化,使更多开发者能够以更低的门槛参与到 AI 的创新浪潮中。 企业...
- 下一篇
IvorySQL 升级指南:从 3.x 到 4.0 的平滑过渡
日前,IvorySQL 4.0 重磅发布,全面支持 PostgreSQL 17,并且增强了对 Oracle 的兼容性。关于 IvorySQL 4.0 的介绍,各位小伙伴可以通过这篇文章回顾:IvorySQL 4.0 发布:全面支持 PostgreSQL 17. 在 IvorySQL 4.0 发布后,有小伙伴私下询问升级方法,那么本篇文章就来详细描述一下,如何从 IvorySQL 3.x 升级到 IvorySQL 4.0。 pg_upgrade 工具介绍 pg_upgrade 工具是 PostgreSQL 内置的跨版本升级工具,能够对数据库就地升级,不需要执行导出和导入操作。IvorySQL 源自于 PG,因此也能够使用 pg_upgrade 工具进行大版本升级。 pg_upgrade 提供了升级前的兼容性检查(-c 或者 --check 选项)功能,可以发现插件、数据类型不兼容等问题。如果指定了 --link 选项,新版本服务可以直接使用原有的数据库文件而不需要执行复制,通常可以在几分钟内完成升级操作。 常用的参数包括: -b bindir,--old-bindir=bindir:旧的...
相关文章
文章评论
共有0条评论来说两句吧...
文章二维码
点击排行
推荐阅读
最新文章
- Springboot2将连接池hikari替换为druid,体验最强大的数据库连接池
- CentOS7设置SWAP分区,小内存服务器的救世主
- Mario游戏-低调大师作品
- Docker使用Oracle官方镜像安装(12C,18C,19C)
- 2048小游戏-低调大师作品
- Jdk安装(Linux,MacOS,Windows),包含三大操作系统的最全安装
- MySQL8.0.19开启GTID主从同步CentOS8
- CentOS8安装Docker,最新的服务器搭配容器使用
- CentOS8安装MyCat,轻松搞定数据库的读写分离、垂直分库、水平分库
- CentOS7编译安装Cmake3.16.3,解决mysql等软件编译问题