Chroma —— 开源嵌入式数据库
Chroma 是一个开源嵌入式数据库,宣称是使用内存构建 Python 或 JavaScript LLM 应用程序的最快方法。
特点:
- 简单:完全类型化、完全测试、完全文档化
- 集成:LangChain (Python 和 JS)、LlamaIndex 等
- 开发、测试、生产:在 Python notebook 中运行相同 API,可以扩展到你的集群。
- 功能丰富:查询、过滤、密度估计等。
- 免费和开源:Apache 2.0
pip install chromadb # python client # for javascript, npm install chromadb! # for client-server mode, docker-compose up -d --build
核心 API 仅包含 4 个函数:
import chromadb # setup Chroma in-memory, for easy prototyping. Can add persistence easily! client = chromadb.Client() # Create collection. get_collection, get_or_create_collection, delete_collection also available! collection = client.create_collection("all-my-documents") # Add docs to the collection. Can also update and delete. Row-based API coming soon! collection.add( documents=["This is document1", "This is document2"], # we handle tokenization, embedding, and indexing automatically. You can skip that and add your own embeddings as well metadatas=[{"source": "notion"}, {"source": "google-docs"}], # filter on these! ids=["doc1", "doc2"], # unique for each doc ) # Query/search 2 most similar results. You can also .get by id results = collection.query( query_texts=["This is a query document"], n_results=2, # where={"metadata_field": "is_equal_to_this"}, # optional filter # where_document={"$contains":"search_string"} # optional filter )

低调大师中文资讯倾力打造互联网数据资讯、行业资源、电子商务、移动互联网、网络营销平台。
持续更新报道IT业界、互联网、市场资讯、驱动更新,是最及时权威的产业资讯及硬件资讯报道平台。
转载内容版权归作者及来源网站所有,本站原创内容转载请注明来源。
- 上一篇
每日一博 | 一条 SQL 如何被 MySQL 架构中的各个组件操作执行的?
摘要:一条SQL如何被MySQL架构中的各个组件操作执行的,执行器做了什么?存储引擎做了什么?表关联查询是怎么在存储引擎和执行器被分步执行的?本文带你探探究竟! 本文分享自华为云社区《一条SQL如何被MySQL架构中的各个组件操作执行的?》,作者:砖业洋__。 1. 单表查询SQL在MySQL架构中的各个组件的执行过程 简单用一张图说明下,MySQL架构有哪些组件,接下来给大家用SQL语句分析 假如SQL语句是这样 SELECT class_no FROM student WHERE name = 'lcy' AND age > 18 GROUP BY class_no 其中name为索引,我们按照时间顺序来分析一下 1.客户端:客户端(如MySQL命令行工具、Navicat、MySQL Workbench或其他应用程序)发送SQL查询到MySQL服务器。 2.连接器:连接器负责与客户端建立连接、管理连接和维护连接。当客户端连接到MySQL服务器时,连接器验证客户端的用户名和密码,然后分配一个线程来处理客户端的请求。 3.查询缓存:查询缓存用于缓存先前执行过的查询及其结果。当收到...
- 下一篇
开源软件:甲骨文和苹果最爱,俄罗斯下载量增长最快
Scarf 是一家成立于美国加利福尼亚的公司,为开源下载和采用指标构建对维护者友好的工具,以实现有效、可观察和公平的软件分发。目前,Scarf 收集了约 2000 个开源软件包的元数据和分析数据,并且每周都会加入更多新的项目。 Scarf 采用了两种不同的方法来分析使用数据,以获得更准确的下载和使用开源软件的统计信息。第一种方法依赖于下载标头和元数据。 收集使用数据的第二种方法涉及让项目向其文档、README 和其他内容中添加 Scarf 的特点元素。这使得项目能够通过获取关于谁阅读他们文档、最活跃页面等指标来跟踪它们自己的增长情况。通过结合这两种方法,可以获得更加准确的信息。 2023 年第一季度开源使用指标 Scarf 的统计数据显示,在 2023 年第一季度,开源项目的下载量比上一季度增长了近 60%,开源软件的总下载量超过了 2.4 亿次(这个总数中不到 0.5% 的下载量来自于 2022 年第四季度和 2023 年第一季度新增的软件包)。下载开源软件包的唯一终端的数量按季度增长了约 5%,最高时略高于 620 万个唯一终端(唯一终端数量是指下载软件的唯一服务器或计算机)。 企...
相关文章
文章评论
共有0条评论来说两句吧...
文章二维码
点击排行
推荐阅读
最新文章
- Docker使用Oracle官方镜像安装(12C,18C,19C)
- SpringBoot2配置默认Tomcat设置,开启更多高级功能
- Red5直播服务器,属于Java语言的直播服务器
- CentOS7设置SWAP分区,小内存服务器的救世主
- CentOS7安装Docker,走上虚拟化容器引擎之路
- SpringBoot2编写第一个Controller,响应你的http请求并返回结果
- CentOS关闭SELinux安全模块
- CentOS7,CentOS8安装Elasticsearch6.8.6
- Jdk安装(Linux,MacOS,Windows),包含三大操作系统的最全安装
- Linux系统CentOS6、CentOS7手动修改IP地址