向量数据库领域又来一个很屌的项目,PostgresML
PostgresML是PostgreSQL的机器学习扩展,能让你使用SQL查询对文本和表格数据进行训练和推理。有了PostgresML,你可以将机器学习模型无缝集成到PostgreSQL数据库中,并利用尖端算法的强大功能高效处理数据。
- 执行自然语言处理任务,如情感分析、提问和回答、翻译、总结和文本生成
- 从 HuggingFace 模型 Hub 访问数千种最先进的语言模型,如 GPT-2、GPT-J 和 GPT-Neo
- 针对不同任务,在自己的文本数据上微调大型语言模型
- 将现有的 PostgreSQL 数据库用作向量数据库,从存储在数据库中的文本生成 embedding
针对文本数据操作:
翻译
SQL 查询
SELECT pgml.transform( 'translation_en_to_fr', inputs => ARRAY[ 'Welcome to the future!', 'Where have you been all this time?' ] ) AS french;
french ------------------------------------------------------------ [ {"translation_text": "Bienvenue à l'avenir!"}, {"translation_text": "Où êtes-vous allé tout ce temps?"} ]
SELECT pgml.transform( task => 'text-classification', inputs => ARRAY[ 'I love how amazingly simple ML has become!', 'I hate doing mundane and thankless tasks. ☹️' ] ) AS positivity;
positivity ------------------------------------------------------ [ {"label": "POSITIVE", "score": 0.9995759129524232}, {"label": "NEGATIVE", "score": 0.9903519749641418} ]
针对表格数据操作:
训练分类模型
训练
SELECT * FROM pgml.train( 'Handwritten Digit Image Classifier', algorithm => 'xgboost', 'classification', 'pgml.digits', 'target' );
SELECT pgml.predict( 'My Classification Project', ARRAY[0.1, 2.0, 5.0] ) AS prediction;

低调大师中文资讯倾力打造互联网数据资讯、行业资源、电子商务、移动互联网、网络营销平台。
持续更新报道IT业界、互联网、市场资讯、驱动更新,是最及时权威的产业资讯及硬件资讯报道平台。
转载内容版权归作者及来源网站所有,本站原创内容转载请注明来源。
- 上一篇
腾讯 TDesignFlutter 组件库开源啦🎉🎉🎉
简介 作为一款诞生于腾讯内部开源、经过超500项内部业务检验的企业级设计体系,TDesign 汇集了腾讯众多优秀组件库能力和设计研发经验。之前,TDesign已经支持 Vue2、Vue Next、React 等业界主流技术栈,方便使用者快速开发桌面端、移动端以及小程序等多个版本的应用程序,从而更好地服务设计师和开发者,助力企业提升设计研发效能,为产品体验设计带来新的思路。 Flutter跨平台框架自2018年开源以来,迅速发展,拥有大量用户。Flutter采用自绘引擎,可以在不同平台上实现高性能、流畅的用户界面,用户体验出色。此外,Flutter的跨平台特性使开发者只需编写一次代码,即可在多个平台上运行,减少开发和维护成本。Flutter以其高效的开发流程、卓越的性能和跨平台能力,成为跨平台应用开发的首选框架。 TDesignFlutter不但拥有Flutter流畅的跨平台开发体验,而且拥有TDesign美观一致的设计资源。二者结合,开发者可以直接使用TDesign的组件构建Flutter应用,加快开发速度的同时,也确保了应用程序的一致性。在腾讯内部,TDesignFlutter已支持...
- 下一篇
防御性编程几大基本原则
当开发人员遇到意外的错误无法修复时,他们会“添加一些防御性代码”来使代码更安全,更容易找到问题所在。有时候,仅仅这样做就能解决问题。他们会加强数据验证——确保检查输入和输出字段以及返回值。审查并改进错误处理——也许在“不可能”的情况周围添加一些检查。增加一些有用的日志记录和诊断功能。换句话说,这些本应该从一开始就存在的代码。 防御性编程的整个目的是为了防范你意想不到的错误。 ——Steve McConnell,《代码大全》 防御性编程的几个基本原则在Steve McConnell经典著作《代码大全》中有详细解释: 保护你的代码免受“外部”传入的无效数据影响,无论你认为“外部”是指什么地方。这里指来自外部系统、用户、文件或模块/组件之外的任何数据。建立“壁垒”、“安全区域”或“信任边界”——边界之外的一切都是危险的,边界之内的一切都是安全的。在壁垒代码中,验证所有输入数据:检查所有输入参数的正确类型、长度和取值范围。再次检查限制和范围。 在检查完坏数据后,决定如何处理它。防御性编程并不意味着吞没错误或隐藏错误。它是关于在健壮性(如果遇到可处理的问题则继续运行)和正确性(永远不返回错误结果...
相关文章
文章评论
共有0条评论来说两句吧...
文章二维码
点击排行
推荐阅读
最新文章
- CentOS6,CentOS7官方镜像安装Oracle11G
- CentOS7,8上快速安装Gitea,搭建Git服务器
- SpringBoot2整合Thymeleaf,官方推荐html解决方案
- MySQL8.0.19开启GTID主从同步CentOS8
- SpringBoot2更换Tomcat为Jetty,小型站点的福音
- Red5直播服务器,属于Java语言的直播服务器
- CentOS6,7,8上安装Nginx,支持https2.0的开启
- CentOS8,CentOS7,CentOS6编译安装Redis5.0.7
- Jdk安装(Linux,MacOS,Windows),包含三大操作系统的最全安装
- SpringBoot2整合MyBatis,连接MySql数据库做增删改查操作