Feathr 0.9 发布,领英开源的企业级高性能特征存储
Feathr 是领英为简化机器学习 (ML) 功能管理和提高开发者生产力而构建的特征存储,并已在生产环境中使用多年,该项目于今年 4 月正式开源。
重要变化:
将派生功能的执行引擎改为 Spark SQL,所以对于没有运行最新样本 notebooks 的用户来说,这可能会带来一点破坏性的变化。具体而言,他们可能会面临下方的问题:
Preprocessed DataFrames are: {'feature_user_age,feature_user_gift_card_balance,feature_user_has_valid_credit_card,feature_user_tax_rate': JavaObject id=o243} Traceback (most recent call last): File "feathr_pyspark_driver.py", line 107, in <module> submit_spark_job(feature_names_funcs) File "feathr_pyspark_driver.py", line 85, in submit_spark_job py4j_feature_job.mainWithPreprocessedDataFrame(job_param_java_array, new_preprocessed_df_map) File "/home/trusted-service-user/cluster-env/env/lib/python3.8/site-packages/py4j/java_gateway.py", line 1304, in __call__ return_value = get_return_value( File "/opt/spark/python/lib/pyspark.zip/pyspark/sql/utils.py", line 117, in deco pyspark.sql.utils.AnalysisException: Undefined function: 'toBoolean'. This function is neither a registered temporary function nor a permanent function registered in the database 'default'.; line 1 pos 84 )
用户应该修改下方的代码:
feature_user_purchasing_power = DerivedFeature(name="feature_user_purchasing_power", key=user_id, feature_type=FLOAT, input_features=[ feature_user_gift_card_balance, feature_user_has_valid_credit_card], transform="feature_user_gift_card_balance + if_else(toBoolean(feature_user_has_valid_credit_card), 100, 0)")
为这个:
feature_user_purchasing_power = DerivedFeature(name="feature_user_purchasing_power", key=user_id, feature_type=FLOAT, input_features=[ feature_user_gift_card_balance, feature_user_has_valid_credit_card], transform="feature_user_gift_card_balance + if(boolean(feature_user_has_valid_credit_card), 100, 0)")
其他变化:
- 修复特征类型错误 #701
- 修复 Purview+RBAC 注册表的网络应用问题 #700
- 删除文档中的硬编码资源 #696
- 添加 Purview 注册表和 RBAC 注册表的 e2e 测试 #689
- 改进 databricks 提交的错误信息 #710
- 改进 purview 注册表的错误信息 #709
- [WIP] 热修复 databricks es 的依赖性问题 #713
- Fix materialize to sql e2e test failure by @blrchen in #717
- 在 Feathr 中添加数据模型 #659
- 修复将特征定义转换为 HOCON 文件时的查找特征缺失问题
- 修复函数字符串解析问题 #725
- 删除未使用的证书和废弃的 purview 设置
- 撤销错误提交的 adb 令牌 #730
- 修复 synapse 错误不打印的问题 #734
- 修复 Spark 配置传递错误 #729
- 在派生特征转换中支持 SQL 表达式 #731
更多详情可查看:https://github.com/feathr-ai/feathr/releases/tag/v0.9.0

低调大师中文资讯倾力打造互联网数据资讯、行业资源、电子商务、移动互联网、网络营销平台。
持续更新报道IT业界、互联网、市场资讯、驱动更新,是最及时权威的产业资讯及硬件资讯报道平台。
转载内容版权归作者及来源网站所有,本站原创内容转载请注明来源。
- 上一篇
Alpine Linux 3.17 发布,默认使用 OpenSSL 3.0
Alpine Linux 是一个面向安全的轻量级Linux 发行版,该发行版以安全为理念,面向 x86 路由器、防火墙、虚拟专用网、IP 电话盒及服务器而设计。 另外,不同于常见的Linux 发行版,Alpine Linux 采用musl libc和busybox,以减小系统的体积和运行时资源消耗。由于其非常轻量级的特性,Alpine Linux 至今仍然是容器和嵌入式 Linux 部署的热门选择。 目前Alpine Linux 3.17 发布了,此版本仍然由 Linux 5.15 LTS 内核系列提供支持,但把默认的 OpenSSL 实现升级到 OpenSSL 3.0 版本,此外,Rust 现在可用于所有支持的架构。 Alpine Linux 3.17 还附带了一些最新的 GNU/Linux 和开源技术,例如 GCC 12、LLVM 15、GNU Bash 5.2、Kea 2.2、Perl 5.36、PostgreSQL 15、Node.js 18.12 LTS 和 19.1、Ceph 17.2、Go 1.19、Rust 1.64 和 .NET 7.0.100。 需要注意的是此版本弃...
- 下一篇
Spring Security 5.8 和 6.0 正式 GA
Spring Security 6.0 现已普遍可用。与此同时 Spring Security 5.8 也已全面上市,以简化到 6.0 的升级。 Spring Security 是一个能够为基于 Spring 的企业应用系统提供声明式的安全访问控制解决方案的安全框架。它提供了一组可以在 Spring 应用上下文中配置的 Bean,充分利用了 Spring IoC,DI(控制反转 Inversion of Control ,DI:Dependency Injection 依赖注入)和 AOP(面向切面编程)功能,为应用系统提供声明式的安全访问控制功能,减少了为企业系统安全控制编写大量重复代码的工作。 5.8 版本带来了许多增强功能,例如会话处理改进、对AuthorizationManagerAPI 的扩展支持以及对 CSRF BREACH 支持带来的额外深度防御。可查看Spring Security 5.8中的新增功能以获取该版本中可用的新功能列表。 6.0 版本增加了与 Spring Observability 的集成,并支持 Spring Framework 6 提供的 AOT 处理...
相关文章
文章评论
共有0条评论来说两句吧...
文章二维码
点击排行
推荐阅读
最新文章
- Docker快速安装Oracle11G,搭建oracle11g学习环境
- CentOS7安装Docker,走上虚拟化容器引擎之路
- Docker安装Oracle12C,快速搭建Oracle学习环境
- SpringBoot2全家桶,快速入门学习开发网站教程
- CentOS7设置SWAP分区,小内存服务器的救世主
- CentOS7,CentOS8安装Elasticsearch6.8.6
- Hadoop3单机部署,实现最简伪集群
- SpringBoot2更换Tomcat为Jetty,小型站点的福音
- Docker使用Oracle官方镜像安装(12C,18C,19C)
- SpringBoot2配置默认Tomcat设置,开启更多高级功能