Greenmask —— 转储匿名化和合成数据生成工具
Greenmask 是一款功能强大的开源实用程序,专为逻辑数据库备份转储、匿名化、合成数据生成和恢复而设计。
它已移植 PostgreSQL 库,因此非常可靠。它是无状态的,不需要对数据库架构进行任何更改。它设计为高度可定制,并与现有的 PostgreSQL 实用程序向后兼容,快速可靠。
Greenmask 提供了一套安全的工具来转换你的数据库同时保持完整性,创建一个镜像生产数据的暂存环境并确保高效的测试而不损害信息。
特点:
- Database subset—市场上最先进的子集系统之一。它支持虚拟引用、可空列、多态引用,甚至可以使用循环引用对最复杂的架构进行子集化。
- Deterministic transformers — 使用哈希函数确保相同输入的输出一致。大多数转换器都支持
random
和hash
引擎,为各种用例提供灵活性。 - 动态参数— 大多数转换器都支持动态参数,允许它们根据表列值进行调整。此功能有助于管理列之间的依赖关系并有效满足约束。
- 转换条件—仅在满足指定条件时应用转换,这对于定位特定行很有用。
- 转换验证和轻松维护— Greenmask 在配置期间提供验证警告、数据转换差异和架构差异,从而实现对转换的有效监控和维护。架构差异功能有助于防止架构更改时的数据泄漏。
- 转换继承 — 分区表和带外键的表的转换继承。定义一次,应用于全部。
- 无状态—Greenmask 作为逻辑转储运行,不会影响您现有的数据库模式。
- 跨平台—由于其基于 Go 的架构消除了平台依赖性,因此可以在任何平台上轻松构建和执行。
- 数据库类型安全—通过验证数据并使用数据库驱动程序进行编码和解码操作来确保数据完整性,从而保留准确的数据格式。
- 向后兼容— 完全支持与标准 PostgreSQL 实用程序相同的功能和协议。Greenmask 创建的转储可以使用该
pg_restore
实用程序无缝恢复。 - 可扩展—用户可以灵活地使用 任何编程语言实现基于领域的转换或使用预定义的模板。
- 并行执行—支持并行转储和恢复,以显著加快结果。
- 多种存储—支持本地和远程存储,包括目录和 S3 兼容解决方案。
- Pgzip 支持更快的压缩— 通过设置
--pgzip
并行压缩来加速转储和恢复过程。

低调大师中文资讯倾力打造互联网数据资讯、行业资源、电子商务、移动互联网、网络营销平台。
持续更新报道IT业界、互联网、市场资讯、驱动更新,是最及时权威的产业资讯及硬件资讯报道平台。
转载内容版权归作者及来源网站所有,本站原创内容转载请注明来源。
- 上一篇
65.4% 受访者期待建立全方位的 AI 法规体系
中国青年报社社会调查中心联合问卷网,对1340名受访者进行的一项调查显示,近八成受访者最近使用过人工智能工具。内容生成、教育辅助、效率工具是人们现阶段使用AI工具的主要用途。未来,让人工智能更好地服务于人,65.4%的受访者希望建立覆盖伦理、算法等各方面的AI法规体系。 调查显示,78.3%的受访者使用过人工智能工具,其中,近三成(27.7%)频繁使用。交叉分析显示,受访在校大学生(90.2%)使用比最高,其次是党政机关/事业单位工作人员(83.8%),国有企业工作人员(82.0%)排在第三位。不同年龄段的受访者中,年龄越大使用人工智能的比例越低,00后比例最高,为85.1%。 在各种不同的AI工具中,豆包是人们使用最普遍的工具,超六成受访者(61.0%)表示都在使用,其次是文心一言(48.6%),DeepSeek(44.1%)排在第三位。其他主要还有:腾讯元宝(17.9%)、讯飞星火(17.4%)、Kimi(16.5%)、ChatGPT(11.3%)、千问(10.7%)。 人们现在使用AI工具主要是做什么?调查显示,内容生成(文案撰写/图像视频生成)(62.8%)是第一用途,其次是教...
- 下一篇
HTAP 已死
本文翻译自:《HTAP is Dead》 这篇博客受到Jordan Tigani文章《Big Data is Dead》的启发。 旧时代的岁月(70年代) 上世纪70年代,一个关系型数据库可以完成所有任务。白天处理事务(OLTP),晚上生成报表(OLAP)。像Oracle V2和IBM DB2这样的数据库在同一系统上运行OLTP和OLAP,主要是因为数据集仍然可以装在几个磁盘上,而计算资源昂贵。 没有人称之为混合事务/分析处理(HTAP);它只是数据库而已。 重大分歧(80年代) 随着企业拥有更多数据,并提出更复杂的问题,数据库开始显示出它的局限性。 事务型和分析型工作负载是朝着相反的方向发展的。OLTP需要微秒级的插入和单行查找,而OLAP则需要全表扫描和大规模的聚合。这导致了持续的争用;分析型工作负载消耗I/O和缓存,这些资源对于低延迟的事务型工作负载来说是必需的,反之亦然。 解决方案是什么?隔离这些工作负载。到20世纪80年代初,这种“巨大分歧”已经开始出现。 存储的分离(90年代) 推动这种分歧的一个关键技术因素是存储架构。OLTP系统针对基于行的存储进行了优化(快速写入 + ...
相关文章
文章评论
共有0条评论来说两句吧...