Linux中如何保证数据安全落盘

2019-06-14 1082

背景

在很多IO场景中，我们经常需要确保数据已经安全的写到磁盘上，以便在系统宕机重启之后还能读到这些数据。但是我们都知道，linux系统的IO路径还是很复杂的，分为很多层，每一层都可能会有buffer来加速IO读写。同时，用户态的应用程序和库函数也可能拥有自己的buffer，这又给IO路径增加了一些复杂性。可见，要想保证数据安全的写到磁盘上，并不是简单调一个write/fwrite就可以搞定的。

那么要怎么做呢？很多人会想到很多办法，比如：fflush()、fsync()、fdatasync()、sync()、open()使用O_DIRECT或O_SYNC标志等。嗯，这些手段（或者某些组合）的确可以保证数据安全的持久化，那么它们之间有什么区别呢？fflush()和fsync()有啥区别？O_DIRECT是啥意思，它可以保证数据安全的持久化吗？O_DIRECT和O_SYNC区别什么？O_SYNC和fsync()呢？fsync能完成msync的功能吗？本文将试图理解、解释这些概念的作用和区别。

Linux IO

所谓一图胜千言，为了解析清楚这些概念的区别，我特意画了一张图，仔细看，应该可以清晰的看出它们的作用和区别。

这里重点说一下O_DIRECT和O_SYNC，首先要明确的是，O_DIRECT只是说数据不会经过page cache（一般用在用户态自己管理buffer）而是直接提交给块设备层，但是不会同步等待数据安全写入磁盘之后才返回（比如数据可能还在块层排队或者在磁盘自己的cache中）。而O_SYNC标志，虽然数据还是会写page cache，但是此时会采用write through的策略，并同步等待数据安全写入磁盘后才会返回。因此如果同时使用O_DIRECT和O_SYNC，则表示数据不会经过page cache并同步等待数据安全写入磁盘才返回，当然这样IO的性能会非常低下。

由于O_DIRECT会bypass page cache，因此如果有另一个进程使用普通的方式读文件，有可能会出现数据不一致的现象，这个也需要注意。

为了做一下辅助说明，此处我贴一下我探讨过程中看过的一些资料。首先是引用open系统调用：http://man7.org/linux/man-pages/man2/open.2.html 相关参数的说明：

以及innodb相关的文档：https://lwn.net/Articles/457667/

fsync和fdatasync的区别：http://man7.org/linux/man-pages/man2/fsync.2.html

msync:http://man7.org/linux/man-pages/man2/msync.2.html

DAX

其实还有一种IO模式，就是DAX（Direct Access ），是不是看上去和O_DIRECT很像。这种模式需要filesystem和block driver都支持才可以，一般主要用在non volatile memory上，本质上也是绕过page cache直接操作设备。DAX本文先不做深入探讨，后面我会自己写一个支持DAX模式的ramdisk块设备驱动，然后格式化为ext4文件系统并-o dax模式挂载，再来详细研究DAX的IO路径。https://www.kernel.org/doc/Documentation/filesystems/dax.txt

最后附上Linux在常见场景下的io路径跟踪：https://my.oschina.net/fileoptions/blog/3061822

参考

参照：https://blog.pythian.com/innodb-flushing-linux-io/

微信关注我们

原文链接：https://my.oschina.net/fileoptions/blog/3061997

转载内容版权归作者及来源网站所有！

低调大师中文资讯倾力打造互联网数据资讯、行业资源、电子商务、移动互联网、网络营销平台。持续更新报道IT业界、互联网、市场资讯、驱动更新,是最及时权威的产业资讯及硬件资讯报道平台。

BeeGFS开发环境搭建4-源码编译

如果我们需要动态调试和开发BeeGFS，那么就需要自己手动编译了，而且能够用最简单的方式运行起来，下面就讲解自己探索和分析的过程。参考文档： # https://git.beegfs.io/pub # https://www.beegfs.io/wiki/BuildFromSources 初始化环境安装依赖的软件包： $ yum install -y libuuid-devel libibverbs-devel librdmacm-devel libattr-devel redhat-rpm-config rpm-build xfsprogs-devel cppunit cppunit-devel zlib-devel openssl-devel sqlite sqlite-devel ant gcc-c++ gcc redhat-lsb-core java-devel 获取官方源码获取指定版本的源码： $ git clone https://git.beegfs.io/pub/v6.git beegfs-v6 $ cd beegfs-v6 $ git tag -l 6.1 6....

2019-06-13

928

LnskyDB LnskyDB是基于Dapper的Lambda扩展,支持按时间分库分表,也可以自定义分库分表方法.而且可以T4生成实体类免去手写实体类的烦恼. 开源地址 https://github.com/liningit/LnskyDB 在此非常感谢SkyChenSky其中lambda表达式的解析参考了他的开源项目下面是用ProductSaleByDayEntity作为示例,其中StatisticalDate为分库分表字段,如果是对分库分表对象进行数据库操作则必须传入StatisticalDate或者设置DBModel_ShuffledTempDate指定是那个库和表 1. 仓储的创建仓储的创建有两种方式一种是通过RepositoryFactory.Create<ProductSaleByDayEntity>()创建IRepository<ProductSaleByDayEntity> 还有一种是创建一个仓储类继承Repository<ProductSaleByDayEntity> public interface IProductSaleB...

2019-06-14

537

资源下载

更多资源

Mario

马里奥是站在游戏界顶峰的超人气多面角色。马里奥靠吃蘑菇成长，特征是大鼻子、头戴帽子、身穿背带裤，还留着胡子。与他的双胞胎兄弟路易基一起，长年担任任天堂的招牌角色。

Rocky Linux

Rocky Linux（中文名：洛基）是由Gregory Kurtzer于2020年12月发起的企业级Linux发行版，作为CentOS稳定版停止维护后与RHEL（Red Hat Enterprise Linux）完全兼容的开源替代方案，由社区拥有并管理，支持x86_64、aarch64等架构。其通过重新编译RHEL源代码提供长期稳定性，采用模块化包装和SELinux安全架构，默认包含GNOME桌面环境及XFS文件系统，支持十年生命周期更新。

Sublime Text

Sublime Text具有漂亮的用户界面和强大的功能，例如代码缩略图，Python的插件，代码段等。还可自定义键绑定，菜单和工具栏。Sublime Text 的主要功能包括：拼写检查，书签，完整的 Python API ， Goto 功能，即时项目切换，多选择，多窗口等等。Sublime Text 是一个跨平台的编辑器，同时支持Windows、Linux、Mac OS X等操作系统。

WebStorm

WebStorm 是jetbrains公司旗下一款JavaScript 开发工具。目前已经被广大中国JS开发者誉为“Web前端开发神器”、“最强大的HTML5编辑器”、“最智能的JavaScript IDE”等。与IntelliJ IDEA同源，继承了IntelliJ IDEA强大的JS部分的功能。

Linux中如何保证数据安全落盘

背景

Linux IO

DAX

参考

BeeGFS开发环境搭建4-源码编译

基于Dapper的开源Lambda扩展,且支持分库分表自动生成实体

相关文章

发表评论

资源下载

Mario

Rocky Linux

Sublime Text

WebStorm

欢迎您来访！