Linux下一次删除百万文件
线上环境遇到的一个问题,文件数量过多,执行rm命令报错
# rm -f ./*
-bash: /bin/rm: Argument list too long
根据报错检查状态
# ls | wc -l
634084
# du -sh
64G
在线下环境进行故障复现
测试环境准备
# df -Th
Filesystem Type Size Used Avail Use% Mounted on
/dev/sda3 ext4 1.8T 331G 1.4T 20% /
tmpfs tmpfs 7.7G 0 7.7G 0% /dev/shm
/dev/sda1 ext4 190M 61M 120M 34% /boot
# grep name /proc/cpuinfo
model name : Intel(R) Xeon(R) CPU E5-2609 v3 @ 1.90GHz
model name : Intel(R) Xeon(R) CPU E5-2609 v3 @ 1.90GHz
model name : Intel(R) Xeon(R) CPU E5-2609 v3 @ 1.90GHz
model name : Intel(R) Xeon(R) CPU E5-2609 v3 @ 1.90GHz
model name : Intel(R) Xeon(R) CPU E5-2609 v3 @ 1.90GHz
model name : Intel(R) Xeon(R) CPU E5-2609 v3 @ 1.90GHz
# free -m
total used free shared buffers cached
Mem: 15709 1643 14066 8 452 559
-/+ buffers/cache: 631 15078
Swap: 8191 0 8191
# cat /etc/redhat-release
CentOS release 6.8 (Final)
# uname -r
2.6.32-642.1.1.el6.x86_64
测试生成测试数据
# for i in `seq 1000000`;do echo "${i}" >> ${i}.txt;done
# ls | wc -l
1000000
# du -sh
3.9G .
# ls *.txt
-bash: /bin/ls: Argument list too long
# rm -f ./*
-bash: /bin/rm: Argument list too long
方法1:使用for循环方式执行删除任务
# time for i in `ls ./`;do rm -f ${i};done
real 58m44.234s
user 8m59.930s
sys 37m16.453s
时间太长了,绝壁不能忍
方法2:直接删目录
# time rm -rf test && mkdir test
real 0m56.768s
user 0m1.453s
sys 0m22.603s
# du -sh test
4.0K test
速度不错,然而很多情况下不能直接删目录,有点蛋疼
方法3:使用 find + xargs 组合命令执行删除任务(网上流传最多的方法)
# time find ./ -type f | xargs -n 1 rm -f
real 18m30.267s
user 0m9.536s
sys 1m38.999s
# time find ./ -type f | xargs rm -f
real 16m16.774s
user 0m2.232s
sys 0m30.454s
一样蛋疼,如果需求是删除全部文件的话,用这种方法就太low了,适合删除部分数据的场景
方法4:使用 ls + xargs 组合命令执行删除任务
# time ls | xargs -L 100 rm -f
real 1m3.801s
user 0m7.054s
sys 0m28.582s
# time ls | xargs -L 1000 rm -f
real 0m55.917s
user 0m5.322s
sys 0m24.778s
# time ls | xargs -L 2000 rm -f
real 0m55.560s
user 0m5.209s
sys 0m24.702s
# time ls | xargs -L 5000 rm -f
real 0m55.057s
user 0m5.196s
sys 0m24.666s
# time ls | xargs -L 10000 rm -f
real 0m55.733s
user 0m5.121s
sys 0m24.657s
# time ls | xargs -L 100000 rm -f
xargs: argument list too long
real 0m4.018s
user 0m3.324s
sys 0m0.701s
速度杠杠滴~~但是注意文件名长度,选择合适的传参数量
方法5:使用rsync命令来执行删除任务
# mkdir /tmp/Null
# time rsync --delete-before -d /tmp/Null/ ./
real 0m56.386s
user 0m1.767s
sys 0m28.075s
# ll
total 0
# du -sh ./
29M ./
没什么优点,缺点是rsync命令比较冷门,参数不容易记住,用的机会也不多,作为拓展方法了解一下就好
如果你有其他好的方法,可以一起探讨一下~~

低调大师中文资讯倾力打造互联网数据资讯、行业资源、电子商务、移动互联网、网络营销平台。
持续更新报道IT业界、互联网、市场资讯、驱动更新,是最及时权威的产业资讯及硬件资讯报道平台。
转载内容版权归作者及来源网站所有,本站原创内容转载请注明来源。
- 上一篇
Linux权限管理命令chown、chgrp
一、chown命令与chgrp命令的作用 有时你需要改变文件或目录的属主,比如有人离职或开发人员创建了一个在测试或生产环境中需要归属在系统账户下的应用。Linux提供了两个命令来实现这个功能:chown命令用来改变文件的属主,chgrp命令用来改变文件的默认属组。 二、chown命令与chgrp命令的语法 chown命令语法:chown owner file chgrp命令语法:chgrp group file owner:指定的所属者或UID,也就是新的所属者。 group:指定的所属组,也就是新的所属组。 file:指定的文件或目录。 三、效果演示 在temp目录下创建55555.txt文件,然后查看该文件的默认所属者和所属组,Linux命令如下,效果如图3-1所示。 1 touch 55555.txt 2 ls -l 55555.txt 图 3-1 从图3-1可以看出,55555.txt文件的默认所属者和所属组都是centos,接下来要改变55555.txt文件的所属者和所属组,但是当前登录用户必须要有权限改变 文件的所属者与所属组,所以切换root用户来改变。 首先改变...
- 下一篇
阿里云ECS里为CentOS服务器申请CA证书配置SSL
本文记录阿里云ECS申请CA证书流程 先到阿里云控制台找到CA证书服务,这里两台ECS都已经申请签发了证书,如果是还没申请的就在“状态”中点击补全; 进去后填写完个人信息后,这里选择免费证书; 提交申请后就可以等待审核了,在审核过程中可以点击“进度”进行查看,在“进度”里面可以先按操作进行配置,在里面阿里云会给我们生成一个fileauth.txt文件,此时我们先在服务器上的/opt目录下新建/ssl/.well-known/pki-validation目录,把阿里云下载下来的fileauth.txt文件放进去(这里服务器上用了nginx); 同时在在/usr/local/nginx/conf/nginx.conf文件下的server(80端口)中添加如下: location ^~ /.well-known/pki-validation/fileauth.txt { root /opt/ssl; autoindex on; } 接着在浏览器访问是否配置成功,如果看到如下信息,证明成功; 接着阿里云审核通过后就会签发证书,在最开始界面点击“下载证书”,来到如下界面: 点击“下载...
相关文章
文章评论
共有0条评论来说两句吧...
文章二维码
点击排行
推荐阅读
最新文章
- CentOS7,CentOS8安装Elasticsearch6.8.6
- Linux系统CentOS6、CentOS7手动修改IP地址
- CentOS6,7,8上安装Nginx,支持https2.0的开启
- Docker安装Oracle12C,快速搭建Oracle学习环境
- CentOS7设置SWAP分区,小内存服务器的救世主
- CentOS8安装Docker,最新的服务器搭配容器使用
- 设置Eclipse缩进为4个空格,增强代码规范
- Docker使用Oracle官方镜像安装(12C,18C,19C)
- SpringBoot2全家桶,快速入门学习开发网站教程
- Jdk安装(Linux,MacOS,Windows),包含三大操作系统的最全安装