Tool之wget:wget的简介、安装、入门、使用方法之详细攻略
Tool之wget:wget的简介、安装、入门、使用方法之详细攻略
目录
wget的简介
wget 是一个从网络上自动下载文件的自由工具,支持通过 HTTP、HTTPS、FTP 三个最常见的 TCP/IP协议 下载,并可以使用 HTTP 代理。"wget" 这个名称来源于 “World Wide Web” 与 “get” 的结合。最初,wget 其实是在Linux系统下使用的。用wget下载东西,的确很方便,它会自动重连并断点续传。让人很放心。
wget 官网:http://www.gnu.org/software/wget/
wget 官网文档:http://www.gnu.org/software/wget/manual/
wget特点
- wget工具体积小但功能完善
- 它支持断点下载功能
- 同时支持FTP和HTTP下载方式,支持代理服务器和设置起来方便简单
Linux wget是一个下载文件的工具,它用在命令行下。对于Linux用户是必不可少的工具,尤其对于网络管理员,经常要下载一些软件或从远程服务器恢复备份到本地服务器。如果我们使用虚拟主机,处理这样的事务我们只能先从远程服务器下载到我们电脑磁盘,然后再用ftp工具上传到服务器。这样既浪费时间又浪费精力,那不没办法的事。而到了Linux VPS,它则可以直接下载到服务器而不用经过上传这一步。
wget是在Linux下开发的开放源代码的软件,作者是Hrvoje Niksic,后来被移植到包括Windows在内的各个平台上。
功能和特点:
- 支持断点下传功能;这一点,也是网络蚂蚁和FlashGet当年最大的卖点,现在,Wget也可以使用此功能,那些网络不是太好的用户可以放心了;
- 同时支持FTP和HTTP下载方式;尽管现在大部分软件可以使用HTTP方式下载,但是,有些时候,仍然需要使用FTP方式下载软件;
- 支持代理服务器;对安全强度很高的系统而言,一般不会将自己的系统直接暴露在互联网上,所以,支持代理是下载软件必须有的功能;
- 设置方便简单;可能,习惯图形界面的用户已经不是太习惯命令行了,但是,命令行在设置上其实有更多的优点,最少,鼠标可以少点很多次,也不要担心是否错点鼠标;
- 程序小,完全免费;程序小可以考虑不计,因为现在的硬盘实在太大了;完全免费就不得不考虑了,即使网络上有很多所谓的免费软件,但是,这些软件的广告却不是我们喜欢的;
wget虽然功能强大,但是使用起来还是比较简单的,基本的语法是:wget [参数列表] URL。下面就结合具体的例子来说明一下wget的用法。
wget命令
启动参数:这一类参数主要提供软件的一些基本信息。以下每一个功能有长短两个参数,长短功能一样,都可以使用。需要注意的是,这里的-e参数是执行一个.wgettrc的命令,.wgettrc命令其实是一个参数列表,直接将软件需要的参数写在一起就可以了。 | -V,--version 显示软件版本号然后退出; -h,--help显示软件帮助信息; -e,--execute=COMMAND 执行一个 “.wgetrc”命令 |
文件参数:这类参数定义软件log文件的输出方式等。 | -o,--output-file=FILE 将软件输出信息保存到文件;
|
下载参数:下载参数定义下载重复次数、保存文件名等。 | -t,--tries=NUMBER 是否下载次数(0表示无穷次) -O --output-document=FILE 指定下载目录和文件名 -nc, --no-clobber 不要覆盖已经存在的文件 -N,--timestamping只下载比本地新的文件 -T,--timeout=SECONDS 设置超时时间 -Y,--proxy=on/off 关闭代理 例:下载的首页并将下载过程中的的输入信息保存到test.htm文件中 wget -Otest.html |
目录参数:目录参数主要设置下载文件保存目录与原来文件(服务器文件)的目录对应关系; | -nd --no-directories 不建立目录 -x,--force-directories 强制建立目录 可能我们对这里的目录还不是很了解,我们来看一个举例 例:下载的首页,并且保持网站结构 wget -x |
wget的安装
1、第一步下载
wget官网下载链接:https://ftp.gnu.org/gnu/wget/
wget其他下载地址:CSDN收藏:写文章临时常用的一些结构、链接、下载的源文件集合等等
2、第二步添加到系统环境变量内
path:E:\Program Files\wgetwin-1_5_3_1-binary
哈哈,成功运行!
wget的入门
1、执行 wget.exe --help
2、所有的命令代码集合
Usage: wget [OPTION]... [URL]... Mandatory arguments to long options are mandatory for short options too. Startup: -V, --version display the version of Wget and exit. -h, --help print this help. -b, --background go to background after startup. -e, --execute=COMMAND execute a `.wgetrc' command. Logging and input file: -o, --output-file=FILE log messages to FILE. -a, --append-output=FILE append messages to FILE. -d, --debug print debug output. -q, --quiet quiet (no output). -v, --verbose be verbose (this is the default). -nv, --non-verbose turn off verboseness, without being quiet. -i, --input-file=FILE read URL-s from file. -F, --force-html treat input file as HTML. Download: -t, --tries=NUMBER set number of retries to NUMBER (0 unlimits). -O --output-document=FILE write documents to FILE. -nc, --no-clobber don't clobber existing files. -c, --continue restart getting an existing file. --dot-style=STYLE set retrieval display style. -N, --timestamping don't retrieve files if older than local. -S, --server-response print server response. --spider don't download anything. -T, --timeout=SECONDS set the read timeout to SECONDS. -w, --wait=SECONDS wait SECONDS between retrievals. -Y, --proxy=on/off turn proxy on or off. -Q, --quota=NUMBER set retrieval quota to NUMBER. Directories: -nd --no-directories don't create directories. -x, --force-directories force creation of directories. -nH, --no-host-directories don't create host directories. -P, --directory-prefix=PREFIX save files to PREFIX/... --cut-dirs=NUMBER ignore NUMBER remote directory components. HTTP options: --http-user=USER set http user to USER. --http-passwd=PASS set http password to PASS. -C, --cache=on/off (dis)allow server-cached data (normally allowed). --ignore-length ignore `Content-Length' header field. --header=STRING insert STRING among the headers. --proxy-user=USER set USER as proxy username. --proxy-passwd=PASS set PASS as proxy password. -s, --save-headers save the HTTP headers to file. -U, --user-agent=AGENT identify as AGENT instead of Wget/VERSION. FTP options: --retr-symlinks retrieve FTP symbolic links. -g, --glob=on/off turn file name globbing on or off. --passive-ftp use the "passive" transfer mode. Recursive retrieval: -r, --recursive recursive web-suck -- use with care!. -l, --level=NUMBER maximum recursion depth (0 to unlimit). --delete-after delete downloaded files. -k, --convert-links convert non-relative links to relative. -m, --mirror turn on options suitable for mirroring. -nr, --dont-remove-listing don't remove `.listing' files. Recursive accept/reject: -A, --accept=LIST list of accepted extensions. -R, --reject=LIST list of rejected extensions. -D, --domains=LIST list of accepted domains. --exclude-domains=LIST comma-separated list of rejected domains. -L, --relative follow relative links only. --follow-ftp follow FTP links from HTML documents. -H, --span-hosts go to foreign hosts when recursive. -I, --include-directories=LIST list of allowed directories. -X, --exclude-directories=LIST list of excluded directories. -nh, --no-host-lookup don't DNS-lookup hosts. -np, --no-parent don't ascend to the parent directory.
wget的使用方法
1、下载到指定文件夹
wget https://raw.githubusercontent.com/……/image_ocr.py -O E:\Program Files\wget download
2、下载整站:经常要下载一个网站或网站的某个目录。
wget -r -p -k -np -nc -e robots=off http://www.example.com/mydir/ #下载一个目录,例如下载网站www.example.com/目录mydir下的所有内容
wget -r -p -k -nc -e robots=off http://www.example.com/mydir/ #如果要想下载整个网站,最好去除-np参数。
-r 递归;对于HTTP主机,wget首先下载URL指定的文件,然后(如果该文件是一个HTML文档的话)递归下载该文件所引用(超级连接)的所有文件(递 归深度由参数-l指定)。对FTP主机,该参数意味着要下载URL指定的目录中的所有文件,递归方法与HTTP主机类似。
-c 指定断点续传功能。实际上,wget默认具有断点续传功能,只有当你使用别的ftp工具下载了某一文件的一部分,并希望wget接着完成此工作的时候,才 需要指定此参数。
-nc 不下载已经存在的文件
-np 表示不追溯至父目录,不跟随链接,只下载指定目录及子目录里的东西;
-p 下载页面显示所需的所有文件。比如页面中包含了图片,但是图片并不在/yourdir目录中,而在/images目录下,有此参数,图片依然会被正常下 载。
-k 修复下载文件中的绝对连接为相对连接,这样方便本地阅读。
-o down.log 记录日记到down.log
-e robots=off 忽略robots.txt
参考文章:(附上参考原文链接表示感谢)
linux wget 命令用法详解(附实例说明)
Wget下载终极用法和15个详细的例子

低调大师中文资讯倾力打造互联网数据资讯、行业资源、电子商务、移动互联网、网络营销平台。
持续更新报道IT业界、互联网、市场资讯、驱动更新,是最及时权威的产业资讯及硬件资讯报道平台。
转载内容版权归作者及来源网站所有,本站原创内容转载请注明来源。
- 上一篇
Android客户端网络预连接优化机制探究
# 一、背景 一般情况下,我们都是用一些封装好的网络框架去请求网络,对底层实现不甚关注,而大部分情况下也不需要特别关注处理。得益于因特网的协议,网络分层,我们可以只在应用层去处理业务就行。但是了解底层的一些实现,有益于我们对网络加载进行优化。本文就是关于根据http的连接复用机制来优化网络加载速度的原理与细节。 # 二、连接复用 对于一个普通的接口请求,通过charles抓包,查看网络请求Timing栏信息,我们可以看到类似如下请求时长信息: - Duration 175 ms - DNS 6 ms - Connect 50 msTLS Handshake 75 ms - Request 1 ms - Response 1 ms - Latency 42 ms 同样的请求,再来一次,时长信息如下所示: - Duration 39 ms - DNS - - Connect - - TLS Handshake - - Request 0 ms - Response 0 ms - Latency 39 ms 我们发现,整体网络请求时间从175ms降低到了39ms。其中DNS,Connect,...
- 下一篇
一文讲全了Python类和对象内容
【本期推荐】你能否在直播间抢到秒杀商品的关键不仅仅是手速,还有它:大规模超低时延直播,点击就看华为云音视频的硬核解决方案。 摘要:这是一个关于 Python 类和对象的全部内容。 本文分享自华为云社区《从零开始学python| Python 类和对象—面向对象编程》,原文作者:Yuchuan 。 Python 在活跃开发人员方面将超过其他语言之后,Python 开发人员的需求只会增长。 Python 遵循面向对象的编程范式。它处理声明 python 类,从它们创建对象并与用户交互。在面向对象的语言中,程序被分成独立的对象,或者你可以说成几个小程序。每个对象代表应用程序的不同部分,它们可以相互通信。 在这个python类博客中,您将按以下顺序了解类和对象的各个方面: What is a Python Class? Methods and Attributes in a class What are Objects? OOPs Concepts: Inheritance Polymorphism Abstraction 什么是 Python 类? python 中的类是创建特定对象...
相关文章
文章评论
共有0条评论来说两句吧...
文章二维码
点击排行
推荐阅读
最新文章
- Hadoop3单机部署,实现最简伪集群
- SpringBoot2整合MyBatis,连接MySql数据库做增删改查操作
- CentOS7编译安装Gcc9.2.0,解决mysql等软件编译问题
- SpringBoot2配置默认Tomcat设置,开启更多高级功能
- SpringBoot2整合Redis,开启缓存,提高访问速度
- Windows10,CentOS7,CentOS8安装Nodejs环境
- MySQL8.0.19开启GTID主从同步CentOS8
- Docker快速安装Oracle11G,搭建oracle11g学习环境
- Eclipse初始化配置,告别卡顿、闪退、编译时间过长
- 设置Eclipse缩进为4个空格,增强代码规范