Tool之wget：wget的简介、安装、入门、使用方法之详细攻略-低调大师

Tool之wget：wget的简介、安装、入门、使用方法之详细攻略

2021-06-17 783

Tool之wget：wget的简介、安装、入门、使用方法之详细攻略

wget的简介

wget 是一个从网络上自动下载文件的自由工具，支持通过 HTTP、HTTPS、FTP 三个最常见的 TCP/IP协议下载，并可以使用 HTTP 代理。"wget" 这个名称来源于 “World Wide Web” 与 “get” 的结合。最初，wget 其实是在Linux系统下使用的。用wget下载东西，的确很方便，它会自动重连并断点续传。让人很放心。
wget 官网：http://www.gnu.org/software/wget/
wget 官网文档：http://www.gnu.org/software/wget/manual/

wget特点

wget工具体积小但功能完善
它支持断点下载功能
同时支持FTP和HTTP下载方式，支持代理服务器和设置起来方便简单

Linux wget是一个下载文件的工具，它用在命令行下。对于Linux用户是必不可少的工具，尤其对于网络管理员，经常要下载一些软件或从远程服务器恢复备份到本地服务器。如果我们使用虚拟主机，处理这样的事务我们只能先从远程服务器下载到我们电脑磁盘，然后再用ftp工具上传到服务器。这样既浪费时间又浪费精力，那不没办法的事。而到了Linux VPS，它则可以直接下载到服务器而不用经过上传这一步。
wget是在Linux下开发的开放源代码的软件，作者是Hrvoje Niksic，后来被移植到包括Windows在内的各个平台上。

功能和特点：

支持断点下传功能；这一点，也是网络蚂蚁和FlashGet当年最大的卖点，现在，Wget也可以使用此功能，那些网络不是太好的用户可以放心了；
同时支持FTP和HTTP下载方式；尽管现在大部分软件可以使用HTTP方式下载，但是，有些时候，仍然需要使用FTP方式下载软件；
支持代理服务器；对安全强度很高的系统而言，一般不会将自己的系统直接暴露在互联网上，所以，支持代理是下载软件必须有的功能；
设置方便简单；可能，习惯图形界面的用户已经不是太习惯命令行了，但是，命令行在设置上其实有更多的优点，最少，鼠标可以少点很多次，也不要担心是否错点鼠标；
程序小，完全免费；程序小可以考虑不计，因为现在的硬盘实在太大了；完全免费就不得不考虑了，即使网络上有很多所谓的免费软件，但是，这些软件的广告却不是我们喜欢的；

wget虽然功能强大，但是使用起来还是比较简单的，基本的语法是：wget [参数列表] URL。下面就结合具体的例子来说明一下wget的用法。

wget命令

启动参数：这一类参数主要提供软件的一些基本信息。以下每一个功能有长短两个参数，长短功能一样，都可以使用。需要注意的是，这里的-e参数是执行一个.wgettrc的命令，.wgettrc命令其实是一个参数列表，直接将软件需要的参数写在一起就可以了。	-V,--version 显示软件版本号然后退出； -h,--help显示软件帮助信息； -e,--execute=COMMAND 执行一个 “.wgetrc”命令
文件参数：这类参数定义软件log文件的输出方式等。	-o,--output-file=FILE 将软件输出信息保存到文件； -a,--append-output=FILE将软件输出信息追加到文件； -d,--debug显示输出信息； -q,--quiet 不显示输出信息； -i,--input-file=FILE 从文件中取得URL；例1：下载首页并且显示下载信息 wget -d 例2：下载首页并且不显示任何信息 wget -q 例3：下载filelist.txt中所包含的链接的所有文件 wget -i filelist.txt wget -np -m -l 5 不下载本站所链接的其它站点内容，5级目录结构
下载参数：下载参数定义下载重复次数、保存文件名等。	-t,--tries=NUMBER 是否下载次数（0表示无穷次） -O --output-document=FILE 指定下载目录和文件名 -nc, --no-clobber 不要覆盖已经存在的文件 -N,--timestamping只下载比本地新的文件 -T,--timeout=SECONDS 设置超时时间 -Y,--proxy=on/off 关闭代理例：下载的首页并将下载过程中的的输入信息保存到test.htm文件中 wget -Otest.html
目录参数：目录参数主要设置下载文件保存目录与原来文件（服务器文件）的目录对应关系；	-nd --no-directories 不建立目录 -x,--force-directories 强制建立目录可能我们对这里的目录还不是很了解，我们来看一个举例例：下载的首页，并且保持网站结构 wget -x

wget的安装

1、第一步下载
wget官网下载链接：https://ftp.gnu.org/gnu/wget/
wget其他下载地址：CSDN收藏：写文章临时常用的一些结构、链接、下载的源文件集合等等

2、第二步添加到系统环境变量内

path：E:\Program Files\wgetwin-1_5_3_1-binary

哈哈，成功运行！

wget的入门

1、执行 wget.exe --help

2、所有的命令代码集合

Usage: wget [OPTION]... [URL]...

Mandatory arguments to long options are mandatory for short options too.

Startup:
  -V,  --version           display the version of Wget and exit.
  -h,  --help              print this help.
  -b,  --background        go to background after startup.
  -e,  --execute=COMMAND   execute a `.wgetrc' command.

Logging and input file:
  -o,  --output-file=FILE     log messages to FILE.
  -a,  --append-output=FILE   append messages to FILE.
  -d,  --debug                print debug output.
  -q,  --quiet                quiet (no output).
  -v,  --verbose              be verbose (this is the default).
  -nv, --non-verbose          turn off verboseness, without being quiet.
  -i,  --input-file=FILE      read URL-s from file.
  -F,  --force-html           treat input file as HTML.

Download:
  -t,  --tries=NUMBER           set number of retries to NUMBER (0 unlimits).
  -O   --output-document=FILE   write documents to FILE.
  -nc, --no-clobber             don't clobber existing files.
  -c,  --continue               restart getting an existing file.
       --dot-style=STYLE        set retrieval display style.
  -N,  --timestamping           don't retrieve files if older than local.
  -S,  --server-response        print server response.
       --spider                 don't download anything.
  -T,  --timeout=SECONDS        set the read timeout to SECONDS.
  -w,  --wait=SECONDS           wait SECONDS between retrievals.
  -Y,  --proxy=on/off           turn proxy on or off.
  -Q,  --quota=NUMBER           set retrieval quota to NUMBER.

Directories:
  -nd  --no-directories            don't create directories.
  -x,  --force-directories         force creation of directories.
  -nH, --no-host-directories       don't create host directories.
  -P,  --directory-prefix=PREFIX   save files to PREFIX/...
       --cut-dirs=NUMBER           ignore NUMBER remote directory components.

HTTP options:
       --http-user=USER      set http user to USER.
       --http-passwd=PASS    set http password to PASS.
  -C,  --cache=on/off        (dis)allow server-cached data (normally allowed).
       --ignore-length       ignore `Content-Length' header field.
       --header=STRING       insert STRING among the headers.
       --proxy-user=USER     set USER as proxy username.
       --proxy-passwd=PASS   set PASS as proxy password.
  -s,  --save-headers        save the HTTP headers to file.
  -U,  --user-agent=AGENT    identify as AGENT instead of Wget/VERSION.

FTP options:
       --retr-symlinks   retrieve FTP symbolic links.
  -g,  --glob=on/off     turn file name globbing on or off.
       --passive-ftp     use the "passive" transfer mode.

Recursive retrieval:
  -r,  --recursive             recursive web-suck -- use with care!.
  -l,  --level=NUMBER          maximum recursion depth (0 to unlimit).
       --delete-after          delete downloaded files.
  -k,  --convert-links         convert non-relative links to relative.
  -m,  --mirror                turn on options suitable for mirroring.
  -nr, --dont-remove-listing   don't remove `.listing' files.

Recursive accept/reject:
  -A,  --accept=LIST                list of accepted extensions.
  -R,  --reject=LIST                list of rejected extensions.
  -D,  --domains=LIST               list of accepted domains.
       --exclude-domains=LIST       comma-separated list of rejected domains.
  -L,  --relative                   follow relative links only.
       --follow-ftp                 follow FTP links from HTML documents.
  -H,  --span-hosts                 go to foreign hosts when recursive.
  -I,  --include-directories=LIST   list of allowed directories.
  -X,  --exclude-directories=LIST   list of excluded directories.
  -nh, --no-host-lookup             don't DNS-lookup hosts.
  -np, --no-parent                  don't ascend to the parent directory.

wget的使用方法

1、下载到指定文件夹

wget https://raw.githubusercontent.com/……/image_ocr.py -O E:\Program Files\wget download

2、下载整站：经常要下载一个网站或网站的某个目录。

wget -r -p -k -np -nc -e robots=off http://www.example.com/mydir/ #下载一个目录，例如下载网站www.example.com/目录mydir下的所有内容
wget -r -p -k -nc -e robots=off http://www.example.com/mydir/ #如果要想下载整个网站，最好去除-np参数。

-r 递归；对于HTTP主机，wget首先下载URL指定的文件，然后（如果该文件是一个HTML文档的话）递归下载该文件所引用（超级连接）的所有文件（递归深度由参数-l指定）。对FTP主机，该参数意味着要下载URL指定的目录中的所有文件，递归方法与HTTP主机类似。
-c 指定断点续传功能。实际上，wget默认具有断点续传功能，只有当你使用别的ftp工具下载了某一文件的一部分，并希望wget接着完成此工作的时候，才需要指定此参数。
-nc 不下载已经存在的文件
-np 表示不追溯至父目录，不跟随链接，只下载指定目录及子目录里的东西；
-p 下载页面显示所需的所有文件。比如页面中包含了图片，但是图片并不在/yourdir目录中，而在/images目录下，有此参数，图片依然会被正常下载。
-k 修复下载文件中的绝对连接为相对连接，这样方便本地阅读。
-o down.log 记录日记到down.log
-e robots=off 忽略robots.txt

参考文章：(附上参考原文链接表示感谢)
linux wget 命令用法详解(附实例说明)
Wget下载终极用法和15个详细的例子

微信关注我们

原文链接：https://blog.51cto.com/u_14217737/2913842

转载内容版权归作者及来源网站所有！

低调大师中文资讯倾力打造互联网数据资讯、行业资源、电子商务、移动互联网、网络营销平台。持续更新报道IT业界、互联网、市场资讯、驱动更新,是最及时权威的产业资讯及硬件资讯报道平台。

Android客户端网络预连接优化机制探究

# 一、背景一般情况下，我们都是用一些封装好的网络框架去请求网络，对底层实现不甚关注，而大部分情况下也不需要特别关注处理。得益于因特网的协议，网络分层，我们可以只在应用层去处理业务就行。但是了解底层的一些实现，有益于我们对网络加载进行优化。本文就是关于根据http的连接复用机制来优化网络加载速度的原理与细节。 # 二、连接复用对于一个普通的接口请求，通过charles抓包，查看网络请求Timing栏信息，我们可以看到类似如下请求时长信息： - Duration 175 ms - DNS 6 ms - Connect 50 msTLS Handshake 75 ms - Request 1 ms - Response 1 ms - Latency 42 ms 同样的请求，再来一次，时长信息如下所示： - Duration 39 ms - DNS - - Connect - - TLS Handshake - - Request 0 ms - Response 0 ms - Latency 39 ms 我们发现，整体网络请求时间从175ms降低到了39ms。其中DNS，Connect，...

2021-06-17

585

【本期推荐】你能否在直播间抢到秒杀商品的关键不仅仅是手速，还有它：大规模超低时延直播，点击就看华为云音视频的硬核解决方案。摘要：这是一个关于 Python 类和对象的全部内容。本文分享自华为云社区《从零开始学python| Python 类和对象—面向对象编程》，原文作者：Yuchuan 。 Python 在活跃开发人员方面将超过其他语言之后,Python 开发人员的需求只会增长。 Python 遵循面向对象的编程范式。它处理声明 python 类，从它们创建对象并与用户交互。在面向对象的语言中，程序被分成独立的对象，或者你可以说成几个小程序。每个对象代表应用程序的不同部分，它们可以相互通信。在这个python类博客中，您将按以下顺序了解类和对象的各个方面： What is a Python Class? Methods and Attributes in a class What are Objects? OOPs Concepts: Inheritance Polymorphism Abstraction 什么是 Python 类？ python 中的类是创建特定对象...

2021-06-17

569

资源下载

更多资源

Mario

马里奥是站在游戏界顶峰的超人气多面角色。马里奥靠吃蘑菇成长，特征是大鼻子、头戴帽子、身穿背带裤，还留着胡子。与他的双胞胎兄弟路易基一起，长年担任任天堂的招牌角色。

腾讯云软件源

为解决软件依赖安装时官方源访问速度慢的问题，腾讯云为一些软件搭建了缓存服务。您可以通过使用腾讯云软件源站来提升依赖包的安装速度。为了方便用户自由搭建服务架构，目前腾讯云软件源站支持公网访问和内网访问。

Nacos

Nacos /nɑ:kəʊs/ 是 Dynamic Naming and Configuration Service 的首字母简称，一个易于构建 AI Agent 应用的动态服务发现、配置管理和AI智能体管理平台。Nacos 致力于帮助您发现、配置和管理微服务及AI智能体应用。Nacos 提供了一组简单易用的特性集，帮助您快速实现动态服务发现、服务配置、服务元数据、流量管理。Nacos 帮助您更敏捷和容易地构建、交付和管理微服务平台。

Rocky Linux

Rocky Linux（中文名：洛基）是由Gregory Kurtzer于2020年12月发起的企业级Linux发行版，作为CentOS稳定版停止维护后与RHEL（Red Hat Enterprise Linux）完全兼容的开源替代方案，由社区拥有并管理，支持x86_64、aarch64等架构。其通过重新编译RHEL源代码提供长期稳定性，采用模块化包装和SELinux安全架构，默认包含GNOME桌面环境及XFS文件系统，支持十年生命周期更新。