PHP cURL请求详解

2018-05-22 803

PHP cURL请求详解

在PHP后端的开发过程中，除了获取数据库的数据和处理数据的内部逻辑，往往还需要请求其他服务器接口的数据，我们一般有3种方式来获取数据，分别是：

file_get_contents
fsockopen
curl

3种常用的接口获取方式简述

`file_get_contents`

函数声明：

/** 函数作用：将整个文件读入字符串
    @param $filename 读取的文件名或url，如果是文件路径，$use_include_path需置为true
    @param $use_include_path 是否使用文件目录路径查找，如果是文件查找，需要置为true，默认为false
    @param $context 资源参数，使用stream_context_create创造的一个上下文，用于配置读取文件的参数，如配置HTTP请求的方法和头部信息
    @param $offset 开始读取数据的偏移值
    @param $maxlen 从$offset开始获取多长的数据
    @return string 如果成功返回字符串，失败返回false
*/
string file_get_contents(string $filename, bool $use_include_path = false, resource $context, int $offset = -1, int $maxlen)

实例获取数据：

// 笔者开发使用Yii2，所以路由控制器使用action的写法
public function actionFetch() {
    // 该url为笔者写的另外一篇文章，测试用
    $data = file_get_contents('https://segmentfault.com/a/1190000011549088');
    // 获取到的数据需要输出我们才能在前端请求看到返回的结果
    echo $data;
    // 结束本次请求
    return $data;
}

`fsockopen`

函数声明：

/** 函数作用：打开一个网络连接或者一个Unix套接字连接
    @param $hostname 初始化套接字连接到的主机
    @param $port 端口号，如果不传递，则不实用端口
    @param $errno 
    @param $errstr 字符串形式的错误信息
    @param $timeout 超时时间，单位为s
    @return resource 如果成功返回文件句柄，可以使用文件函数读写，失败返回false
*/
resource fsockopen(string $hostname, int $port = -1, int &$errno, string &$errstr, float $timeout = ini_get("default_socket_timeout"))

实例获取数据：

注意：在我的测试环境中报错：`Unable to find the socket transport "http" - did you
forget to enable it when you configured
PHP?`，是由于php.ini配置问题，所以不推荐此种方法获取，因为受配置文件影响，很容易不可用。

// 笔者开发使用Yii2，所以路由控制器使用action的写法
$fp = fsockopen('https://segmentfault.com/a/1190000011549088', 80);
if (!$fp) {
    echo "$errstr ($errno)<br />\n";
} else {
    $out = "GET / HTTP/1.1\r\n";
    $out .= "Host: www.example.com\r\n";
    $out .= "Connection: Close\r\n\r\n";
    fwrite($fp, $out);
    while (!feof($fp)) {
        echo fgets($fp, 128);
    }
    fclose($fp);
}

`cURL`

需要安装libcurl包。
cURL全称commandLine Uniform Resource Locator，命令行统一资源定位器，用于在命令行上传和下载url文件。提供用于程序开发的libcurl包。

实例获取数据：

// 初始化一个curl资源
$ch = curl_init('https://segmentfault.com/a/1190000011549088');
// 执行该curl对象，返回结果
$data = curl_exec($ch);
// 关闭cURL资源，释放系统资源
curl_close($ch);

3种方式的优劣对比

在代码风格上，file_get_contents最为简洁，fsockopen和curl比较复杂。

在功能上：
file_get_contents的功能也最为简单，不支持任何参数设置，如头部信息、超时等；
fsockopen可以通过fwirte ($socket, $config)的方式或字符串拼接配置请求头部信息，支持异步请求；
curl可以通过curl_setopt($curl, $name, $key)的方式配置请求配置，作为lib库，功能强大。

PHP不支持多进程，如果需要异步请求，非阻塞的方式，请选择fsockopen。
常规的请求我们使用file_get_contents和curl，除了功能外，下面做一个性能测试：

$url = 'https://segmentfault.com/a/1190000011549088';

// 100次file_get_contents请求，结果为113s
$start = time();
for ($i = 0; $i < 100; $i++) {
    $data = file_get_contents($url);
}
$end = time();
$cost = $end - $start;
echo 'file_get_contents 100次总耗时：', "$cost";

// 100次curl请求，结果为48s
$start = time();
for ($i = 0; $i < 100; $i++) {
    $ch = curl_init($url);
    // 设置不直接输出结果，而是保存到$data中
    curl_setopt($ch, CURLOPT_RETURNTRANSFER, true);
    $data = curl_exec($ch);
}
$end = time();
$cost = $end - $start;
echo 'curl 100次总耗时：', "$cost";

所以，在常规PHP请求中，我们使用curl的方式来请求接口数据。

`cURL`详解

curl的基本使用方法就是：

curl_init()初始化cURL会话
curl_setopt()或curl_setopt_array()设置配置选项
curl_exec()执行会话
curl_close()关闭会话

`curl_init()`

函数声明：

/** 函数作用：初始化curl会话
    @param $url 配置中的请求url，如果不传递，需要在curl_setopt()设置CURLOPT_URL
    @return resource 如果成功返回cURL句柄，失败返回false
*/
resource curl_init([string $url = NULL])

`curl_setopt()`和`curl_setopt_array()`

函数声明：

/** 函数作用：设置cURL传输选项
    @param $ch curl_init()返回的cURL句柄
    @param $option 需要设置的CURLOPT_XXX选项
    @param $value 在option选项上设置的值
    @return bool 成功返回true，失败返回false
*/
bool curl_setopt(resource $ch, int $option, mixed $value)

/** 函数作用：设置cURL传输选项
    @param $ch curl_init()返回的cURL句柄
    @param $options 需要设置的CURLOPT_XXX选项和值的数组
    @return bool 全部成功返回true，一个失败立刻返回false
*/
bool curl_setopt_array(resource $ch, array $options)

使用实例：

// 设置url和不直接输出结果，单项设置
curl_setopt($ch, CURLOPT_URL, 'https://segmentfault.com/a/1190000011549088');
curl_setopt($ch, CURLOPT_RETURNTRANSFER, true);

// 批量设置
curl_setopt_array($ch, array(
    CURLOPT_URL => 'https://segmentfault.com/a/1190000011549088',
    CURLOPT_RETURNTRANSFER => true
));

`CURLOPT_`参数

列举一些常用的参数，全部参数可以在 PHP curl参数文档查阅。

CURLOPT_HEADER 启用时会将头文件的信息作为数据流输出。
CURLOPT_POST TRUE 时会发送 POST 请求，类型为：application/x-www-form-urlencoded，是 HTML 表单提交时最常见的一种。
CURLOPT_RETURNTRANSFER TRUE 将curl_exec()获取的信息以字符串返回，而不是直接输出。
CURLOPT_UPLOAD TRUE 准备上传。
CURLOPT_CONNECTTIMEOUT 在尝试连接时等待的秒数。设置为0，则无限等待。
CURLOPT_PORT 用来指定连接端口。
CURLOPT_TIMEOUT 允许 cURL 函数执行的最长秒数。
CURLOPT_COOKIE 设定 HTTP 请求中"Cookie: "部分的内容。多个 cookie 用分号分隔，分号后带一个空格(例如， "fruit=apple; colour=red")。
CURLOPT_POSTFIELDS 全部数据使用HTTP协议中的 "POST" 操作来发送。
CURLOPT_URL 需要获取的 URL 地址，也可以在curl_init() 初始化会话的时候。

`curl_exec()`

函数声明：

/** 函数作用：执行curl会话
    @param $ch curl_init()返回的cURL句柄
    @return mixed 成功返回true，失败返回false；如果设置了CURLOPT_RETRUNTRANSFER为ture，成功返回执行结果
*/
mixed curl_exec(resource $ch)

`curl_close()`

函数声明：

/** 函数作用：关闭curl会话
    @param $ch curl_init()返回的cURL句柄
    @return void
*/
void curl_close(resource $ch)

curl请求封装

public static function parseApi($vars = Array(), $timeout = 60, $uri = '') {
    // 初始化curl
    $ch = curl_init();
    curl_setopt($ch, CURLOPT_URL, $uri);
    // 支持POST请求
    curl_setopt($ch, CURLOPT_POST, 1);
    // 不直接输出，返回到变量
    curl_setopt($ch, CURLOPT_RETURNTRANSFER, 1);
    // 设置POST参数
    curl_setopt($ch, CURLOPT_POSTFIELDS, http_build_query($vars));
    // 设置超时，防止机器被大量超时请求卡死
    curl_setopt($ch, CURLOPT_TIMEOUT, $timeout);
    // 请求数据
    $response = curl_exec($ch);
    // 关闭请求
    curl_close($ch);
    // 对数据进行编码，方便前后端数据处理
    $result = json_decode($response, true);
    // PHP返回数据
    return $result;
}

总结

如果你需要非阻塞的请求，可以使用fsockopen()方法。
常规的使用curl来请求，功能强大，使用方便，按需配置。

微信关注我们

原文链接：https://yq.aliyun.com/articles/595973

转载内容版权归作者及来源网站所有！

低调大师中文资讯倾力打造互联网数据资讯、行业资源、电子商务、移动互联网、网络营销平台。持续更新报道IT业界、互联网、市场资讯、驱动更新,是最及时权威的产业资讯及硬件资讯报道平台。

用Python统计你的简书数据

写在前面说来也巧，之前有一次无意间留意到简书好像没有做文章总阅读量的统计（准确的说法应该叫展示），刚好最近有时间，趁这个机会就用Python写了这么个功能，既是学习也是练手。展示效果再继续往下之前，先贴两张图看看最终的效果。第一张图片展示的是个人简书爬取后的数据，第二张可是大名鼎鼎简叔的简书数据。个人简书数据 '简叔'简书数据两图一对比，果然这数量和质量都不是一个等级的，不过后生会继续努力的。写了两个多月的博客了，没想到也有一千多的阅读量了，这是算喜还是算忧呢？哈哈，总之感觉还是蛮欣慰的。环境说明 python v3.6.4 webpy v0.40-dev1 要求有一定的Python基础开发搭建项目中用到的第三方module主要包括Requests、BeautifulSoup和Numpy，因为另外两个安装都比较顺利，所以这里只记录一下安装BeautifulSoup和遇到的问题。 pip安装 pip install beautifulsoup4 # 安装Beautifulsoup pip install beautifulsoup4 upgrade # 升...

2018-05-22

695

Python_爬虫爬虫概念数据获取的方式：企业生产的用户数据：大型互联网公司有海量用户，所以他们积累数据有天然优势。有数据意识的中小型企业，也开始积累的数据。数据管理咨询公司政府/机构提供的公开数据第三方数据平台购买数据爬虫爬取数据什么是爬虫抓去网页数据的程序如何抓去网页数据网页三大特征：每个网页都有自己的URL 网页都使用HTML标记语言来描述页面信息网页都使用HTTP/HTTPS协议来传输HTML数据爬虫的设计思路确定需要爬取的网页URL地址通过HTTP/HTTPS协议来获取对应的HTML页面提取HTML页面中的数据如果是需要的数据，就保存起来如果页面是其它URL，那就继续爬取原文地址https://segmentfault.com/a/1190000014981939?utm_source=index-hottest

2018-05-22

695

资源下载

更多资源

Mario

马里奥是站在游戏界顶峰的超人气多面角色。马里奥靠吃蘑菇成长，特征是大鼻子、头戴帽子、身穿背带裤，还留着胡子。与他的双胞胎兄弟路易基一起，长年担任任天堂的招牌角色。

腾讯云软件源

为解决软件依赖安装时官方源访问速度慢的问题，腾讯云为一些软件搭建了缓存服务。您可以通过使用腾讯云软件源站来提升依赖包的安装速度。为了方便用户自由搭建服务架构，目前腾讯云软件源站支持公网访问和内网访问。

Nacos

Nacos /nɑ:kəʊs/ 是 Dynamic Naming and Configuration Service 的首字母简称，一个易于构建 AI Agent 应用的动态服务发现、配置管理和AI智能体管理平台。Nacos 致力于帮助您发现、配置和管理微服务及AI智能体应用。Nacos 提供了一组简单易用的特性集，帮助您快速实现动态服务发现、服务配置、服务元数据、流量管理。Nacos 帮助您更敏捷和容易地构建、交付和管理微服务平台。

Rocky Linux

Rocky Linux（中文名：洛基）是由Gregory Kurtzer于2020年12月发起的企业级Linux发行版，作为CentOS稳定版停止维护后与RHEL（Red Hat Enterprise Linux）完全兼容的开源替代方案，由社区拥有并管理，支持x86_64、aarch64等架构。其通过重新编译RHEL源代码提供长期稳定性，采用模块化包装和SELinux安全架构，默认包含GNOME桌面环境及XFS文件系统，支持十年生命周期更新。