高效使用 Guzzle:POST 请求与请求体参数的最佳实践

亿牛云代理.png

介绍

在现代爬虫技术中,高效发送 HTTP 请求并处理响应数据是关键步骤之一。Guzzle 是一个强大的 PHP HTTP 客户端,广泛应用于发送同步和异步请求。本文将介绍如何使用 Guzzle 发送 POST 请求,特别是如何传递请求体参数,并结合代理 IP 技术实现高效的数据抓取。同时,我们将分析 Guzzle 对同步和异步请求的不同处理方式。

技术分析

1. Guzzle 基础知识
Guzzle 提供了一个简单的接口来发送 HTTP 请求,并支持多种选项,如 JSON 数据传递、错误处理、并发请求等。首先,我们需要确保 Guzzle 已正确安装:

composer require guzzlehttp/guzzle

2. 发送 POST 请求
使用 Guzzle 发送 POST 请求时,可以通过 json 选项来传递请求体参数。下面的示例展示了如何使用 Guzzle 发送一个包含 JSON 数据的 POST 请求:

use GuzzleHttp\Client;

$client = new Client();
$url = 'https://example.com/api/endpoint';

$data = [
    'payItemId' => 'S-112-948-MTNMOMO-20052-200040001-1',
    'amount' => 1000,
];

$response = $client->post($url, [
    'json' => $data,
]);

$body = $response->getBody()->getContents();
$result = json_decode($body, true);

3. 使用代理 IP
为了避免被封禁,爬虫程序常使用代理 IP 技术。以下代码展示了如何使用亿牛云爬虫代理来发送请求:

use GuzzleHttp\Client;

$client = new Client();
$url = 'https://example.com/api/endpoint';
// 使用亿牛云爬虫代理 www.16yun.cn
$proxy = 'http://username:password@$proxy.16yun.cn:12345'; 

$data = [
    'payItemId' => 'S-112-948-MTNMOMO-20052-200040001-1',
    'amount' => 1000,
];

$response = $client->post($url, [
    'json' => $data,
    'proxy' => $proxy, // 设置代理 IP
]);

$body = $response->getBody()->getContents();
$result = json_decode($body, true);

4. Guzzle 的同步和异步处理
Guzzle 提供了对同步和异步请求的支持,这使得它在处理大量请求时非常灵活。

  • 同步请求:同步请求是指程序在发送请求时会等待响应返回后再继续执行。它适用于需要逐步处理每个请求结果的场景。
use GuzzleHttp\Client;

$client = new Client();
$url = 'https://example.com/api/endpoint';

$response = $client->get($url);
$body = $response->getBody()->getContents();
echo $body;
  • 异步请求:异步请求允许程序在发送请求后立即继续执行,不必等待响应返回。它适用于需要同时发送大量请求的场景。
use GuzzleHttp\Client;
use GuzzleHttp\Promise\PromiseInterface;

$client = new Client();
$url = 'https://example.com/api/endpoint';

$promise = $client->getAsync($url);
$promise->then(
    function (ResponseInterface $response) {
        echo $response->getBody()->getContents();
    },
    function (RequestException $e) {
        echo $e->getMessage();
    }
);

$promise->wait(); // 等待所有异步请求完成

5. 实战示例:采集新闻网站数据
以下示例展示了如何使用 Guzzle 和亿牛云爬虫代理来采集多个新闻网站的数据:

use GuzzleHttp\Client;
use GuzzleHttp\Pool;
use GuzzleHttp\Psr7\Request;

$client = new Client();
// 使用亿牛云爬虫代理 www.16yun.cn
$proxy = 'http://username:password@$proxy.16yun.net:12345';

$urls = [
    'https://news.ycombinator.com/',
    'https://www.bbc.com/news',
    'https://www.cnn.com/',
];

$requests = function ($urls) {
    foreach ($urls as $url) {
        yield new Request('GET', $url);
    }
};

$pool = new Pool($client, $requests($urls), [
    'concurrency' => 5,
    'options' => [
        'proxy' => $proxy, // 设置代理 IP
    ],
    'fulfilled' => function ($response, $index) {
        // 请求成功时的处理逻辑
        $body = $response->getBody()->getContents();
        echo "Response from index {$index}: " . substr($body, 0, 100) . "\n";
    },
    'rejected' => function ($reason, $index) {
        // 请求失败时的处理逻辑
        echo "Request {$index} failed: {$reason}\n";
    },
]);

$promise = $pool->promise();
$promise->wait();
结论

本文介绍了如何使用 Guzzle 发送 POST 请求并传递请求体参数,以及如何结合代理 IP 技术实现高效的爬虫数据抓取。通过实际代码示例,我们展示了如何采集多个新闻网站的数据。同时,我们分析了 Guzzle 对同步和异步请求的不同处理方式。Guzzle 的灵活性和强大的功能使其成为 PHP 开发中不可或缺的工具。希望本文能为您在实际项目中使用 Guzzle 提供参考和帮助。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:/a/772955.html

如若内容造成侵权/违法违规/事实不符,请联系我们进行投诉反馈qq邮箱809451989@qq.com,一经查实,立即删除!

相关文章

Windows系统安装分布式搜索和分析引擎Elasticsearch与远程访问详细教程

文章目录 前言系统环境1. Windows 安装Elasticsearch2. 本地访问Elasticsearch3. Windows 安装 Cpolar4. 创建Elasticsearch公网访问地址5. 远程访问Elasticsearch6. 设置固定二级子域名 前言 本文主要介绍如何在Windows系统安装分布式搜索和分析引擎Elasticsearch&#xff0c…

HandlerMethodArgumentResolver :深入spring mvc参数解析机制

❃博主首页 &#xff1a; <码到三十五> ☠博主专栏 &#xff1a; <mysql高手> <elasticsearch高手> <源码解读> <java核心> <面试攻关> ♝博主的话 &#xff1a; 搬的每块砖&#xff0c;皆为峰峦之基&#xff1b;公众号搜索(码到三十…

[k8s生产系列]:k8s集群故障恢复,etcd数据不一致,kubernetes集群异常

文章目录 摘要1 背景说明2 故障排查2.1 查询docker与kubelet状态2.2 查看kubelet服务日志2.3 重启docker与kubelet服务2.3.1 首先kubelet启动起来了&#xff0c;但是报错master节点找不到2.3.2 查询kubernetes集群服务&#xff0c;发现etcd与kube-apiserver均启动异常 2.4 etcd…

2024年中国网络安全市场全景图 -百度下载

是自2018年开始&#xff0c;数说安全发布的第七版全景图。 企业数智化转型加速已经促使网络安全成为全社会关注的焦点&#xff0c;在网络安全边界不断扩大&#xff0c;新理念、新产品、新技术不断融合发展的进程中&#xff0c;数说安全始终秉承科学的方法论&#xff0c;以遵循…

Rhino 犀牛三维建模工具下载安装,Rhino 适用于机械设计广泛领域

Rhinoceros&#xff0c;这款软件小巧而强大&#xff0c;无论是机械设计、科学工业还是三维动画等多元化领域&#xff0c;它都能展现出其惊人的建模能力。 Rhinoceros所包含的NURBS建模功能&#xff0c;堪称业界翘楚。NURBS&#xff0c;即非均匀有理B样条&#xff0c;是计算机图…

怎样在Python中使用oobabooga的API密钥,通过端口5000获取模型列表的授权

题意&#xff1a; oobabooga-textgen-web-ui how to get authorization to view model list from port 5000 via the oobas api-key in python 怎样在Python中使用oobabooga的API密钥&#xff0c;通过端口5000获取模型列表的授权 问题背景&#xff1a; I wish to extract an…

抬头显示器HUD原理及特性

HUD基本原理 抬头数字显示仪(Head Up Display)&#xff0c;又叫平视显示系统&#xff0c;它的作用&#xff0c;就是把时速、导 航等重要的行车信息&#xff0c;投影到驾驶员前风挡玻璃上&#xff0c;让驾驶员尽量做到不低头、不转头 就能看行车信息。 HUD成像为离轴三反的过程&…

代码随想录算法训练营第2天|LeetCode977,209,59

977.有序数组平方 题目链接&#xff1a; 977. 有序数组的平方 - 力扣&#xff08;LeetCode&#xff09; 文章讲解&#xff1a;代码随想录 视频讲解&#xff1a; 双指针法经典题目 | LeetCode&#xff1a;977.有序数组的平方_哔哩哔哩_bilibili 第一想法 暴力算法肯定是先将元素…

关于软件本地化,您应该了解什么?

软件本地化是调整软件应用程序以满足目标市场的语言、文化和技术要求的过程。它不仅仅涉及翻译用户界面&#xff1b;它包含一系列活动&#xff0c;以确保软件在目标语言环境中可用且相关。以下是您应该了解的有关软件本地化的一些关键方面&#xff1a; 了解范围 软件本地化是…

【软件测试】之黑盒测试用例的设计

&#x1f3c0;&#x1f3c0;&#x1f3c0;来都来了&#xff0c;不妨点个关注&#xff01; &#x1f3a7;&#x1f3a7;&#x1f3a7;博客主页&#xff1a;欢迎各位大佬! 文章目录 1.测试用例的概念2.测试用例的好处3. 黑盒测试用例的设计3.1 黑盒测试的概念3.2 基于需求进行测…

暗潮短视频:成都柏煜文化传媒有限公司

暗潮短视频&#xff1a;涌动的新媒体力量 在数字化时代的浪潮中&#xff0c;短视频以其独特的魅力和无限的潜力&#xff0c;迅速成为新媒体领域的一股强大力量。而在这片繁荣的短视频领域中&#xff0c;成都柏煜文化传媒有限公司“暗潮短视频”以其独特的定位和深邃的内容&…

论文浅尝 | 从最少到最多的提示可在大型语言模型中实现复杂的推理

笔记整理&#xff1a;王泽元&#xff0c;浙江大学博士 链接&#xff1a;https://openreview.net/forum?idWZH7099tgfM 1. 动机 尽管深度学习已经取得了巨大的成功&#xff0c;但它与人类智慧仍然存在一些明显差距。这些差距包括以下几个方面&#xff1a;1&#xff09;学习新任…

损失函数篇

损失函数 1、边界框损失函数/回归损失函数bbox_loss 2、分类损失函数cls_loss 3、置信度损失函数obj_loss YOLOv8损失函数 1、概述 通过YOLOv8-训练流程-正负样本分配的介绍&#xff0c;我们可以知道&#xff0c;经过预处理与筛选的过程得到最终的训练数据&#xff1a; a…

11 UDP的可靠传输协议QUIC

1.如何做到可靠性传输 2.UDP与TCP,我们如何选择 3.UDP如何可靠,KCP协议在哪些方面有优势 4.KCP协议精讲(重点讲解 5.OUIC时代是否已经到来 UDP如何做到可靠传输 ACK机制重传机制 重传策略序号机制(后发的包可能先到) 3 2 1-> 2 3 1重排机制 2 3 1-> 3 2 1窗口机制 流…

谷粒商城笔记-03-分布式基础概念

文章目录 一&#xff0c;微服务二&#xff0c;集群、分布式三&#xff0c;远程调用四&#xff0c;负载均衡五&#xff0c;服务注册、服务发现、注册中心六&#xff0c;配置中心七&#xff0c;服务熔断、服务降级1&#xff0c;服务熔断2&#xff0c;服务降级3&#xff0c;区别 八…

Spring框架的学习前言

1.注意事项 1.在接下来的学习中我们会将jdk的版本升级到17。 2.引入maven仓库用来存储依赖 3.在后面的javaSpring框架中要第一个项目的创建要选javaweb和lombook这两个依赖 2.Maven的主要功能 &#xff08;1&#xff09;maven的主要功能是引入依赖和管理依赖&#xff0c;在…

基于SpringCloud的分布式架构网上商城

基于SpringCloud的分布式架构网上商城的主要使用者管理员功能&#xff1a;首页、个人中心、用户管理、商品信息管理、商品分类管理、系统管理、订单管理等功能。 &#x1f495;&#x1f495;作者&#xff1a;Weirdo &#x1f495;&#x1f495;个人简介&#xff1a;擅长Java、C…

【SkiaSharp绘图15】SKPath属性详解:边界、填充、凹凸、类型判断、坐标、路径类型

文章目录 SKPath 构造函数SKPath 属性Bounds 边界(宽边界)TightBounds紧边界FillType填充方式IsConcave 是否凹/ IsConvex 是否凸IsEmpty是否为空IsLine是否为线段IsRect是否为矩形IsOval是否为椭圆或圆IsRoundRect是否为圆角矩形Item[] 获取路径的坐标LastPoint最后点的坐标Po…

基于香橙派AIpro搭建的车牌识别系统

引言 本人正有学习嵌入式的想法&#xff0c;正好碰到机会让我搞了块OrangePi AIpro&#xff08;香橙派AIpro&#xff09;开发板&#xff0c;正合我意&#xff0c;直接上手进行体验&#xff0c;顺便给大家分享下我的实践过程。 开发板介绍与初次启动 OrangePiAIPro开发板是香…

WPF UI InkCanvas 导师演示画板 演示 笔记 画笔 识别

<Grid><InkCanvas Name"inkCanvas"/><Button Content"识别" Click"Button_Click" VerticalAlignment"Bottom"/></Grid> 引用内库 Ink ink new Ink(); private void Button_Click(object sender, RoutedEvent…