反爬虫之代理IP封禁-协采云IP池

反爬虫之代理IP封禁-协采云IP池

  • 1、目标网址
  • 2、IP封禁403
  • 3、协采云IP池

1、目标网址

aHR0cDovL3d3dy5jY2dwLXRpYW5qaW4uZ292LmNuLw==

2、IP封禁403

这个网站对IP的要求很高,短时间请求十几次就会遭关进小黑屋。如下图:
在这里插入图片描述
在这里插入图片描述
明显是网站进行了反爬处理:限制IP请求频率。这个时候,我们只有加代理进行访问请求了。但是网上公开的代理虽然说是免费,但其IP的响应速度、存活时间、隐匿性等质量是无法保证的。这里推荐一款最近发现的代理商家:协采云IP池

在这里插入图片描述

3、协采云IP池

demo:


import requests
import json
import time

#API链接    后台获取链接地址
proxyAPI = ""
proxyusernm = ""        #代理帐号
proxypasswd = ""        #代理密码
url='https://myip.ipip.net/'

#获取IP
r = requests.get(proxyAPI)
if(r.status_code == 200):
    j = json.loads(r.text)
    if(j["success"] and len(j["result"]) > 0):
        p=j["result"][0]
        #name = input();
        proxyurl="http://"+proxyusernm+":"+proxypasswd+"@"+p["ip"]+":"+"%d"%p["port"]

        t1 = time.time()
        r = requests.get(url,proxies={'http':proxyurl,'https':proxyurl},headers={
            "Accept":"text/html,application/xhtml+xml,application/xml;q=0.9,image/webp,image/apng,*/*;q=0.8",
            "Accept-Encoding":"gzip, deflate",
            "Accept-Language":"zh-CN,zh;q=0.9",
            "Cache-Control":"max-age=0",
            "User-Agent":"Mozilla/5.0 (Windows NT 10.0; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/71.0.3578.98 Safari/537.36"})
        r.encoding='utf-8'

        t2 = time.time()

        print(r.text)
        print("时间差:" , (t2 - t1));
    else:
        print('获取0个代理IP')
else:
    print('获取代理失败')

实战:


```python
def get_ip_one():
    # API链接    后台获取链接地址
    proxyAPI = "http://19122421898.user.xiecaiyun.com/api/proxies?action=getJSON&key=NP4D0E6891&count=&word=&rand=true&norepeat=false&detail=false&ltime=3&idshow=false"
    proxyusernm = "19122421898"  # 代理帐号
    proxypasswd = "19122421898"  # 代理密码
    try:
        # 获取IP
        r = requests.get(proxyAPI)
        if (r.status_code == 200):
            j = json.loads(r.text)
            if (j["success"] and len(j["result"]) > 0):
                p = j["result"][0]
                proxyurl = "http://" + proxyusernm + ":" + proxypasswd + "@" + p["ip"] + ":" + "%d" % p["port"]
                return {'http': proxyurl, 'https': proxyurl}
    except:
        print('代理获取超时,jia')
        return {'http': 'http://dsk20180808:dsk20170808@218.86.104.54:57114',
                'https': 'https://dsk20180808:dsk20170808@218.86.104.54:57114'}

加上代理后即可解决:

在这里插入图片描述

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:/a/545231.html

如若内容造成侵权/违法违规/事实不符,请联系我们进行投诉反馈qq邮箱809451989@qq.com,一经查实,立即删除!

相关文章

ubuntu22安装snipaste

Ubuntu 22.04 一、Snipaste 介绍和下载 Snipaste 官网下载链接: Snipaste Downloads 二、安装并使用 Snipaste # 1、进入Snipaste-2.8.9-Beta-x86_64.AppImage 目录(根据自己下载目录) cd /home/jack/Downloads/softwares/AppImage# 2、Snipaste-2.8.9-…

图像分类——综合车辆数据集

一、重要性及意义 智能交通管理:车辆图像分类是智能交通系统(ITS)中的关键组成部分。通过对监控摄像头捕捉到的车辆图像进行自动分类,系统能够实时识别车辆类型、颜色、品牌等信息,进而实现交通流量监控、违章行为检测…

在线知识库如何从零开始搭建?这篇文章来教你!

引言: 有没有想过把那些零散在脑海中的点点滴滴整理起来,建立一个属于自己的在线知识库?无论是个人学习,团队协作,还是企业管理,一个良好的知识库都能帮我们更高效地存储和分享知识。如果你还在为“怎么建知…

YesPMP众包平台 | 活动有礼,现金奖励点击领取!

YesPMP众包平台在线发福利啦,4月16日活动火热开启,现金奖励等你来领,最高可领千元,赶快参与将奖励收入囊中,一起来了解活动细节吧! 一、活动内容: 活动一:【项目征集令】活动&…

告别传统开发,用这11个网站模板搭建的零售线上商城,制作成本都大幅降低了

随着人工智能时代的到来,很多复杂的工作再日益变得简单。比如20年前开发一个在线商城完成支付交易,那是一个不得了的事情,现在的零售巨头淘宝和京东就是在那个时代崛起的。新时代涌现出了许多新的工具,比如使用低代码平台搭建的自…

【网站项目】驾校报名小程序

🙊作者简介:拥有多年开发工作经验,分享技术代码帮助学生学习,独立完成自己的项目或者毕业设计。 代码可以私聊博主获取。🌹赠送计算机毕业设计600个选题excel文件,帮助大学选题。赠送开题报告模板&#xff…

使用Python生成二维码

1、背景 上一次我们介绍了什么是二维码,读过这篇文章以后,相信大家对二维码已经有了一定的认识,那么有没有想过如何自己动手生成二维码呢?二维码在我们的生活与工作中,都能够做什么呢?今天我们来探讨一下用…

2.Mysql 多实例的部署和应用

Mysql多实例的概念: MySql多实例就是在一台机器上开启多个不同的服务端口,运行多个MySql服务进程,通过不同的socket监听不同的服务端口来提供各自的服务。 这些Mysql多实例共用一套MySql安装程序,使用不同的my.cnf(也可…

ThreadX在STM32上的移植:通用启动文件tx_initialize_low_level.s

在嵌入式系统开发中,实时操作系统(RTOS)的选择对于系统性能和稳定性至关重要。ThreadX是一种广泛使用的RTOS,它以其小巧、快速和可靠而闻名。在本文中,我们将探讨如何将ThreadX移植到STM32微控制器上,特别是…

计算机网络 Cisco路由信息协议(RIP)实验

一、实验内容 1、命名 2、关闭域名解释 3、设置路由器接口IP地址 4、根据要求配置RIP以实现所有客户机都能相互通信 5、配置默认路由 二、实验数据处理 1、建立拓扑图 2、PC机地址配置 主机IP地址子网掩码网关PC110.23.1.2255.255.255.010.23.1.1PC210.23.1.3255.255.2…

[论文分享] Large Language Model guided Protocol Fuzzing

笔记目录 Large Language Model guided Protocol Fuzzing [NDSS 2024]IntroductionConstructionContribution BackgroundProtocol FuzzingChallenges Large Language ModelsMotivation Case StudyLifting Message Grammars: Quality and DiversityEnriching the Seed Corpus: D…

如何利用open3D来生成OCC

config.yaml depth: 10:#深度,设定为10,常用于决定处理或计算的层次或深入程度。 min_density: 0.1:#最小密度,设置为0.1,用于过滤或选择的密度阈值。 n_threads: -1:#线程数,设为-…

群晖(Synology)NAS 启用 SSH

群晖(Synology)NAS 是可以启用 SSH 的。 如果使用 SSH 命令,我们可以在 NAS 上运行相关的 Linux 命令,比如说在服务器网络传输数据上,就会有明显的优势了。 如何启用 进入 NAS 的服务器控制台,然后找到终…

LeetCode 349. 两个数组的交集

LeetCode 349. 两个数组的交集 1、题目 力扣题目链接:349. 两个数组的交集 给定两个数组 nums1 和 nums2 ,返回 它们的 交集 。输出结果中的每个元素一定是 唯一 的。我们可以 不考虑输出结果的顺序 。 示例 1: 输入:nums1 […

锂电池寿命预测 | Matlab基于BiLSTM双向长短期记忆神经网络的锂电池寿命预测

目录 预测效果基本介绍程序设计参考资料 预测效果 基本介绍 锂电池寿命预测 | Matlab基于BiLSTM双向长短期记忆神经网络的锂电池寿命预测 程序设计 完整程序和数据获取方式:私信博主回复Matlab基于BiLSTM双向长短期记忆神经网络的锂电池寿命预测。 参考资料 [1] h…

【菜狗学前端】npm i -g nodemon 遇到的下载卡住及运行权限问题解决记录

一、下载nodemon原因 nodemon作用:用node环境运行js文件时可以实时刷新运行出结果 (即修改js代码后不需再手动重新运行js文件) 二、下载卡住 reify:semver:timing reifyNode:node_modules/nodemon Completed 卡住位置:reify:semver: timing reifyNode…

力扣第20题有效的括号

typedef char STDataType; //动态栈 #define allocator_may_return_null 1typedef struct ST {STDataType* _a;int _top;//栈顶元素int _capacity;//最大容量 }Stack; //初始化栈 void StackInit(Stack *pst);//入栈 void StackPush(Stack* pst, STDataType x);//出栈 void Sta…

优思学院|2024年如何成为一名六西格玛黑带?

如果你总是觉得无论多么努力,职场上似乎难以有所突破,那么你应该知道,你并不是孤独的。 实际上,大量研究表明,高达90%的人对自己的工作感到不满,这意味着在你认识的每10人中,可能只有1人对其工…

CMC学习系列 (9):对侧半球可能支持中风后的恢复

对侧半球可能支持中风后的恢复 0. 引言1. 主要贡献2. 方法2.1 患者信息2.2 行为测试2.3 运动任务/实验范式 3. 结果3.1 对照参与者和卒中患者的相干图3.2 地形图上的CMC标签 4. 讨论5. 总结欢迎来稿 论文地址:https://www.sciencedirect.com/science/article/pii/S2…

认识OpenEuler操作系统

引言 在信息技术日新月异的时代,开源软件已成驱动创新的核心动能,其中,OpenEuler作为一款冉冉升起的开源操作系统典范,凭借其对开源精神的坚守与技术创新的不懈追求,自亮相以来便引发了全球关注。本文将全方位深挖Open…