【Python学习笔记】记载解决Python报错HTTP Error 403: Forbidden的一波三折过程

【Python学习笔记】记载解决Python报错HTTP Error 403: Forbidden的一波三折过程

当前进度:还没有解决,但是已经尝试了好几种办法,此处做个记录,也许能帮上忙。
本帖是整理回顾帖,不是教程帖,追求一个完美无缺必拿下答案的码友现在可以退出了。

在跟网课老师敲代码的时候,加载sklearn新闻数据集fetch_20newsgroups()的时候,出错,报错HTTP Error 403: Forbidden。
(我看的网课链接:https://www.bilibili.com/video/BV1e14y1G7gC/?p=68&spm_id_from=pageDriver&vd_source=cdfd0a0810bcc0bcdbcf373dafdf6a82
个人认为是比较适合小白的人工智能入门教程
用到这个数据集的地方是第68p,10 数据集介绍)

经过多方搜索以后目前查到以下解决办法:

一、修改源代码文件

按照如下几个教程贴的步骤来即可,大致内容都差不多,个别代码多个一句两句,比如下面这段,不是每个教程都有:
在这里插入图片描述
https://blog.csdn.net/weixin_43656359/article/details/103758027?spm=1001.2014.3001.5506
教程帖子1(推荐,有源代码可复制)
在这里插入图片描述
https://blog.csdn.net/xiaotian127/article/details/86836571?spm=1001.2101.3001.6650.6&utm_medium=distribute.pc_relevant.none-task-blog-2%7Edefault%7EBlogCommendFromBaidu%7ERate-6-86836571-blog-128920936.235%5Ev38%5Epc_relevant_sort_base1&depth_1-utm_source=distribute.pc_relevant.none-task-blog-2%7Edefault%7EBlogCommendFromBaidu%7ERate-6-86836571-blog-128920936.235%5Ev38%5Epc_relevant_sort_base1&utm_relevant_index=7
教程帖子2
在这里插入图片描述
https://blog.csdn.net/weixin_45510412/article/details/128558799?spm=1001.2101.3001.6650.2&utm_medium=distribute.pc_relevant.none-task-blog-2%7Edefault%7ECTRLIST%7ERate-2-128558799-blog-103758027.235%5Ev38%5Epc_relevant_sort_base1&depth_1-utm_source=distribute.pc_relevant.none-task-blog-2%7Edefault%7ECTRLIST%7ERate-2-128558799-blog-103758027.235%5Ev38%5Epc_relevant_sort_base1&utm_relevant_index=5
教程帖子3
在这里插入图片描述
这个方法根据这几个评论区帖子的反馈都很有效,但我就是不行,我也很奇怪。之前为了将原神模型导入Unity的时候下了subline Text(现在都还记得应该改哪一串代码让Unity别报错,哈哈)
下面是MMD的改代码界面,顺带提一句免得忘了
subline的使用界面
但是我按照教程改了这个python代码以后并没有解决问题:
在这里插入图片描述
在这里插入图片描述
然后我就去换了方法二

二、氪金买专栏

CSDN有一位大佬的付费专栏提供解决方法,评论区反响很好
https://blog.csdn.net/weixin_43178406/article/details/128920936#comments_27735247
土豪请随意
在这里插入图片描述
但是我按这个脚本复制运行以后,确实下载了数据集,但是还是不能正常运行。
在这里插入图片描述
目前报错Unexpected exception formatting exception. Falling back to standard exception,我百度以后还没弄明白是怎么回事,把可能惹祸的Print注释掉也没用。
https://www.5axxw.com/questions/simple/irn34y
答疑网页
在这里插入图片描述
20230723二次编辑:
我对比以后发现网课老师和写专栏的这位老师的调用方式有所不同,我试了专栏老师的调用方式,现在可以正常读出数据集了:

在这里插入图片描述

图片分割线,果然氪金的就是靠谱啊……

在这里插入图片描述
解决这个数据集读入问题以后,print查看的时候还遇到一个小报错IOPub data rate exceeded,我搜了个解决方案:
https://blog.csdn.net/xucanlax/article/details/124462706
IOPub data rate exceeded
在这里插入图片描述
我亲自试了以后还是显示一样的内容,无所谓了……
在这里插入图片描述
**

方法三:本地下载

**
我找到几个教程帖,还是没有起作用。
1.
https://blog.csdn.net/m0_55196097/article/details/127839231?spm=1001.2014.3001.5506
重建dns缓存
在这里插入图片描述
我按照这个帖子的说法重建了dns缓存,也成功了,但一运行还是报错HTTP Error 403: Forbidden
2.
https://blog.csdn.net/weixin_45510412/article/details/128558799?spm=1001.2101.3001.6650.2&utm_medium=distribute.pc_relevant.none-task-blog-2%7Edefault%7ECTRLIST%7ERate-2-128558799-blog-103758027.235%5Ev38%5Epc_relevant_sort_base1&depth_1-utm_source=distribute.pc_relevant.none-task-blog-2%7Edefault%7ECTRLIST%7ERate-2-128558799-blog-103758027.235%5Ev38%5Epc_relevant_sort_base1&utm_relevant_index=5
另一个帖子
在这里插入图片描述
3.
还有处理一个相似数据集的帖子,我看和我这个数据集不一样,就没有实操:
https://blog.csdn.net/m0_60465900/article/details/129748445?spm=1001.2014.3001.5506
lfw数据集
在这里插入图片描述
**

方法四:修改user agent

**
上网搜HTTP Error 403: Forbidden报错的时候有帖子说是爬虫引起的,需要改user agent。我是chrome浏览器,就需要搜一下对应的chrome浏览器怎么操作。
我搜了很多帖子,但还是没太明白怎么弄,找到检查以后的Network目录以后就卡住了,改桌面快捷方式的属性似乎也不对。
https://blog.csdn.net/qq_33218097/article/details/129783677
修改chrome浏览器属性

1.
在这里插入图片描述
**

**
https://www.cnblogs.com/blueteer/p/16013249.html
在header请求中添加User-agent信息
在这里插入图片描述
鉴于我还不是太明白这块,我上万能的b站找了个爬虫知识相关的网课,打算学习一下再试。
https://www.bilibili.com/video/BV17K411G7sY/?spm_id_from=333.337.search-card.all.click&vd_source=cdfd0a0810bcc0bcdbcf373dafdf6a82
python爬虫必备知识点,代理请求数据
在这里插入图片描述
我觉得一般人应该到不了我这步,我属于是环境装得比较混乱才容易一波三折,上面那么多方法普通人最多试2个应该就解决了。
20230723:课程第一遍看完了,对于没有接触过爬虫的人来说是很好的入门教程,但是直接就一步到位到能爬数据集我觉得我还是做不到那个程度。我打算跟着教程再看一遍照着写代码,然后在搞懂这个视频的代码的基础上类比其他帖子和教程的内容继续学习。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:/a/43523.html

如若内容造成侵权/违法违规/事实不符,请联系我们进行投诉反馈qq邮箱809451989@qq.com,一经查实,立即删除!

相关文章

在 Windows 中通过 WSL 2 高效使用 Docker

大家好,我是比特桃。平时开发中,不免会使用一些容器来跑中间件。而开发者使用的操作系统,大多是Mac OS 、Windows。Docker 为了兼顾这两个平台的用户,推出了 Docker Desktop 应用。Docker Desktop 中的内核还是采用了 Linux 的内核…

智能合约安全审计

智能合约安全审计的意义 智能合约审计用于整个 DeFi 生态系统,通过对协议代码的深入审查,可以帮助解决识别错误、低效代码以及这些问题。智能合约具有不可篡改的特点,这使得审计成为任何区块链项目安全流程的关键部分。 代码审计对任何应用…

基于OpenCV的红绿灯识别

基于OpenCV的红绿灯识别 技术背景 为了实现轻舟航天机器人实现红绿灯的识别,决定采用传统算法OpenCV视觉技术。 技术介绍 航天机器人的红绿灯识别主要基于传统计算机视觉技术,利用OpenCV算法对视频流进行处理,以获取红绿灯的状态信息。具…

Qt5.14.2下载及安装

1. 下载 https://download.qt.io/archive/qt/5.14/5.14.2/ 由于Qt 自从5.15版本开始,对非商业版本(也就是开源版本),不提供已经制作好的离线exe安装包。所以,对于5.15(含)之后的版本&#xff…

苹果账号被禁用怎么办

转载:苹果账号被禁用怎么办 目录 禁用的原因 解除Apple ID禁用 [外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-UKQ1ILhC-1689932607373)(data:image/gif;base64,R0lGODlhAQABAPABAP///wAAACH5BAEKAAAALAAAAAABAAEAAAICRAEAOw)]​编辑 …

MySQL的主从复制练习

基本原理图如下: 主从复制(也称 AB 复制)允许将来自一个MySQL数据库服务器(主服务器)的数据复制到一个或多个MySQL数据库服务器(从服务器)。当主库进行更新的时候,会自动将数据复制到…

从C到C++ | C++入门(三)

目录 内联函数 auto 关键字 范围for 指针空值nullptr 内联函数 以inline修饰的函数叫内联函数&#xff0c;编译时C编译器会在调用函数的地方展开&#xff0c;没有函数调用建立栈帧的开销&#xff0c;可提升程序的运行效率。 例子&#xff1a; #include <iostream> …

【C++修炼之路】内存管理

&#x1f451;作者主页&#xff1a;安 度 因 &#x1f3e0;学习社区&#xff1a;StackFrame &#x1f4d6;专栏链接&#xff1a;C修炼之路 文章目录 一、C/C 内存分布二、考题三、C语言动态内存管理方式四、C内存管理方式1、对内置类型2、对自定义类型 五、C对动态管理的升级六…

查找和二叉树(基础知识和基本操作)

查找&#xff1a; 1.二分查找&#xff1a;先定一个大范围&#xff0c;想一个数&#xff0c;看是在起始范围到中间范围还是中间范围到结束范围&#xff0c;依次循环直到确定值&#xff08;相当于一直把范围折半&#xff0c;直到找到&#xff09; while(low<high) {int mid(…

分布式光伏电站运维平台在石化行业的应用光伏发电数据实时监控

摘要&#xff1a;为实现绿色发展和“净零排放”的目标&#xff0c;近些年来国内外不少能源化工企业进入光伏发电领域。如何做好光伏电站的运行维护&#xff0c;成为石化企业不得不思考的重要课题。本文从分布式光伏电站消防安全、作业安全、环保管理等方面进行思考&#xff0c;…

为什么学习SpringSpring框架核心与设计思想(IOC与DI)?

博主简介&#xff1a;想进大厂的打工人博主主页&#xff1a;xyk:所属专栏: JavaEE进阶 目录 文章目录 一、Spring是什么&#xff1f; 二、为什么要学习框架&#xff1f; 三、Spring核心概念 3.1 什么是容器&#xff1f; 3.2 什么是IOC&#xff1f; 四、再谈Spring中的 IOC 五…

mac如何提取视频中的音频?

mac如何提取视频中的音频&#xff1f;我们经常在平时工作的时候&#xff0c;需要将一个视频里面的音频单独提取出来另做他用&#xff0c;例如很多视频自媒体博主就经常使用这种方法来储备音频素材&#xff0c;这个操作在Windows上面比较容易实现&#xff0c;毕竟有相当多的软件…

计算机网络微课堂学习笔记(详细图解讲解)-长期更新

前言&#xff1a; 计算机网络在信息时代的作用 计算机网络已由一种通信基础设施发展成为一种重要的信息服务基础设施&#xff0c;计算机网络已经像水、电、煤气这些基础设施一样&#xff0c;成为我们生活中不可或缺的一部分 一、因特网概述 &#xff08;1&#xff09;网络、…

黑马 pink h5+css3+移动端前端

网页概念 网页是网站的一页,网页有很多元素组成,包括视频图片文字视频链接等等,以.htm和.html后缀结尾,俗称html文件 HTML 超文本标记语言,描述网页语言,不是编程语言,是标记语言,有标签组成 超文本指的是不光文本,还有图片视频等等标签 常用浏览器 firefox google safari…

Git标签管理(对版本打标签,起别名)

tag 理解标签创建标签git tag [name]git show [tagname] 操作标签删除标签git tag -d < tagname > 推送某个标签到远程git push origin < tagname > 理解标签 标签 tag &#xff0c;可以简单的理解为是对某次 commit 的⼀个标识&#xff0c;相当于起了⼀个别名。 …

实际上手体验maven面对冲突Jar包的加载规则 | 京东云技术团队

一、问题背景 相信大家在日常的开发过程中都遇到过Jar包冲突的问题&#xff0c;emm&#xff0c;在最近处理业务需求时我也遇到了不同版本jar包冲突导致项目加载出错的问题。主要是一个完整的项目会不可避免的使用第三方的Jar包来实现功能开发&#xff0c;各种第三方包之间可能…

【Linux】自动化构建工具-make/Makefile详解

前言 大家好吖&#xff0c;欢迎来到 YY 滴 Linux系列 &#xff0c;热烈欢迎&#xff01;本章主要内容面向接触过Linux的老铁&#xff0c;主要内容含 欢迎订阅 YY 滴Linux专栏&#xff01;更多干货持续更新&#xff01;以下是传送门&#xff01; 订阅专栏阅读&#xff1a;YY的《…

跨网段耦合器的作用

你是否曾经遇到过需要跨网段访问设备的问题&#xff1f;比如在工业自动化领域&#xff0c;PLC和数控设备的连接。这时候&#xff0c;远创智控YC8000-NAT就能帮你轻松解决。 1, 远创智控YC8000-NAT是一款功能强大的设备&#xff0c;它可以将LAN1口所连接PLC的IP地址和端口号&a…

使用wxPython和pillow开发拼图小游戏(四)

上一篇介绍了使用本地图片来初始化游戏的方法&#xff0c;通过前边三篇&#xff0c;该小游戏的主要内容差不多介绍完了&#xff0c;最后这一篇来介绍下游戏用时的计算、重置游戏和关闭窗口事件处理 游戏用时的计算 对于游戏用时的记录&#xff0c;看过前几篇的小伙伴可能也发现…

结构型设计模式之代理模式【设计模式系列】

系列文章目录 C技能系列 Linux通信架构系列 C高性能优化编程系列 深入理解软件架构设计系列 高级C并发线程编程 设计模式系列 期待你的关注哦&#xff01;&#xff01;&#xff01; 现在的一切都是为将来的梦想编织翅膀&#xff0c;让梦想在现实中展翅高飞。 Now everythi…