项目十二：简单的python基础爬虫训练

项目十二：简单的python基础爬虫训练

article2024/12/25 13:17:25/文章来源:https://blog.csdn.net/2201_75876277/article/details/139076809

许久未见，甚是想念，今日好运，为你带好运。ok，废话不多说，希望这门案例能带你直接快速了解并运用。🎁💖

基础流程

第一步：安装需要用到的requests库，命令如下

pip install requests

第二步：随意找个目标网址

url = '目标网址'

第三步：发送请求get响应

req = requests.get(url)

第四步：打印响应信息

print(req_text)

完整代码如下

import requests #导入库
url = 'http://gitbook.cn/' #目标网址
req = requests.get(url) #发送请求
print(req.text) #打印信息

输出结果

ok,这四步流程就是走完了，接下来就是怎么把爬取的数据保存下来，那么继续往下看。

存储数据

存储数据的格式有很多种，例如csv、html、spl、xls等，全看个人意愿选择。基本代码如下

with open('./文件名称路径', '文件操作模式', encoding = '编码格式') as fp:
    fp.write(page_text) #括号内容为变量，包含要写入的文本内容

最终代码如下

import requests # 导入requests模块
url = 'https://www.sogou.com' # 要爬取的网址
req = requests.get(url) # 发起请求
page_text = req.text # 获取网页内容
print(page_text) # 此行代码可以不加，看个人喜好，不影响程序运行
with open('./sogou.html', 'w', encoding = 'utf-8') as fp: # 保存网页内容到本地
    fp.write(page_text) # 写入文件

输出结果：

这些简单的爬虫流程我们从爬取数据到存储数据就是做完了，是不是很简单啊，当然，对任何事物还是要保持敬畏之心和上进之心。

我是好运，想要好运，今日分享，到此一游

本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如若转载，请注明出处：/a/639279.html

如若内容造成侵权/违法违规/事实不符，请联系我们进行投诉反馈qq邮箱809451989@qq.com，一经查实，立即删除！

相关文章

网络拓扑—DNS服务搭建

网络拓扑—DNS服务搭建

文章目录 DNS服务搭建网络拓扑配置网络DNSPC 安装DNS服务配置DNS服务创建正向查找区域创建反向查找区域创建子域名 PC机DNS域名解析 DNS服务搭建网络拓扑为了节省我的U盘空间，没有用路由器，所以搭建的环境只要在同网段即可。 //交换机不用考虑 DNS&a…

阅读更多...

探数API统计分享-1949年-2021年中国历年夏粮产量统计报告

探数API统计分享-1949年-2021年中国历年夏粮产量统计报告

中国历年夏粮产量，为1949年到2021年我国每年的夏粮产量数据。2021年，我国夏粮产量为14596万吨，比上年增长2.2%。数据统计单位为：万吨。我国夏粮产量有多少？ 2021年，我国夏粮产量为1…

阅读更多...

计算机网络安全控制技术

计算机网络安全控制技术

1.防火墙技术防火墙技术是近年来维护网络安全最重要的手段，但是防火墙不是万能的，需要配合其他安全措施来协同 2.加密技术目前加密技术主要有两大类：对称加密和非对称加密 3.用户识别技术核心是识别网络者是否是属于系统的合法用户 …

阅读更多...

2024.5.26 机器学习周报

2024.5.26 机器学习周报

目录引言 Abstract 文献阅读 1、题目 2、引言 3、创新点 4、Motivation 5、naive Lite-HRNet 6、Lite-HRNet 7、实验深度学习解读SAM(Segment Anything Model) 1、SAM Task 2、SAM Model 2.1、Patch Embedding 2.2、Positiona Embedding 2.3、Transformer …

阅读更多...

VERY DEEP CONVOLUTIONAL NETWORKS FOR LARGE-SCALE IMAGE RECOGNITION--论文笔记

VERY DEEP CONVOLUTIONAL NETWORKS FOR LARGE-SCALE IMAGE RECOGNITION--论文笔记

论文笔记论文来源 Very Deep Convolutional Networks for Large-Scale Image Recognition 代码来源还没上传数据集这里采用的是猫狗数据集还没上传 1论文摘要的翻译在这项工作中，我们研究了卷积网络深度对其在大规模图像识别设置中的准确性的影响。我…

阅读更多...

Offline RL : Beyond Reward: Offline Preference-guided Policy Optimization

Offline RL : Beyond Reward: Offline Preference-guided Policy Optimization

ICML 2023 paper code preference based offline RL，基于HIM，不依靠额外学习奖励函数 Intro 本研究聚焦于离线偏好引导的强化学习（Offline Preference-based Reinforcement Learning, PbRL），这是传统强化学习&#x…

阅读更多...

QT编译安装mqtt连接Onenet云平台

QT编译安装mqtt连接Onenet云平台

目录文章目录目录前言一、编译mqtt**1.从官方源码下载对应自己qt版本的源文件，【此源文件不要有中文名称的路径】****2.打开qtmqtt.pro工程****3.选择qt的编译器，【我选择的是mingw 64】****4.将qtmqtt的源码头文件移植到QT的安装目录下面****5.编译**…

阅读更多...

【译】MySQL复制入门：探索不同类型的MySQL复制解决方案

【译】MySQL复制入门：探索不同类型的MySQL复制解决方案

原文地址：An Introduction to MySQL Replication: Exploring Different Types of MySQL Replication Solutions 在这篇博文中，我将深入介绍 MySQL 复制，回答它是什么、如何工作、它的优势和挑战，并回顾作为 MySQL 环境&#xff0…

阅读更多...

数美滑块研究

数美滑块研究

周一，在清晨的阳光照耀下，逆向山脚下的小镇宁静而安详。居民们忙碌地开始一天的生活，而在爬虫镇子的边缘，一座古朴的道观显得格外神秘。阿羊正静静地坐在青石长凳上，摸鱼养神。突然，一道清脆的声音在他耳…

阅读更多...

android studio接入facebook踩坑1

android studio接入facebook踩坑1

今天在接入facebook第三方登录的时候，点击登录按钮，APP闪退，并报错 java.lang.RuntimeException Failure delivering result ResultInfo{whonull,request64206,result-1} 新文章链接https://lengmo714.top/facebook1.html 如下图：…

阅读更多...

【Unity】Unity项目转抖音小游戏（三）资源分包，抖音云CDN

【Unity】Unity项目转抖音小游戏（三）资源分包，抖音云CDN

业务需求，开始接触一下抖音小游戏相关的内容，开发过程中记录一下流程。使用资源分包可以优化游戏启动速度，是抖音小游戏推荐的一种方式，抖音云也提供存放资源的CDN服务抖音云官方文档：https://developer.open-douyi…

阅读更多...

vue + SpringBoot + flowable 实现工作流审批功能 (流程图部署)

vue + SpringBoot + flowable 实现工作流审批功能 (流程图部署)

目录搭建前端vue项目 vue init webpack project_name 初始化项目导入 element-ui 框架 npm install element-ui -s 设置 element-ui 全局配置编辑 main.js 文件 import ElementUI from "element-ui"; // ui框架导入 import element-ui/lib/theme-chal…

阅读更多...

网络模型-PoE技术

网络模型-PoE技术

一、PoE简介以太网供电PoE(Powerover Ethernet)是指通过以太网网络进行供电，也被称为基于局域网的供电系统PoL(PoweroverLAN)或有源以太网(Active Ethernet)。 1、PoE的优势: 可靠: 电源集中供电，备份方便。连接简捷: 网络终端不需外接电源&#xf…

阅读更多...

大数据——大数据架构

大数据——大数据架构

一：大数据应用场景 1.离线批处理数据量比较大，延迟比较高 2.实时检索实时检索中的hbase按key值检索较快，因为其存储是顺序存储，但是对value的检索就相对较慢。数据量大，实时查询数据，不能对数据做大量…

阅读更多...

商品发布功能

商品发布功能

文章目录 1.SPU和SKU介绍1.SPU2.SKU3.两者之间的关系 2.完成商品发布界面1.组件引入1.commoditylaunch.vue 引入到 src/views/modules/commodity下2.multiUpload.vue 引入到 src/components/upload/multiUpload.vue 2.创建菜单1.创建目录2.创建菜单，注意菜单路由要匹…

阅读更多...

打破壁垒，实现多引擎3D内容轻量化交付|点量云流

打破壁垒，实现多引擎3D内容轻量化交付|点量云流

随着应用场景的不断拓展，传统的视频流技术已难以满足日益复杂的需求。当前市场上的视频流解决方案支持的引擎基本是UE、Unitiy输出的exe3D应用，在处理WebGL等3D内容时，也存在诸多局限性，例如性能限制、跨平台兼容性问题、无法直接…

阅读更多...

AGI技术与原理浅析：曙光还是迷失？

AGI技术与原理浅析：曙光还是迷失？

前言：回顾以往博客文章，最近一次更新在2020-07，内容以机器学习、深度学习、CV、Slam为主，顺带夹杂个人感悟。笔者并非算法科班出身，本科学制药、研究生学金融，最原始的算法积累都来源于网络，当时…

阅读更多...

Wpf 使用 Prism 实战开发Day23

Wpf 使用 Prism 实战开发Day23

自定义对话框服务当原有对话框不能满足需求的时候，可以通过自定义对话框来实现特殊的需求一.自定义对话框主机服务步骤： 1.建立一个IDialogHostService 接口类，继承自 IDialogService 对话框服务类。并且自定义基类的服务方法。 public …

阅读更多...

sh控制台输入文字多行按“# ꧂ ꧁”结束

sh控制台输入文字多行按“# ꧂ ꧁”结束

如果在Unix shell中输入多行文字，那么这样操作： 1. 打开您的终端（Terminal）。 2. 输入您的文字，每行文字后按回车键。 3. 当您完成输入所有文字后，输入“# ꧂ ꧁”然后按回车键，表示输入结束。…

阅读更多...

海外私人IP和原生IP有什么区别，谁更有优势？

海外私人IP和原生IP有什么区别，谁更有优势？

一、什么是海外私人IP？什么是原生IP？ 1、海外私人IP： 海外私人IP是由专门的服务提供商提供的IP地址，这些IP地址通常与特定地理位置或国家相关联。这些IP地址独享私人而不用与其他用户共享。海外私人IP访问特定国家或地区的网站&am…

阅读更多...

最新文章