爬虫练习：获取某招聘网站Python岗位信息

爬虫练习：获取某招聘网站Python岗位信息

article2025/1/11 5:10:25/文章来源:https://blog.csdn.net/m0_74972727/article/details/136598954

一、相关网站

二、相关代码

import requests
from lxml import etree
import csv
with open('拉钩Python岗位数据.csv', 'w', newline='', encoding='utf-8') as csvfile:
    fieldnames = ['公司', '规模','岗位','地区','薪资','经验要求']
    writer = csv.DictWriter(csvfile, fieldnames=fieldnames)
    writer.writeheader()
    for page in range(1,31):
        # url = 'https://www.lagou.com/wn/zhaopin?fromSearch=true&kd=python&city=%E5%85%A8%E5%9B%BD'
        url = f'https://www.lagou.com/wn/zhaopin?fromSearch=true&kd=python&pn={page}'
        headers = {
            'User-Agent':'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/107.0.0.0 Safari/537.36'

        }
        data = {
            'fromSearch':'true',
            'kd':'python',
            'city':'全国'
        }
        response = requests.post(url=url,data=data,headers=headers)
        # print(response.text)
        result = etree.HTML(response.text)
        company = result.xpath('//div[@class="company-name__2-SjF"]/a/text()')
        scale = result.xpath('//div[@class="industry__1HBkr"]/text()')
        post = result.xpath('//div[@class="p-top__1F7CL"]/a/text()[1]')
        location = result.xpath('//div[@class="p-top__1F7CL"]/a/text()[2]')
        salt = result.xpath('//div[@class="p-bom__JlNur"]/span/text()')
        suffer = result.xpath('//div[@class="p-bom__JlNur"]/text()[1]')
        # print(company,scale,post,location,salt,suffer)
        for com, sca, pos, loc, sal,suf in zip(company, scale, post, location, salt,suffer):
            print(f'{com} ====== {sca} ====== {pos} ====== {loc} ===== {sal} ===== {suf}')
            writer.writerow({'公司': com, '规模': sca, '岗位': pos, '地区': loc, '薪资': sal,'经验要求':suf})

三、获取的结果

版权声明和免责声明

本博客提供的所有爬虫代码和相关内容（以下简称“内容”）仅供参考和学习之用。任何使用或依赖这些内容的风险均由使用者自行承担。我（博客所有者）不对因使用这些内容而产生的任何直接或间接损失承担责任。

严禁将本博客提供的爬虫代码用于任何违法、不道德或侵犯第三方权益的活动。使用者应当遵守所有适用的法律法规，包括但不限于数据保护法、隐私权法和知识产权法。

如果您选择使用本博客的爬虫代码，您应当确保您的使用行为符合所有相关法律法规，并且不会损害任何人的合法权益。在任何情况下，我（博客所有者）均不对您的行为负责。

如果您对本声明有任何疑问，或者需要进一步的澄清，请通过我的联系方式与我联系。

本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如若转载，请注明出处：/a/445648.html

如若内容造成侵权/违法违规/事实不符，请联系我们进行投诉反馈qq邮箱809451989@qq.com，一经查实，立即删除！

相关文章

每日OJ题_牛客WY28 跳石板（动态规划）

每日OJ题_牛客WY28 跳石板（动态规划）

目录牛客WY28 跳石板解析代码牛客WY28 跳石板跳石板_牛客题霸_牛客网解析代码 #include <iostream> #include <vector> #include <climits> #include <cmath> using namespace std;void get_div_num(int n, vector<int>& arr) {for…

阅读更多...

selenium元素定位问题

selenium元素定位问题

具体网页信息如下： 定位的时候driver.find_element(By.CLASS_NAME, 方法搞不定。定位方法： 方法一：通过文本定位 driver.find_element(By.XPATH, "//*[text()高分一号]").click() time.sleep(3) 如果是部分文字 #部分文字py…

阅读更多...

怎么写品牌方流量打造抖音运营规划方案

怎么写品牌方流量打造抖音运营规划方案

【干货资料持续更新，以防走丢】怎么写品牌方流量打造抖音运营规划方案部分资料预览资料部分是网络整理，仅供学习参考。抖音运营资料合集（完整资料包含以下内容） 目录 Step 1: 人货沟通策略人群定位与细分 1. 从品牌及产品…

阅读更多...

【备战蓝桥杯系列】蓝桥杯国二选手笔记二：算法模版笔记（Java）

【备战蓝桥杯系列】蓝桥杯国二选手笔记二：算法模版笔记（Java）

感谢大家的点赞，关注，评论。准备蓝桥杯的同学可以关注一下本专栏哦，不定期更新蓝桥杯笔记以及经验分享。本人多次参加过蓝桥杯，并获得过蓝桥杯国二的成绩。算法模版笔记（Java） 这篇文章给大家分享我的蓝桥…

阅读更多...

寒假作业Day 10

寒假作业Day 10

寒假作业Day 10 一、选择题 1、下列数据结构中，不属于线性表的是( ) A.队列 B.顺序表 C.二叉树 D.链表 A. 队列：队列是一种特殊的线性表，它只允许在表的前端（front）进行删除操作，而在表的后端&#xff08…

阅读更多...

【经管数据-更新】华证ESG评级得分数据（2009-2023年）

【经管数据-更新】华证ESG评级得分数据（2009-2023年）

一、数据说明参考《经济研究》中方先明（2023）的做法，将华证ESG评级进行赋值，指标包含C、CC、CCC、B、BB、BBB、A、AA、AAA共9个等级，将上市公司ESG 等级从低到高分别赋值为1至9 二、数据来源：世界银行&am…

阅读更多...

Springboot进行web开发

Springboot进行web开发

创建springboot工程，基于2022版idea pom.xml文件中的插件爆红： 解决方法：给插件加<version>版本号</version> 版本号和<parent></parent>中的版本号一样。另外有人说重启也可以解决爆红，可以试一下&a…

阅读更多...

Stable diffusion（一）

Stable diffusion（一）

Stable diffusion 原理解读名词解释正向扩散（Fixed Forward Diffusion Process）：反向扩散（Generative Reverse Denoising Process） VAE（Variational AutoEncoder）：一个用于压缩图…

阅读更多...

【动态规划】【前缀和】【和式变换】100216. K 个不相交子数组的最大能量值

【动态规划】【前缀和】【和式变换】100216. K 个不相交子数组的最大能量值

本文涉及知识点动态规划汇总 C算法：前缀和、前缀乘积、前缀异或的原理、源码及测试用例包括课程视频 LeetCode 100216. K 个不相交子数组的最大能量值给你一个长度为 n 下标从 0 开始的整数数组 nums 和一个正奇数整数 k 。 x 个子数组的能量值定义为 stren…

阅读更多...

Swagger修改Api文档中的数据类型

Swagger修改Api文档中的数据类型

swagger不陌生,API接口利器,本次要解决的问题是:我们知道前端在接收Long类型的属性时会出现精度问题,一般我们会在序列化的时候将Long类型的数字转换成String但是swagger的API文档中的类型还是Long,我们要解决的就是这个问题不知道swagger怎么配置得可以看之前的文章:springb…

阅读更多...

空间复杂度的OJ练习——轮转数组

空间复杂度的OJ练习——轮转数组

旋转数组OJ链接：https://leetcode-cn.com/problems/rotate-array/ 题目： 思路： 通过题目我们可以知道这是一个无序数组，只需要将数组中的数按给定条件重新排列，因此我们可以想到以下几种方法： 1.暴力求解法…

阅读更多...

【Tauri】（5）：本地运行candle和 qwen 大模型，并测试速度

【Tauri】（5）：本地运行candle和 qwen 大模型，并测试速度

1，本地运行candle 关于candle项目 https://github.com/huggingface/candle Hugging Face 使用rust开发的高性能推理框架。语法简单， 风格与 PyTorch 相似。 CPU 和 Cuda Backend：m1、f16、bf16。支持 Serverless（CPU&#xff…

阅读更多...

React 从0到1构建企业级框架基于Antd Designer

React 从0到1构建企业级框架基于Antd Designer

一、 create-react-app 创建 cms-front 二、删除不必须要的文件形成如下结构 1. React版本为17版本 public 文件夹下保留 favicon.ico 偏爱图标index.html资源文件 2.src 保留 index.js 入口文件和app.js(基于spa原则)单文件即可三、配置eslint 1. 安装 eslint. npm inst…

阅读更多...

章六、集合（1）—— Set 接口及实现类、集合迭代、Map 接口、Collections类

章六、集合（1）—— Set 接口及实现类、集合迭代、Map 接口、Collections类

一、 Set 接口及实现类 Set接口不能存储重复元素 Set接口继承了Collection接口。Set中所存储的元素是不重复的,但是是无序的, Set中的元素是没有索引的 Set接口有两个实现类： ● HashSet ：HashSet类中的元素不能重复 ● TreeSet ：可以给Set集…

阅读更多...

低密度奇偶校验码LDPC（十）——LDPC码的密度进化

低密度奇偶校验码LDPC（十）——LDPC码的密度进化

一、密度进化的概念二、规则LDPC码的密度进化算法(SPA算法) 算法变量表 VN更新的密度进化 CN更新的密度进化算法总结程序仿真参考文献 [1] 白宝明孙韶辉王加庆. 5G 移动通信中的信道编码[M]. 北京: 电子工业出版社, 2018. [2] William E. Ryan, Shu Lin. Channel Co…

阅读更多...

Spring-AOP基础（全在这里）

Spring-AOP基础（全在这里）

八股文部分来源于网络，例子为原创 OOP(Object-oriented programming) 也就是面向对象编程，继承，封装，多态。局限性静态语言：类结构一旦定义，不容易被修改(并不是无法修改)。只能侵入性扩展&#xff1a…

阅读更多...

太强了！最全的大模型检索增强生成（RAG）技术概览！

太强了！最全的大模型检索增强生成（RAG）技术概览！

本文是对检索增强生成（Retrieval Augmented Generation, RAG）技术和算法的全面研究，对各种方法进行了系统性的梳理。文章中还包含了我知识库中提到的各种实现和研究的链接集合。鉴于本文的目标是对现有的RAG算法和技术进行概览和解释&#…

阅读更多...

【深度学习笔记】6_5 RNN的pytorch实现

【深度学习笔记】6_5 RNN的pytorch实现

注：本文为《动手学深度学习》开源内容，部分标注了个人理解，仅为个人学习记录，无抄袭搬运意图 6.5 循环神经网络的简洁实现本节将使用PyTorch来更简洁地实现基于循环神经网络的语言模型。首先，我们读取周杰伦专辑歌词…

阅读更多...

【C++】list模拟实现list迭代器失效问题

【C++】list模拟实现list迭代器失效问题

list模拟实现&list迭代器失效问题一，list模拟实现1. list的主要框架接口模拟2. list构造&拷贝构造&析构3. list迭代器3.1 普通迭代器3.2 const迭代器 4. 增删查改二，迭代器失效问题1. list的迭代器失效原因2. 解决办法一，list…

阅读更多...

个推与华为深度合作，成为首批支持兼容HarmonyOS NEXT的服务商

个推与华为深度合作，成为首批支持兼容HarmonyOS NEXT的服务商

自华为官方宣布HarmonyOS NEXT鸿蒙星河版开放申请以来，越来越多的头部APP宣布启动鸿蒙原生开发，鸿蒙生态也随之进入全新发展的第二阶段。作为华为鸿蒙生态的重要合作伙伴，个推一直积极参与鸿蒙生态建设。为帮助用户在HarmonyOS NEXT上持续享…

阅读更多...

最新文章