爬虫(一)——爬取快手无水印视频

前言

最近对爬虫比较感兴趣,于是浅浅学习了一些关于爬虫的知识。爬虫可以实现很多功能,非常有意思,在这里也分享给大家。由于爬虫能实现的功能太多,而且具体的实现方式也有所不同,所以这里开辟了一个新的系列——爬虫系列,来介绍爬虫的各种用法。

什么是爬虫

爬虫,简单来说,就是通过一些代码,自动获取网络上的信息的一种手段。而爬虫一般通过python来实现。

在这个信息化的时代,数据纷繁芜杂,如何从网上获取对我们有用的数据,如何获取不带水印的数据,如何绕开VIP的限制免费获得数据,爬虫会给我们答案。

python基础

以防有人不太会python,这里简单介绍一下python基础,懂的可以直接跳过。

创建项目

1.双击打开pycharm,点击新建项目
2.项目设置
- 勾选[继承全局站点软件包]
- 勾选[可用于所有项目]
- 取消勾选[创建main.py欢迎脚本]
- 点击创建
3.项目名称右键–新建–python文件
4.输入文件名–回车

python规范

1.数字和字符串
数字正常写 字符串加引号

2.注释
注释就是对代码的解释和说明。
# 解释的文字

3.标点符号
标点符号都用英文的标点符号!
, . [] < > = ! : 英文的
,。【】《》=!: 中文的不能用!

4.变量
在程序中用来保存数据的可以变化的量!
变量 = 数据
代码示例:

name = '天涯海角'
age = 22
gender = '女装大佬'
money = 100000000000
print(name, age, gender, money)

5.加载模块
在代码下面找到“终端”,点击终端,输入

pip install 模块名

即可加载该模块。

爬取快手无水印视频

这里实现的功能是通过四行代码可以爬取任意一个快手视频,而且无水印哦。

难点:怎么找到网址!以谷歌浏览器为例。

a.点击一条视频--浏览器右上角设置菜单--更多工具--开发者工具。
b.选择网络(network)--选择媒体(media)--刷新页面(不刷新页面可能没有数据)。
c.鼠标点击一条数据进去--复制网址(注意不是网页的网址,而是右下角的视频的网址)

在这里插入图片描述
下面给出四行代码以及详细的代码解释。

# 引号里面放视频的网址
url="https://v2.kwaicdn.com/ksc2/1Z86LBOQcVyaER9aXs4JJfkDlrp6hUK-QPl-gd_f9Woi7p8HKRCmak--7iEqoRXqMIe9PRGrj2bleAfnzUzqqNPGIMLyovVVm8jE65mG9vt1MK13b4mAYWKoSQ9h6Pe0.mp4?pkey=AAWpBlzIENFNqxzwQIaBLoiVu5D5y25UQKpnZLZ8K5Up8ggzeIJ_BoijxP5cU72Nyen-lbR_aqVhBg6hQDSFfKJwyhbI9j4WSnMVeLxt4C5mJ3ZvvF3NoIimnAYNHhAtOl8&tag=1-1721196852-unknown-0-nhcjzzfyru-2d0290527442a5c0&clientCacheKey=3xiu5qcnkkx3ema_aab2f98f&di=IAECUFgAEAIAAAAAAAPgxA==&bp=10004&tt=hd15&ss=vp"

# 注意运行代码前要先导入requests模块
import requests

# 使用requests的get功能 获取网站的响应
res = requests.get(url)

# 打开一个空的视频(快手无水印视频.mp4) 把得到res.content丢进去 得到一个可以播放的视频
open('快手无水印视频.mp4', 'wb').write(res.content)

最后,这个新产生的视频会存在于python代码的同一文件夹下。可以在python代码界面,点击鼠标右键–打开于–Explorer,就可以看到视频了。
在这里插入图片描述

总结

本文运用四行代码,实现了爬虫的最最基础的功能——爬取一条数据(一个视频)。后面将介绍爬虫的一些其它更有用的功能。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:/a/802983.html

如若内容造成侵权/违法违规/事实不符,请联系我们进行投诉反馈qq邮箱809451989@qq.com,一经查实,立即删除!

相关文章

FY4B卫星L2级产品掌握和python处理

废话不多说&#xff0c;展示二级产品CTT为例&#xff1a; 抱歉没空了解FY4B产品情况了&#xff0c;直接看代码 # CTT色标配置 bounds_CTT [180, 200, 220, 240, 260, 280, 300, 320] # 根据你的数据设定 colors_CTT [(0, 0, 139/255),(10/255, 0, 245/255),(0, 164/255, 2…

C语言——详解二维数组中元素的地址

在C语言中&#xff0c;二维数组元素的地址认知是一个相对复杂但重要的概念。以下是对二维数组中元素地址认知的详细叙述&#xff1a; 一、二维数组的基本构成 二维数组可以被看作是由多个一维数组组成的数组。例如&#xff0c;定义了一个3行4列的二维数组&#xff0c; int a…

实战分享:利用百数实现通讯录与表单无缝对接,提升管理效率

百数的通讯录实时同步到表单功能&#xff0c;实现了员工信息的即时更新与自动整合&#xff0c;不仅极大地提升了信息管理的效率与准确性&#xff0c;还为企业提供了便捷的数据分析基础&#xff0c;助力企业更高效地运营与决策。 设置方式 在企业管理中&#xff0c;开启通讯录…

深度学习入门——神经网络

前言 神经网络可以帮助自动化设定权重 具体地讲&#xff0c;神经网络的一个重要性质是它可以自动地从数据中学习到合适的权重参数 从感知机到神经网络 神经网络的例子 中间层aka隐藏层 复习感知机 偏置b 并没有被画出来。如果要明确地表示出b&#xff0c;可以像图3-3那样做…

redis基本类型和订阅

redis-cli -h <host> -p <port> -a <password> 其中&#xff0c;< host>是Redis服务器的主机名或IP地址&#xff0c;< port>是Redis服务器的端口号&#xff0c;< password>是Redis服务器的密码&#xff08;如果有的话&#xff09;。 set …

多模态大模型--音频文本

音频信息 声学 音频编解码技术的目标是&#xff0c;通过减少音频文件的大小来节省存储空间或减轻网络传输的负担。理想的情况下&#xff0c;即使音频被压缩&#xff0c;我们听到的声音与原版也应该没有任何区别。 Opus是一个多才多艺的音频编解码器&#xff0c;它适用于各种应…

Linux系统之快速部署小游戏合集网站(二)

Linux系统之快速部署小游戏合集网站(二) 一、项目介绍1.1 项目简介1.2 项目预览二、本次实践介绍2.1 本地环境规划2.2 本次实践介绍三、检查本地环境3.1 检查系统版本3.2 检查系统内核版本3.3 检查软件源四、安装Apache24.1 安装Apache2软件4.2 启动apache2服务4.3 查看apach…

FPGA-Verilog

这里写目录标题 累加累乘器 累加累乘器 timescale 1ns/10psmodule inout_test(); parameter ratio 2; reg [15:0]num ; reg [31:0]save_add_v; reg [31:0]save_multi_v;initialbeginsave_add_v 100;save_multi_v 100;forever beginsave_add_v save_add_v ratio;save_mul…

基于视觉工具箱和背景差法的行人检测,行走轨迹跟踪,人员行走习惯统计matlab仿真

目录 1.算法运行效果图预览 2.算法运行软件版本 3.部分核心程序 4.算法理论概述 5.算法完整程序工程 1.算法运行效果图预览 (完整程序运行后无水印) 在三维图中&#xff0c;幅度越大&#xff0c;则表示人员更习惯的行走路线。 2.算法运行软件版本 matlab2022a 3.部分核…

[笔记]Fluke3563 振动分析仪

参考文档&#xff1a;Fluke 3563 Analysis Vibration Sensor system | Fluke 1.四大机械故障损伤原因 2.振动特征 福禄克做的示意图很棒&#xff1a; 不平衡对应转动轴的一倍频&#xff0c;不对中是2倍频&#xff0c;然后3~6倍频会有未紧固故障&#xff0c;更高频的位置是齿轮…

新版网页无插件H.265播放器EasyPlayer.js如何测试demo视频?

H5无插件流媒体播放器EasyPlayer属于一款高效、精炼、稳定且免费的流媒体播放器&#xff0c;可支持多种流媒体协议播放&#xff0c;支持H.264与H.265编码格式&#xff0c;性能稳定、播放流畅&#xff1b;支持WebSocket-FLV、HTTP-FLV&#xff0c;HLS&#xff08;m3u8&#xff0…

解决 Vscode不支持c++11的语法

问题&#xff1a; 解决方案&#xff1a; 1、按 CtrlShiftP 调出命令面板&#xff0c;输入 C/C: Edit Configurations (UI) 并选择它。这将打开 C/C 配置界面 2、打开 c_cpp_properties.json 文件 3、编辑 c_cpp_properties.json 4、保存 c_cpp_properties.json 文件。 关闭并…

ollama + fastgpt 搭建免费本地知识库

目录 1、ollama ollama的一些操作命令: 使用的方式: 2、fastgpt 快速部署: 修改配置: config.json: docker-compose.yml: 运行fastgpt: 访问OneApi: 添加令牌和渠道: 登陆fastgpt,创建知识库和应用 3、总结: 附录: 1. 11434是ollama的端口: 2. m3e 测…

设计模式-概述*

1.代码的质量的评判 可维护性&#xff1a;不破坏原有代码设计以及不引入新的bug的前提下&#xff0c;能够快速修改或新增代码&#xff1b;可读性&#xff1a;人类能理解的代码&#xff08;编程规范-命名、函数是否冗长、类是否过大等&#xff09;&#xff1b;可扩展性&#xff…

【Java】:浅克隆和深克隆

克隆 克隆和赋值 克隆的结果是有多个相同的实体&#xff0c;各个对象指向不同的实体而多个不同对象指向一个相同的实体不是克隆&#xff0c;而是赋值 克隆的过程 首先实例化一个 student1 对象 在堆里开辟了一块内存用来存储 age 10 这个数据 调用 clone 方法 在堆中又开辟了一…

数字化转型“破局”:低代码开发平台如何缩短开发交付周期,提升效率

日新月异的数字时代&#xff0c;各行业正经历着前所未有的变革与转型。随着大数据、云计算、人工智能等技术的不断成熟与融合&#xff0c;数字化转型的步伐愈发坚定而迅速&#xff0c;成为企业转型升级、实现可持续发展的必由之路。然而&#xff0c;传统的软件开发模式受限于高…

Hadoop3:HDFS-存储优化之纠删码

一、集群环境 集群一共5个节点&#xff0c;102/103/104/105/106 二、纠删码原理 1、简介 HDFS默认情况下&#xff0c;一个文件有3个副本&#xff0c;这样提高了数据的可靠性&#xff0c;但也带来了2倍的冗余开销。Hadoop3.x引入了纠删码&#xff0c;采用计算的方式&#x…

【学习】美国虚拟信用卡申请流程

WildCard 官方网址&#xff1a;https://bewildcard.com/i/PEACEFUL &#xff08;使用邀请码“PEACEFUL”可以享受开卡88 折优惠&#xff0c;注册时提示填写邀请码就可以填写&#xff09;

Window中 Redis下载安装

Redis7.2.3连接&#xff1a; 我用夸克网盘分享了「redis-windows-7.2.3.zip」&#xff0c;点击链接即可保存。打开「夸克APP」&#xff0c;无需下载在线播放视频&#xff0c;畅享原画5倍速&#xff0c;支持电视投屏。 链接&#xff1a;https://pan.quark.cn/s/4dfb0497707a 在安…

驱动框架——CMSIS第一部分 RTE驱动框架介绍

一、介绍CMISIS 什么是CMSIS&#xff08;cortex microcontrol software interface standard一种软件标准接口&#xff09;&#xff0c;官网地址&#xff1a;https://arm-software.github.io/CMSIS_6/latest/General/index.html 包含的core、driver、RTOS、dsp、nn等部分&…