爬虫学习笔记-scrapy安装及第一个项目创建问题及解决措施

article2024/12/23 18:53:55/文章来源:https://blog.csdn.net/2301_77321248/article/details/135946685

1.安装scrapy

pycharm终端运行 pip install scrapy -i https://pypi.douban.com/simple

2.终端运行scrapy startproject scrapy_baidu,创建项目

问题1:lxml版本低导致无法找到

解决措施:更新或者重新安装lxml

3.项目创建成功

4.终端cd到项目的spiders文件夹下,cd scrapy_baidu\scrapy_baidu\spiders

创建爬虫文件名百度,域名scrapy genspider baidu www.baidu.com

5.爬虫文件创建成功打开,修改def parse,打印输出

6.运行爬虫文件,scrapy crawl baidu

问题2:attrs版本低

解决措施:重新安装

7.再次运行爬虫文件,scrapy crawl baidu

问题3:无法加载sqllite3

解决措施:下载sqllite dll文件,解压到python解释器对应DLLs文件夹下

https://www.sqlite.org/download.html

8.禁用robot协议

9.再次执行后成功运行打印输出

10.注意:退出项目后,再次启动,需要cd到spiders目录下执行scrapy crawl baidu再启动项目

本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如若转载，请注明出处：/a/367993.html

如若内容造成侵权/违法违规/事实不符，请联系我们进行投诉反馈qq邮箱809451989@qq.com，一经查实，立即删除！

JS 引导动画

前言引导动画是程序在某一时刻播放的动画，通常用于向用户介绍程序的功能和特点。实现效果实现方式引导动画的实现方式有很多种，这里我使用的是 CSS 的 clip-path 属性。技术选型这里我为什么要选择 clip-path 属性而不是 mask 属性呢&#xf…

SpringbootWeb案例

准备工作需求说明部门管理部门管理功能开发包括：查询部门列表、删除部门、新增部门、修改部门员工管理功能开发包括：查询员工列表(分页、条件)、删除员工、新增员工、修改员工环境搭建环境搭建步骤：1. 准备数据库表(dept、emp)…

ubuntu 安装 kvmQemu no active connection to install on

更新 apt sudo apt update检查虚拟化是否开启 0 不开，其余数字表示开启，开不开都可以，不开性能弱，只能跑 x86 系统 egrep -c (vmx|svm) /proc/cpuinfo安装 sudo apt install -y qemu-kvm virt-manager libvirt-daemon-system virt…

2.3作业

写一个shell脚本判断用户输入的是否是数字

我要成为嵌入式高手之2月3日Linux高编第一天！！

学习框架一、IO编程多任务编程（进程、线程） 网络编程数据库编程二、数据结构学习笔记 Linux软件编程： 一. Linux 1、Linux: 操作系统的内核，真正的操作系统叫Ubuntu、Redhat、CentOS..... 内核（纯c实现的代码…

pdmodel从动态模型转成静态onnx

1.下载项目 git clone https://github.com/jiangjiajun/PaddleUtils.git 2.新建两个新的文件夹第一个文件夹放两个必要文件第二个文件夹可以设置为空，用来存放转换后的模型如图： 3.在终端运行 python paddle/paddle_infer_shape.py --model_dir …

DevOps落地笔记-10|环境管理：交付测试环境的迅猛方法

上一讲我主要介绍在开发过程中如何处理应用程序在不同环境的配置问题，通过有效管理应用程序的配置，最终实现一包到底。不同的环境不仅会带来应用程序本身的配置管理问题，环境本身的创建、管理、一致性等问题也需要解决。环境管理的问题也是我…

在jetbrains IDEA/Pycharm/Android Studio中安装官方rust插件，开始rust编程

在idea插件市场搜索rust：JetBrains Marketplace ，就可以找到rust插件： jetbrains官方rust插件地址：[Deprecated] Rust - IntelliJ IDEs Plugin | Marketplace 直接在idea中搜索rust好像是搜不到的： 需要在这个插件市场…

Nginx简单阐述及安装配置

目录一.什么是Nginx 二.Nginx优缺点 1.优点 2.缺点三.正向代理与反向代理 1.正向代理 2.反向代理四.安装配置 1.添加Nginx官方yum源 2.使用yum安装Nginx 3.配置防火墙 4.启动后效果一.什么是Nginx Nginx（“engine x”）是一个高性能的HTTP…

Python3 交叉编译 numpy pandas scipy scikit-learn

1. 概述由于需要将Python3.7 和一些软件包交叉编译到 armv7 平台硬件，如果是arm64位的系统，很多包都有预编译好的版本，可直接下载。本文主要在基于 crossenv(https://github.com/benfogle/crossenv)环境下交叉编译。 2. 编译环境搭建创建…

$自编C++题目——水龙头$