爬虫案例:股吧,使用Selenium
实用工具关注公众号爬虫探索者
获取。
发送对应关键词:
1.运行环境
pip install selenium==4.9.1
pip install pymysql
1.1.高版本Chrome问题
针对于高版本的Chrome浏览器
1.2.最终效果
2.目标网站
3.参数介绍
BASE_URL = 'https://guba.eastmoney.com/list,600789_{page}.html'
# page:当前页码
# 600789:股票代码
来源
4.获取的信息
title = item.find_element(by=By.CSS_SELECTOR, value='td .title a').text # 标题
title_href = item.find_element(by=By.CSS_SELECTOR, value='td .title a').get_attribute('href') # 对应标题的地址
author = item.find_element(by=By.CSS_SELECTOR, value='td .author a').text # 作者
author_url = item.find_element(by=By.CSS_SELECTOR, value='td .author a').get_attribute('href') # 作者主页地址
read_count = item.find_element(by=By.</