一、手工识别
1.robots.txt文件
robots.txt文件我们写过爬虫的就知道,这个文件是告诉我们哪些目录是禁止爬取的。但是大部分的时候我们都能通过robots.txt文件来判断出cms的类型
如:
从wp路径可以看出这个是WordPress的cms
这个就比较明显了直接告诉我们是PageAdmin cms
也有些robots.txt里面写得不是很清楚。我们看看织梦的
一、手工识别
1.robots.txt文件
robots.txt文件我们写过爬虫的就知道,这个文件是告诉我们哪些目录是禁止爬取的。但是大部分的时候我们都能通过robots.txt文件来判断出cms的类型
如:
从wp路径可以看出这个是WordPress的cms
这个就比较明显了直接告诉我们是PageAdmin cms
也有些robots.txt里面写得不是很清楚。我们看看织梦的
本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:/a/184567.html
如若内容造成侵权/违法违规/事实不符,请联系我们进行投诉反馈qq邮箱809451989@qq.com,一经查实,立即删除!