automa的工程还是要经常导出备份,因为经常出现突然模块消失的情况。
1 滑动分页条件区分
传统的页面都是有分页标签,这样你很容易知道,应该用分页来做。但是现在手机端的应用基本都是上滑就可以分页,再混合式开发的环境下,公司为了节省成本,大部分都可以实现一套代码,再不同形态环境做适配,而这样给我们做爬虫也造成了困难。
在控制台中执行,获取元素高度,通过判断,是可以的
但是使用automa中使用js条件模块却获取不到值,实际得不到,这是为何?
const elVal = document.getElementsByClassName('explorer-file-list-virtualized__container')[0];
return elVal.scrollHeight > elVal.clientHeight;
之所以出不来是因为,这个地方应该选择当前标签页
接下载我想着,干脆使用滚动元素,让页面中的数据全部加载进来,再循环,结果发现页面上明明有1000条数据,但使用document.querySelectorAll('.file-list-item').length
却只得到20条,这是为何?
如果让他在每次循环后,进行滚动。
看结果,奇怪的是中间跳号,数据丢失了!
推理,出现跳行,可能因为根据垂直滚动的高度有关.于是设置为20,则发现界面在一点点动,数据会被重复插入。那么你怎么知道怎样才是合理的高度,勾选上滚动查看
也是同样的问题,而且滚动的速度分页太慢。