爬虫
spider也只有一个函数,用来初始化colly对象
// 初始化colly对象
init:(head)=>SpiderStruct
1
2
2
然后初始化后提供了下面这两个接口
const SpiderStruct= {
// 解析html数据
OnHTML(goquerySelector,htmlCallback=htmlCallback){},
// 返回网站
Visit(url){}
}
1
2
3
4
5
6
2
3
4
5
6
然后回调函数里面的element有下面这几个操作方法
// 循环遍历
ForEach(goquerySelector,foreachCallback){},
// 获取子元素
ChildText(goquerySelector){},
// 获取子元素属性
ChildAttr(goquerySelector,attrName){},
Request: {
Visit(url) {}
}
1
2
3
4
5
6
7
8
9
2
3
4
5
6
7
8
9
编辑 (opens new window)
上次更新: 2021/08/01, 17:13:03