jshkk 发表于 2018-1-24 11:51:58

有用神箭手的吗,问个正则问题?

我想采集1-45页的内容,
helperUrlRegexes: ["http://***\/page\/^(||)$"], //列表页

这样子写似乎不对,在测试时直接提示“测试运行结束,爬虫自动停止,测试完毕!”,只跑了个示例的page=1
是这个正则有问题还是xpath的语法不对啊?求指导
http://ww4.sinaimg.cn/large/0060lm7Tly1fnrjswviwsj30jn0kjgmu.jpg

jshkk 发表于 2018-1-24 12:08:37

来个大佬~~~:'(

Carseason 发表于 2018-1-24 12:17:50

本帖最后由 Carseason 于 2018-1-24 12:19 编辑

http:\/\/[^"]+\/page\/{0,1}$
这样子试一试

jshkk 发表于 2018-1-24 12:48:53

Carseason 发表于 2018-1-24 12:17
http:\/\/[^"]+\/page\/{0,1}$
这样子试一试

多谢!:handshake
按照你的方式测试了下,果然OK..
只要不带^的起始符就好了 :victory:
页: [1]
查看完整版本: 有用神箭手的吗,问个正则问题?