有用神箭手的吗,问个正则问题?
我想采集1-45页的内容,helperUrlRegexes: ["http://***\/page\/^(||)$"], //列表页
这样子写似乎不对,在测试时直接提示“测试运行结束,爬虫自动停止,测试完毕!”,只跑了个示例的page=1
是这个正则有问题还是xpath的语法不对啊?求指导
http://ww4.sinaimg.cn/large/0060lm7Tly1fnrjswviwsj30jn0kjgmu.jpg 来个大佬~~~:'( 本帖最后由 Carseason 于 2018-1-24 12:19 编辑
http:\/\/[^"]+\/page\/{0,1}$
这样子试一试 Carseason 发表于 2018-1-24 12:17
http:\/\/[^"]+\/page\/{0,1}$
这样子试一试
多谢!:handshake
按照你的方式测试了下,果然OK..
只要不带^的起始符就好了 :victory:
页:
[1]