eqblog 发表于 2018-3-14 22:16:47

流量之神 发表于 2018-3-14 22:03
请问这个脚本可以断点采集吗?第二次接着第一次的采集继续爬

不能 但是可以手动设置页数

openos 发表于 2018-3-16 11:47:19

eqblog 发表于 2018-3-14 22:16
不能 但是可以手动设置页数

怎么样手动设置呢? 因为封了几个ip, 不想重复下载了
:lol

ehane 发表于 2018-3-16 14:37:23

openos 发表于 2018-3-16 11:47
怎么样手动设置呢? 因为封了几个ip, 不想重复下载了

flag 就是开始爬的页数。你查一下看你爬到哪个文件,搜一下在第几页,把记得flag设置在下一页,不然肯定ban

zhp521163 发表于 2018-3-16 14:45:29

我在本地爬了1380个视频,不知道全部视频有多少

zhp521163 发表于 2018-3-16 15:17:35

开了一个月会员,可惜这脚本还是有问题,哎

ogrish 发表于 2018-3-16 15:35:12

openos 发表于 2018-3-16 15:37:19

zhp521163 发表于 2018-3-16 15:17
开了一个月会员,可惜这脚本还是有问题,哎

牛B啊,一个月会员$40?

itsme 发表于 2018-3-16 16:21:02

ehane 发表于 2018-3-16 14:37
flag 就是开始爬的页数。你查一下看你爬到哪个文件,搜一下在第几页,把记得flag设置在下一页,不然肯定b ...

如果要从60页开始,是改flag =60吗,改了后脚本一直没输出。改回原来=1,就可以正常输出信息
def run():
    s=spider(quality)
    reqget=s.req()
    flag=60
    while True:
      time.sleep(5)
      page=s.page(flag)
      info=s.find_info(page)
      for i in info:
            mp4_dict=s.find_mp4(i,reqget)
            tittle=i.strip()
            print(tittle)
            if os.path.exists(str(tittle)+'.mp4')==False:
                print(s.sources_mp4(mp4_dict,reqget))
                download(s.sources_mp4(mp4_dict,reqget),tittle)
            else:
                #continue
                time.sleep(time_sleep)
      flag+=1
      time.sleep(5)

itsme 发表于 2018-3-16 16:32:23

eqblog 发表于 2018-3-14 22:16
不能 但是可以手动设置页数

如果要从61页开始抓取,只要改下面这个flag的值吗 改了脚本似乎卡住没任何动静了

def run():
    s=spider(quality)
    reqget=s.req()
    flag=61

itsme 发表于 2018-3-16 16:51:58

本帖最后由 itsme 于 2018-3-18 05:26 编辑

本帖没内涵
页: 1 2 [3] 4
查看完整版本: 关于javhd脚本的一些问题