关于javhd脚本的一些问题-Web技术-全球主机交流论坛

eqblog 发表于 2018-3-14 22:16:47

流量之神发表于 2018-3-14 22:03
请问这个脚本可以断点采集吗？第二次接着第一次的采集继续爬

不能但是可以手动设置页数

openos 发表于 2018-3-16 11:47:19

eqblog 发表于 2018-3-14 22:16
不能但是可以手动设置页数

怎么样手动设置呢? 因为封了几个ip, 不想重复下载了
:lol

ehane 发表于 2018-3-16 14:37:23

openos 发表于 2018-3-16 11:47
怎么样手动设置呢? 因为封了几个ip, 不想重复下载了

flag 就是开始爬的页数。你查一下看你爬到哪个文件，搜一下在第几页，把记得flag设置在下一页，不然肯定ban

zhp521163 发表于 2018-3-16 14:45:29

我在本地爬了1380个视频，不知道全部视频有多少

zhp521163 发表于 2018-3-16 15:17:35

开了一个月会员，可惜这脚本还是有问题，哎

ogrish 发表于 2018-3-16 15:35:12

openos 发表于 2018-3-16 15:37:19

zhp521163 发表于 2018-3-16 15:17
开了一个月会员，可惜这脚本还是有问题，哎

牛B啊，一个月会员$40?

itsme 发表于 2018-3-16 16:21:02

ehane 发表于 2018-3-16 14:37
flag 就是开始爬的页数。你查一下看你爬到哪个文件，搜一下在第几页，把记得flag设置在下一页，不然肯定b ...

如果要从60页开始，是改flag =60吗，改了后脚本一直没输出。改回原来=1，就可以正常输出信息
def run():
s=spider(quality)
reqget=s.req()
flag=60
while True:
   time.sleep(5)
   page=s.page(flag)
   info=s.find_info(page)
   for i in info:
         mp4_dict=s.find_mp4(i,reqget)
         tittle=i.strip()
         print(tittle)
         if os.path.exists(str(tittle)+'.mp4')==False:
            print(s.sources_mp4(mp4_dict,reqget))
            download(s.sources_mp4(mp4_dict,reqget),tittle)
         else:
            #continue
            time.sleep(time_sleep)
   flag+=1
   time.sleep(5)

itsme 发表于 2018-3-16 16:32:23

eqblog 发表于 2018-3-14 22:16
不能但是可以手动设置页数

如果要从61页开始抓取，只要改下面这个flag的值吗改了脚本似乎卡住没任何动静了

def run():
s=spider(quality)
reqget=s.req()
flag=61

itsme 发表于 2018-3-16 16:51:58

本帖最后由 itsme 于 2018-3-18 05:26 编辑

本帖没内涵

页: 1 2 [3] 4

全球主机交流论坛's Archiver