全球主机交流论坛

 找回密码
 注册

QQ登录

只需一步,快速开始

CeraNetworks网络延迟测速工具IP归属甄别会员请立即修改密码
查看: 366|回复: 3

用CF反代怎么实现复制别人网站

[复制链接]
发表于 2024-11-25 10:32:57 | 显示全部楼层 |阅读模式
之前有看到doubibackup复制了逗比的网站内容,我想知道这个是怎么实现的,100块大洋求解,并教会我,有意向的私信
发表于 2024-11-25 11:56:50 | 显示全部楼层
使用 `wget` 下载指定网站的镜像,可以通过以下命令实现:

```bash
wget --mirror --convert-links --adjust-extension --page-requisites --no-parent <URL>
```

### 参数解释:
- `--mirror`:这是一个简化的选项,实际上是 `-r -N -l inf --no-remove-listing` 的组合,用于递归下载整个网站。
- `--convert-links`:下载完后,转换页面中的所有链接,使其可以在本地浏览。
- `--adjust-extension`:如果有合适的文件扩展名(如 `.html`),将其调整为适当的扩展名。
- `--page-requisites`:下载显示网页所需的所有文件,如图片、CSS 文件、JavaScript 等。
- `--no-parent`:防止 `wget` 下载到父级目录中的文件或文件夹,避免递归下载超出指定目录的内容。

### 示例:

```bash
wget --mirror --convert-links --adjust-extension --page-requisites --no-parent https://example.com
```

这个命令会把 `https://example.com` 网站的所有内容下载到本地,并且保持网站结构不变。下载后,你可以在本地离线浏览该网站。

### 注意事项:
- `wget` 下载的镜像大小可能很大,尤其是当网站内容很多时,确保你的硬盘空间足够。
- 确保网站的 `robots.txt` 文件允许爬取,如果你在使用时遇到访问限制,可能需要检查该网站的爬虫规则。

如果有特定需求或问题,随时可以问我!
发表于 2024-11-25 10:34:03 | 显示全部楼层
worker 反代  代码可以问问GPT
发表于 2024-11-25 11:33:16 | 显示全部楼层
他这个不是反代,是完全爬下来逗比的网页。然后静态网页可以随便存,CF、GitHubPage都可以
您需要登录后才可以回帖 登录 | 注册

本版积分规则

Archiver|手机版|小黑屋|全球主机交流论坛

GMT+8, 2025-1-17 03:05 , Processed in 0.064048 second(s), 10 queries , Gzip On, MemCache On.

Powered by Discuz! X3.4

© 2001-2023 Discuz! Team.

快速回复 返回顶部 返回列表