全球主机交流论坛

 找回密码
 注册

QQ登录

只需一步,快速开始

CeraNetworks网络延迟测速工具IP归属甄别会员请立即修改密码
查看: 2840|回复: 14

正文提取算法

[复制链接]
发表于 2011-1-3 17:32:07 | 显示全部楼层 |阅读模式
基本是给垃圾站加上了核动力


比如下面这个,没有针对163写任何规则,自动提取网页正文,



[ 本帖最后由 God 于 2011-1-3 17:35 编辑 ]
发表于 2011-1-3 17:32:41 | 显示全部楼层
什么东东?看似很牛X啊 、
发表于 2011-1-3 17:33:28 | 显示全部楼层
提示: 作者被禁止或删除 内容自动屏蔽
发表于 2011-1-3 17:33:28 | 显示全部楼层
什么?
发表于 2011-1-3 17:34:45 | 显示全部楼层
没看懂啊?什么意思嘛
发表于 2011-1-3 17:48:45 | 显示全部楼层
原理很简单的,呵呵,没啥特别的
发表于 2011-1-3 17:53:11 | 显示全部楼层
正则。。。
发表于 2011-1-3 18:32:01 | 显示全部楼层
不用正则,我这里有几份算法
发表于 2011-1-3 18:36:53 | 显示全部楼层
提示: 作者被禁止或删除 内容自动屏蔽
发表于 2011-1-3 18:42:40 | 显示全部楼层
没看懂
您需要登录后才可以回帖 登录 | 注册

本版积分规则

Archiver|手机版|小黑屋|全球主机交流论坛

GMT+8, 2025-5-7 03:23 , Processed in 0.060510 second(s), 10 queries , Gzip On, MemCache On.

Powered by Discuz! X3.4

© 2001-2023 Discuz! Team.

快速回复 返回顶部 返回列表