全球主机交流论坛

 找回密码
 注册

QQ登录

只需一步,快速开始

CeraNetworks网络延迟测速工具IP归属甄别会员请立即修改密码
查看: 4187|回复: 10

Python正文提取算法

[复制链接]
发表于 2011-4-6 22:58:52 | 显示全部楼层 |阅读模式
提示: 作者被禁止或删除 内容自动屏蔽
 楼主| 发表于 2011-4-6 23:03:04 | 显示全部楼层
提示: 作者被禁止或删除 内容自动屏蔽
 楼主| 发表于 2011-4-6 23:03:30 | 显示全部楼层
提示: 作者被禁止或删除 内容自动屏蔽
发表于 2011-4-6 23:18:07 | 显示全部楼层
太阳 就一个
发表于 2011-4-6 23:24:43 | 显示全部楼层
niu
发表于 2011-4-6 23:36:28 | 显示全部楼层
提示: 作者被禁止或删除 内容自动屏蔽
发表于 2011-4-6 23:44:33 | 显示全部楼层
好牛逼
发表于 2011-4-7 01:03:12 | 显示全部楼层
原帖由 xspoco 于 2011-4-6 23:44 发表
好牛逼
发表于 2011-4-8 01:17:52 | 显示全部楼层
这语言真累,,,,
发表于 2011-4-8 01:30:53 | 显示全部楼层
  1.         for div in divs:
  2.                 div_html = div.__str__()
  3.                 chinese_utf8 = re_chinese.findall(div_html)
  4.                 chinese_number = len(chinese_utf8) / 3
  5.                 if chinese_number < 100:
  6.                         divs.remove(div)
复制代码
这段要改下,迭代里删东西会出问题的

评分

参与人数 1威望 +20 收起 理由
我是人 + 20 嗯嗯,绝对会出问题。。。

查看全部评分

您需要登录后才可以回帖 登录 | 注册

本版积分规则

Archiver|手机版|小黑屋|全球主机交流论坛

GMT+8, 2025-5-10 04:07 , Processed in 0.065167 second(s), 13 queries , Gzip On, MemCache On.

Powered by Discuz! X3.4

© 2001-2023 Discuz! Team.

快速回复 返回顶部 返回列表