全球主机交流论坛

 找回密码
 注册

QQ登录

只需一步,快速开始

CeraNetworks网络延迟测速工具IP归属甄别会员请立即修改密码
查看: 1795|回复: 7

如何在mysql删除相同文章

[复制链接]
发表于 2011-4-13 15:15:06 | 显示全部楼层 |阅读模式
大家在采集过程中都会遇到过带有重复文章,请问有什么sql语句可以批量删除相同文章呢?
发表于 2011-4-13 16:02:40 | 显示全部楼层
为神马不做入库前冗余检测
 楼主| 发表于 2011-4-13 16:05:45 | 显示全部楼层
原帖由 stick 于 2011-4-13 16:02 发表
为神马不做入库前冗余检测


不懂,我这个程序自动更新内容的,没有检测的
发表于 2011-4-13 16:31:28 | 显示全部楼层
提示: 作者被禁止或删除 内容自动屏蔽
 楼主| 发表于 2011-4-13 16:47:06 | 显示全部楼层
原帖由 糕手 于 2011-4-13 16:31 发表
查询相应表单,然后根据文章标题(这个重复文章看你定义是什么,一般定义是标题),查询,相同的 删除


我首先查询满足两个字段title和content,就被视为重复文章.

select * from piao_post a
where (a.title,a.content) in (select title,content from piao_post group by

title,content having count(*) > 1)


然后只保留pid最小值,但报错,语句我看了很多遍都没错啊.但就是报错.

delete from piao_post a
where (a.title,a.content) in (select title,content from piao_post group by

title,content having count(*) > 1)
and pid not in (select min(pid) from piao_post group by title,content having

count(*)>1)

[ 本帖最后由 11qq 于 2011-4-13 16:51 编辑 ]
发表于 2011-4-13 22:11:09 | 显示全部楼层
为什么不在插入数据库之前做检测呢,如果重复就不插入数据库
发表于 2011-4-14 00:47:49 | 显示全部楼层
如果采集的话,直接搞title就行了
你的表结构是如何?
发表于 2011-4-14 01:34:04 | 显示全部楼层
你的表是什么结构的
您需要登录后才可以回帖 登录 | 注册

本版积分规则

Archiver|手机版|小黑屋|全球主机交流论坛

GMT+8, 2025-5-11 21:07 , Processed in 0.058962 second(s), 8 queries , Gzip On, MemCache On.

Powered by Discuz! X3.4

© 2001-2023 Discuz! Team.

快速回复 返回顶部 返回列表