竹笋

注册

 

发新话题 回复该主题

如何实现MySQL删除重复记录并且只保留 [复制链接]

1#

最近在做题库系统,由于在题库中添加了重复的试题,所以需要查询出重复的试题,并且删除掉重复的试题只保留其中1条,以保证考试的时候抽不到重复的题。

首先写了一个小的例子:

Java面试一战到底(基础卷)京东好评率96%无理由退换京东配送官方店旗舰店¥.9购买

一、单个字段的操作

这是数据库中的表:

分组介绍:

Select重复字段From表GroupBy重复字段HavingCount(*)1

查看是否有重复的数据:

GROUPBY列名序列HAVING组条件表达式查询出:根据dname分组,同时满足having字句中组条件表达式(重复次数大于1)的那些组

count(*)与count(1)其实没有什么差别,用哪个都可以

count(*)与count(列名)的区别:

count(*)将返回表格中所有存在的行的总数包括值为null的行,然而count(列名)将返回表格中除去null以外的所有行的总数(有默认值的列也会被计入)

1.查询全部重复的数据:

Select*From表Where重复字段In(Select重复字段From表GroupBy重复字段HavingCount(*)1)

2.删除全部重复试题:

将上面的查询select改为delete(这样会出错的)

DELETEFROMdeptWHEREdnameIN(SELECTdnameFROMdeptGROUPBYdnameHAVINGcount(1)1)

会出现如下错误:

[Err]-YoucantspecifytargettabledeptforupdateinFROMclause

原因是:更新这个表的同时又查询了这个表,查询这个表的同时又去更新了这个表,可以理解为死锁。mysql不支持这种更新查询同一张表的操作

解决办法:把要更新的几列数据查询出来做为一个第三方表,然后筛选更新。

3.查询表中多余重复试题(根据depno来判断,除了rowid最小的一个)

a.第一种方法:

SELECT*FROMdeptWHEREdnameIN(SELECTdnameFROMdeptGROUPBYdnameHAVINGCOUNT(1)1)ANDdeptnoNOTIN(SELECTMIN(deptno)FROMdeptGROUPBYdnameHAVINGCOUNT(1)1)

上面这种写法正确,但是查询的速度太慢,可以试一下下面这种方法:

b.第二种方法:

☆根据dname分组,查找出deptno最小的。然后再查找deptno不包含刚才查出来的。这样就查询出了所有的重复数据(除了deptno最小的那行)。搜索Java知音

分享 转发
TOP
发新话题 回复该主题