最近在做题库系统,由于在题库中添加了重复的试题,所以需要查询出重复的试题,并且删除掉重复的试题只保留其中1条,以保证考试的时候抽不到重复的题。
首先写了一个小的例子:
Java面试一战到底(基础卷)京东好评率96%无理由退换京东配送官方店旗舰店¥.9购买
一、单个字段的操作
这是数据库中的表:
分组介绍:
Select重复字段From表GroupBy重复字段HavingCount(*)1
查看是否有重复的数据:
GROUPBY列名序列HAVING组条件表达式查询出:根据dname分组,同时满足having字句中组条件表达式(重复次数大于1)的那些组
count(*)与count(1)其实没有什么差别,用哪个都可以
count(*)与count(列名)的区别:
count(*)将返回表格中所有存在的行的总数包括值为null的行,然而count(列名)将返回表格中除去null以外的所有行的总数(有默认值的列也会被计入)
1.查询全部重复的数据:
Select*From表Where重复字段In(Select重复字段From表GroupBy重复字段HavingCount(*)1)
2.删除全部重复试题:
将上面的查询select改为delete(这样会出错的)
DELETEFROMdeptWHEREdnameIN(SELECTdnameFROMdeptGROUPBYdnameHAVINGcount(1)1)
会出现如下错误:
[Err]-YoucantspecifytargettabledeptforupdateinFROMclause
原因是:更新这个表的同时又查询了这个表,查询这个表的同时又去更新了这个表,可以理解为死锁。mysql不支持这种更新查询同一张表的操作
解决办法:把要更新的几列数据查询出来做为一个第三方表,然后筛选更新。
3.查询表中多余重复试题(根据depno来判断,除了rowid最小的一个)
a.第一种方法:
SELECT*FROMdeptWHEREdnameIN(SELECTdnameFROMdeptGROUPBYdnameHAVINGCOUNT(1)1)ANDdeptnoNOTIN(SELECTMIN(deptno)FROMdeptGROUPBYdnameHAVINGCOUNT(1)1)
上面这种写法正确,但是查询的速度太慢,可以试一下下面这种方法:
b.第二种方法:
☆根据dname分组,查找出deptno最小的。然后再查找deptno不包含刚才查出来的。这样就查询出了所有的重复数据(除了deptno最小的那行)。搜索Java知音