查重是我們在工作中經常會遇到的一個需求,下面這篇文章主要給大家介紹了關于mysql查詢重復數據(刪除重復數據保留id最小的一條為唯一數據)的相關資料,文中通過示例代碼介紹的非常詳細,對大家的學習或者工作具有一定的參考學習價值。
推薦課程:mysql教程。
最近在做一個批量數據導入到MySQL數據庫的功能,從批量導入就可以知道,這樣的數據在插入數據庫之前是不會進行重復判斷的,因此只有在全部數據導入進去以后在執行一條語句進行刪除,保證數據唯一性。
下面話不多說了,來一起看看詳細的介紹吧
表結構如下圖所示:
表名:brand
操作?
使用SQL語句查詢重復的數據有哪些:
select?*?from?brand?WHERE?brandName?IN( select?brandName?from?brand?GROUP?BY?brandName?HAVING?count(brandName)>1?#條件是數量大于1的重復數據 )
使用SQL刪除多余的重復數據,并保留Id最小的一條唯一數據:
注意點:
錯誤SQL:delete FROM brand WHERE brandName IN (select brandName from brand GROUP BY brandName HAVING COUNT(brandName)>1) AND Id NOT IN (select MIN(Id) from brand GROUP BY brandName HAVING COUNT(brandName)>1)?
提示: You can’t specify target table ‘brand’ for update in FROM clause?? 不能為FROM子句中的更新指定目標表“brand”
原因是:不能將直接查處來的數據當做刪除數據的條件,我們應該先把查出來的數據新建一個臨時表,然后再把臨時表作為條件進行刪除功能
正確SQL寫法: ?DELETE?FROM?brand?WHERE?brandName?IN? ?(SELECT?brandName?FROM?(SELECT?brandName?FROM?brand?GROUP?BY?brandName?HAVING?COUNT(brandName)>1)?e) ?AND?Id?NOT?IN?(SELECT?Id?FROM?(SELECT?MIN(Id)?AS?Id?FROM?brand?GROUP?BY?brandName?HAVING?COUNT(brandName)>1)?t) #查詢顯示重復的數據都是顯示最前面的幾條,因此不需要查詢是否最小值
結果如下圖:
總結:
很多東西都是需要自己一步一步的去探究的,當然網上的建議也是非常寶貴的借鑒和資源,無論做什么開發我們都需要理解它的工作原理才能夠更好的掌握它。