MySQL 删除重复的数据并只保留一条的三种方法

方法一：创建临时表

这种方法假设你有一个表 your_table，并且你要基于某些列来判断哪些数据是重复的。例如，如果你想删除基于 column1 和 column2 的重复记录，只保留一条记录，你可以按照以下步骤操作：

使用 CREATE TABLE 语句创建一个临时表，用于存储唯一的记录。
使用 INSERT INTO ... SELECT 语句将唯一的记录插入到临时表中。
删除原始表中的所有记录。
使用 INSERT INTO ... SELECT 语句将临时表中的记录插入回原始表。
删除临时表。

以下是一个完整的 SQL 例子：

-- Step 1: Create a temporary table
CREATE TABLE temp_table AS
SELECT * FROM your_table
WHERE 1=0;  -- Create an empty table with the same structure as your_table

-- Step 2: Insert unique records into the temporary table
INSERT INTO temp_table
SELECT * FROM your_table t1
WHERE t1.id = (
    SELECT MIN(t2.id)
    FROM your_table t2
    WHERE t1.column1 = t2.column1
    AND t1.column2 = t2.column2
);

-- Step 3: Delete all records from the original table
DELETE FROM your_table;

-- Step 4: Insert the records back from the temporary table to the original table
INSERT INTO your_table
SELECT * FROM temp_table;

-- Step 5: Drop the temporary table
DROP TABLE temp_table;

解释：

创建临时表：CREATE TABLE temp_table AS SELECT * FROM your_table WHERE 1=0; 这行代码创建了一个空的临时表，其结构与 your_table 相同。
插入唯一记录：INSERT INTO temp_table SELECT * FROM your_table t1 WHERE t1.id = (SELECT MIN(t2.id) FROM your_table t2 WHERE t1.column1 = t2.column1 AND t1.column2 = t2.column2); 这行代码将唯一记录插入到临时表中，基于 column1 和 column2 进行去重，只保留 id 最小的记录。
删除原始表中的所有记录：DELETE FROM your_table; 删除原始表中的所有记录。
将临时表中的记录插入回原始表：INSERT INTO your_table SELECT * FROM temp_table; 将临时表中的记录插入回原始表。
删除临时表：DROP TABLE temp_table; 删除临时表。

这样，你就成功地删除了原始表中的重复记录，只保留了一条唯一记录。

方法二：自连查询

上面的这个方案不太行，会改变原来的数据id

为了避免改变原来的数据 ID，我们可以使用一个不同的方法，通过使用自连接来标记重复的数据并删除多余的记录。这种方法在保留原始 ID 的情况下删除重复记录。

假设你的表结构如下：

表名：your_table
列名：id (主键), column1, column2, 以及其他列。

你可以使用以下 SQL 语句来删除重复记录，只保留一条（通常是保留 ID 最小的那一条）：

-- Step 1: 标记要删除的重复记录
DELETE t1
FROM your_table t1
INNER JOIN your_table t2 
WHERE 
    t1.id > t2.id
    AND t1.column1 = t2.column1
    AND t1.column2 = t2.column2;

-- Step 2: 确认删除成功，查看剩余数据
SELECT * FROM your_table;

解释：

标记要删除的重复记录：我们使用自连接 INNER JOIN 来找到重复的记录，并且使用 WHERE t1.id > t2.id 来确保只删除 id 较大的记录，从而保留 id 最小的记录。
确认删除成功：通过 SELECT 语句查看剩余的数据，确保删除操作正确。

这个方法的优点是：

不会改变原始数据的 ID。
保留每组重复记录中 ID 最小的一条记录。
操作简单且高效。

方法三：使用子查询

当然，还有其他方案可以在不改变原始数据 ID 的情况下删除重复记录。

使用子查询来保留每组重复记录中 ID 最小的一条记录，并删除其余的重复记录。

DELETE FROM your_table
WHERE id NOT IN (
    SELECT MIN(id)
    FROM your_table
    GROUP BY column1, column2
);

解释：

子查询：SELECT MIN(id) FROM your_table GROUP BY column1, column2 获取每组重复记录中 ID 最小的记录。
删除记录：DELETE FROM your_table WHERE id NOT IN (...) 删除那些不在子查询结果中的记录，即删除重复记录中 ID 不是最小的记录。

总结

创建临时表适合需要重建数据表的场景，适合数据量中等的情况。
自连查询能保留最小 ID，适合不想改变 ID 的情况下删除重复数据。
使用子查询是一种简单高效的方法，适合数据量适中且保留最小 ID 的需求。
根据实际项目的需求选择合适的方法，确保在删除数据时不会破坏现有的逻辑和关联。

MySQL 删除重复的数据并只保留一条的三种方法

方法一：创建临时表

方法二：自连查询

方法三：使用子查询

总结

MySQL 错误：#1031 – Table storage engine for ‘xxx’ doesn’t have this option 的解决办法

批量修改mysql数据表为innodb引擎的方法

MySQL 虚拟列详解

MySQL 数据恢复：使用 ibd2sql 工具从 IBD 文件中恢复数据完整教程

MySQL的五个重要调优配置

MySQL 导入 SQL 时报错：1067 – Invalid default value for ‘datetime ’

uniapp 开发微信小程序，特殊HTML字符（如 <）自动转义成HTML实体& gt;的解决办法。

PHP 循环中的 break 和 continue 关键词的作用和区别

Livewire 3 上传图片预览功能，本地正常，发布到服务器预览提示图片无法显示，查看链接/livewire/preview-file/…提示401 Unauthorized和404 Not Found

Video.js 引入及配置正确但不显示播放器而是显示文字是怎么回事？

Windows 11 系统右键菜单默认直接显示全部选项的方法

PHP(Laravel) 实现 sm2、sm3、sm4 加密，对接招行薪福通教程

宝塔面板网站图片存在、路径正确但是通过 URL 访问 404 问题的解决方法

scp 命令在终端会话断开后中断的解决办法：scp 命令设置后台运行传输文件方法

方法一：创建临时表

方法二：自连查询

方法三：使用子查询

总结

相关推荐