182. 查找重复的电子邮箱

题目描述

表: Person

+-------------+---------+
| Column Name | Type    |
+-------------+---------+
| id          | int     |
| email       | varchar |
+-------------+---------+
id 是该表的主键（具有唯一值的列）。
此表的每一行都包含一封电子邮件。电子邮件不包含大写字母。

编写解决方案来报告所有重复的电子邮件。请注意，可以保证电子邮件字段不为 NULL。

以 任意顺序 返回结果表。

结果格式如下例。

示例 1:

输入: 
Person 表:
+----+---------+
| id | email   |
+----+---------+
| 1  | a@b.com |
| 2  | c@d.com |
| 3  | a@b.com |
+----+---------+
输出: 
+---------+
| Email   |
+---------+
| a@b.com |
+---------+
解释: a@b.com 出现了两次。

解法

方法一：分组统计

我们可以使用 GROUP BY 语句，按照 email 字段进行分组，然后使用 HAVING 语句，筛选出现次数大于 $1$ 的 email。

Python3

import pandas as pd


def duplicate_emails(person: pd.DataFrame) -> pd.DataFrame:
    results = pd.DataFrame()

    results = person.loc[person.duplicated(subset=["email"]), ["email"]]

    return results.drop_duplicates()

MySQL

# Write your MySQL query statement below
SELECT email
FROM Person
GROUP BY 1
HAVING COUNT(1) > 1;

方法二：自连接

我们可以使用自连接的方法，将 Person 表自身连接一次，然后筛选出 id 不同，但 email 相同的记录。

MySQL

SELECT DISTINCT p1.email
FROM
    person AS p1,
    person AS p2
WHERE p1.id != p2.id AND p1.email = p2.email;

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

README.md

README.md

182. 查找重复的电子邮箱

题目描述

解法

方法一：分组统计

Python3

MySQL

方法二：自连接

MySQL

Files

README.md

Latest commit

History

README.md

File metadata and controls

182. 查找重复的电子邮箱

题目描述

解法

方法一：分组统计

Python3

MySQL

方法二：自连接

MySQL