选择语句以查找某些字段的重复项

sql sql-server tsql sql-server-2008

你能帮我用 SQL 语句在多个字段上查找重复项吗？

例如，在伪代码中：

select count(field1,field2,field3) 
from table 
where the combination of field1, field2, field3 occurs multiple times

如果有多次出现，我想从上面的语句中选择除第一个记录之外的每条记录。

你的伪代码是模棱两可的，而且你没有定义你不想要第一个的顺序。我建议你提供一些样本数据。

Rajesh Chamarthi

要获取有多个记录的字段列表，您可以使用..

select field1,field2,field3, count(*)
  from table_name
  group by field1,field2,field3
  having count(*) > 1

检查此链接以获取有关如何删除行的更多信息。

http://support.microsoft.com/kb/139444

在使用上面链接中的方法之前，应该有一个标准来决定如何定义“第一行”。基于此，如果需要，您将需要使用 order by 子句和子查询。如果您可以发布一些示例数据，那将真的很有帮助。

Heinzi

你提到“第一个”，所以我假设你对你的数据有某种排序。假设您的数据按某个字段 ID 排序。

此 SQL 应该为您提供除第一个之外的重复条目。它基本上选择具有（a）相同字段和（b）较低ID的另一行的所有行。性能不会很好，但它可能会解决您的问题。

SELECT A.ID, A.field1, A.field2, A.field3
  FROM myTable A
 WHERE EXISTS (SELECT B.ID
                 FROM myTable B
                WHERE B.field1 = A.field1
                  AND B.field2 = A.field2
                  AND B.field3 = A.field3
                  AND B.ID < A.ID)

Nick Vaccaro

这是我喜欢的 SQL Server 2005 的一个有趣的解决方案。我将假设“对于除第一个记录之外的每条记录”，您的意思是还有另一个“id”列，我们可以使用它来识别哪一行是“第一行”。

SELECT id
    , field1
    , field2
    , field3
FROM
(
    SELECT id
        , field1
        , field2
        , field3
        , RANK() OVER (PARTITION BY field1, field2, field3 ORDER BY id ASC) AS [rank]
    FROM table_name
) a
WHERE [rank] > 1

刚刚注意到 SQL Server 2008 标记。很高兴我的建议仍然有效。

出色的解决方案，因为它还返回需要从相关表中删除的行

将 PARTITION BY 字段列表视为 PK 字段列表会有所帮助

CarenRose

要查看重复值：

with MYCTE  as (
    select row_number() over ( partition by name  order by name) rown, *
    from tmptest  
    ) 
select * from MYCTE where rown <=1

Bradford Hoagland

如果您使用的是 SQL Server 2005 或更高版本（并且您的问题的标签指示 SQL Server 2008），如果由于某种原因使用连接不太理想或不切实际，您可以使用排名函数在第一个记录之后返回重复记录。以下示例显示了这一点，它也适用于检查列中的空值。

create table Table1 (
 Field1 int,
 Field2 int,
 Field3 int,
 Field4 int 
)

insert  Table1 
values    (1,1,1,1)
        , (1,1,1,2)
        , (1,1,1,3)
        , (2,2,2,1)
        , (3,3,3,1)
        , (3,3,3,2)
        , (null, null, 2, 1)
        , (null, null, 2, 3)

select    *
from     (select      Field1
                    , Field2
                    , Field3
                    , Field4
                    , row_number() over (partition by   Field1
                                                      , Field2
                                                      , Field3
                                         order by       Field4) as occurrence
          from      Table1) x
where     occurrence > 1

请注意，运行此示例后，每个“组”中的第一条记录都被排除在外，并且具有空值的记录得到了正确处理。

如果您没有可用于对组内的记录进行排序的列，则可以使用 partition-by 列作为 order-by 列。

slavoo

CREATE TABLE #tmp
(
    sizeId Varchar(MAX)
)

INSERT  #tmp 
    VALUES ('44'),
        ('44,45,46'),
        ('44,45,46'),
        ('44,45,46'),
        ('44,45,46'),
        ('44,45,46'),
        ('44,45,46')


SELECT * FROM #tmp
DECLARE @SqlStr VARCHAR(MAX)

SELECT @SqlStr = STUFF((SELECT ',' + sizeId
              FROM #tmp
              ORDER BY sizeId
              FOR XML PATH('')), 1, 1, '') 


SELECT TOP 1 * FROM (
select items, count(*)AS Occurrence
  FROM dbo.Split(@SqlStr,',')
  group by items
  having count(*) > 1
  )K
  ORDER BY K.Occurrence DESC

daryosh setorg

尝试此查询以单独计算每个 SELECT 语句：

select field1,count(field1) as field1Count,field2,count(field2) as field2Counts,field3, count(field3) as field3Counts
from table_name
group by field1,field2,field3
having count(*) > 1

Nida Akram

尝试此查询以查找多个字段上的重复记录

SELECT a.column1, a.column2
FROM dbo.a a
JOIN (SELECT column1, 
       column2, count(*) as countC
FROM dbo.a 
GROUP BY column4, column5
HAVING count(*) > 1 ) b
ON a.column1 = b.column1
AND a.column2 = b.column2

Simi Lika

您还可以尝试使用此查询来计算 distinct() 列和 order by 与您所需的列：

select field1, field2, field3, count(distinct (field2))
from table_name
group by field1, field2, field3
having count(field2) > 1
order by field2;

选择语句以查找某些字段的重复项

关注公众号

想领先一步获取最新的外包任务吗？

相似问题

平台

支持

联系我们