ChatGPT解决这个技术问题 Extra ChatGPT

MySQL 查询 GROUP BY 日/月/年

是否可以进行一个简单的查询来计算我在确定的时间段(如年、月或日)中有多少条记录,具有 TIMESTAMP 字段,例如:

SELECT COUNT(id)
FROM stats
WHERE record_date.YEAR = 2009
GROUP BY record_date.YEAR

甚至:

SELECT COUNT(id)
FROM stats
GROUP BY record_date.YEAR, record_date.MONTH

要有月度统计。

谢谢!

我猜它应该是您的第一个代码段中的 GROUP BY record_date.MONTH

c
codelogic
GROUP BY YEAR(record_date), MONTH(record_date)

查看 MySQL 中的 date and time functions


在某些情况下,例如记录跨越数年的情况,您可能需要添加额外的列以增加清晰度。 SELECT COUNT(event_id), DATE_FORMAT(event_start, '%Y/%m')
简单完整示例:SELECT count(*), record_date FROM anytable WHERE anytable.anycolumn = 'anycondition' GROUP BY YEAR(record_date), month(record_date); 注意:record_date 是日期类型 TIMESTAMP
可能值得一提的是,这并没有在我的 MySQL 5.7 上使用 COUNT 别名列运行(没有错误,我得到零结果)。当我更改为使用别名选择那些字段时,我可以按别名进行分组。这是在本地环境中运行的标准 MySQL 5.7 docker 映像,所以我不知道为什么它没有出错或返回结果。
哦,天哪,如果我早点知道的话……这么多行 PHP 来做一些 mysql 可以在一行中做的事情。
A
Andriy M
GROUP BY DATE_FORMAT(record_date, '%Y%m')

注意(主要是给潜在的反对者)。目前,这可能不如其他建议有效。尽管如此,我还是把它作为一种替代方案,也可以作为一种替代方案,它可以帮助我们了解其他解决方案的速度有多快。 (因为在你看到区别之前,你不能真正区分快慢。)此外,随着时间的推移,可以对 MySQL 的引擎进行优化方面的更改,以便在某些情况下(也许不是这样)做出这个解决方案遥远的)未来点,在效率上与大多数其他人相当。


我有一种感觉,因为格式函数无法在日期列上使用索引,所以这不会很好地执行。
@Stv:那么您可能要考虑 @fu-chi's answer 。据我所知,该答案和我的答案中的分组表达式计算结果相同,但 EXTRACT() 可能比 DATE_FORMAT() 更有效。 (不过,我没有用于正确测试的 MySQL。)
我喜欢按日期和时间函数年、月等进行分组。但我喜欢在选择中使用 date_format 来重构组的日期date_format(concat(year(timestamp), "-", month(timestamp), "-", day(timestamp), " ", hour(timestamp), ":00"), '%Y-%m-%d')
f
fu-chi

试试这个

SELECT COUNT(id)
FROM stats
GROUP BY EXTRACT(YEAR_MONTH FROM record_date)

EXTRACT(unit FROM date) 函数更好,因为使用较少的分组并且该函数返回一个数字值。

分组时的比较条件将比 DATE_FORMAT 函数(返回字符串值)更快。尝试使用为 SQL 比较条件(WHERE、HAVING、ORDER BY、GROUP BY)返回非字符串值的函数|字段。


P
Peter O.

我尝试使用上面的“WHERE”语句,我认为它是正确的,因为没有人纠正它,但我错了;经过一番搜索,我发现这是 WHERE 语句的正确公式,因此代码如下所示:

SELECT COUNT(id)  
FROM stats  
WHERE YEAR(record_date) = 2009  
GROUP BY MONTH(record_date)

f
fragilewindows

如果您的搜索时间超过几年,并且您仍想按月分组,我建议:

版本#1:

SELECT SQL_NO_CACHE YEAR(record_date), MONTH(record_date), COUNT(*)
FROM stats
GROUP BY DATE_FORMAT(record_date, '%Y%m')

版本 #2(更高效):

SELECT SQL_NO_CACHE YEAR(record_date), MONTH(record_date), COUNT(*)
FROM stats
GROUP BY YEAR(record_date)*100 + MONTH(record_date)

我在一张有 1,357,918 行 () 的大表上比较了这些版本,第二个版本似乎有更好的结果。

版本 1(平均 10 次执行):1.404 秒版本 2(平均 10 次执行):0.780 秒

(添加了 SQL_NO_CACHE 键以防止 MySQL 对查询进行缓存。)


考虑将@fu-chi 的建议包含在您的测试中,它可能会更有效。此外,您测试了 GROUP BY YEAR(record_date)*100 + MONTH(record_date),但为什么不测试 GROUP BY YEAR(record_date), MONTH(record_date)
如果您使用 COUNT(1) 而不是 COUNT(*) 它会更快,并且结果数据相同。
版本 #2 上的 *100 是什么?提前致谢。
*100YEAR(record_date)*100 + MONTH(record_date) == DATE_FORMAT(record_date, '%Y%m')
S
Salman A

如果您想过滤特定年份(例如 2000 年)的记录,则优化 WHERE 子句,如下所示:

SELECT MONTH(date_column), COUNT(*)
FROM date_table
WHERE date_column >= '2000-01-01' AND date_column < '2001-01-01'
GROUP BY MONTH(date_column)
-- average 0.016 sec.

代替:

WHERE YEAR(date_column) = 2000
-- average 0.132 sec.

结果是针对包含 300k 行和日期列索引的表生成的。

至于 GROUP BY 子句,我根据上面提到的表格测试了三个变体;结果如下:

SELECT YEAR(date_column), MONTH(date_column), COUNT(*)
FROM date_table
GROUP BY YEAR(date_column), MONTH(date_column)
-- codelogic
-- average 0.250 sec.

SELECT YEAR(date_column), MONTH(date_column), COUNT(*)
FROM date_table
GROUP BY DATE_FORMAT(date_column, '%Y%m')
-- Andriy M
-- average 0.468 sec.

SELECT YEAR(date_column), MONTH(date_column), COUNT(*)
FROM date_table
GROUP BY EXTRACT(YEAR_MONTH FROM date_column)
-- fu-chi
-- average 0.203 sec.

最后一位是获胜者。


H
Haijerome

如果要在 MySQL 中按日期分组,请使用以下代码:

 SELECT COUNT(id)
 FROM stats
 GROUP BY DAYOFMONTH(record_date)

希望这可以为那些将要找到这个线程的人节省一些时间。


请务必注意,您还需要按 MONTH(record_date) 分组,以考虑多个月。
l
lreeder

您可以在 GROUP BY 中简单地使用 Mysql DATE_FORMAT() 函数。在某些情况下,您可能需要添加一个额外的列以增加清晰度,例如记录跨越几年,然后同一个月出现在不同的年份。这里有很多选项,您可以自定义它。请在开始之前阅读此内容。希望它对你很有帮助。这是您理解的示例查询

SELECT
    COUNT(id),
    DATE_FORMAT(record_date, '%Y-%m-%d') AS DAY,
    DATE_FORMAT(record_date, '%Y-%m') AS MONTH,
    DATE_FORMAT(record_date, '%Y') AS YEAR

FROM
    stats
WHERE
    YEAR = 2009
GROUP BY
    DATE_FORMAT(record_date, '%Y-%m-%d ');

伟大的。运作良好
C
Cees Timmerman

完整而简单的解决方案,具有类似性能但更短且更灵活的替代方案,目前处于活动状态:

SELECT COUNT(*) FROM stats
-- GROUP BY YEAR(record_date), MONTH(record_date), DAYOFMONTH(record_date)
GROUP BY DATE_FORMAT(record_date, '%Y-%m-%d')

k
kero

如果您想获得按最近一个月排序的每年每月行数的月度统计数据,请尝试以下操作:

SELECT count(id),
      YEAR(record_date),
      MONTH(record_date) 
FROM `table` 
GROUP BY YEAR(record_date),
        MONTH(record_date) 
ORDER BY YEAR(record_date) DESC,
        MONTH(record_date) DESC

M
Minisha

以下查询在 Oracle Database 12c 版本 12.1.0.1.0 中对我有用

SELECT COUNT(*)
FROM stats
GROUP BY 
extract(MONTH FROM TIMESTAMP),
extract(MONTH FROM TIMESTAMP),
extract(YEAR  FROM TIMESTAMP);

A
Arth

我更喜欢像这样优化一年组选择:

SELECT COUNT(*)
  FROM stats
 WHERE record_date >= :year 
   AND record_date <  :year + INTERVAL 1 YEAR;

这样,您只需将年份绑定一次,例如 '2009',使用命名参数,而无需担心单独添加 '-01-01' 或传入 '2010'

此外,我们可能只是计算行数,而 id 绝不是 NULL,我更喜欢 COUNT(*) 而不是 COUNT(id)


N
NiKiZe

我想每天得到类似的数据,经过一番实验,这是我能找到的最快的我的场景

SELECT COUNT(id)
FROM stats
GROUP BY record_date DIV 1000000;

如果您想每月拥有它,请添加额外的零 (00) 从“使代码可读”的角度来看,我不建议这样做,它也可能会在不同的版本中中断。但在我们的案例中,与我测试的其他一些更清晰的查询相比,这花费的时间不到一半。

这是一个 MySQL 答案(因为 MySQL 在问题中被标记)并且在手册 https://dev.mysql.com/doc/refman/8.0/en/date-and-time-type-conversion.html 中有详细记录


为什么这行得通? MySQL的一个怪癖。在完成此查询时,它会将 2021-03-04 05:06:07 隐式转换为数字 20,210,304,050,607。 (为清楚起见,添加了逗号)。该数字的 DIV 1,000,000 产生数字 20,210,304,代表一天。在处理其他人的数据时,最好避免这种特殊的怪癖。
在 MySQL 中将日期转换为数字记录在 dev.mysql.com/doc/refman/8.0/en/…“将 TIME 和 DATETIME 值转换为数字形式(例如,通过添加 +0)”所以这不是一个怪癖,但它确实使查询变得不那么清晰。
从某种意义上说,其他 dbms 制造和模型不以这种方式工作,这是一个怪癖。
更新了答案,以明确说明这是 MySQL 的一个功能,有据可查,不应期望它与其他任何东西一起使用。该问题的标题中有 MySQL,并且也带有 mysql 标记,因此在该上下文中找到并回答了该问题。
a
aromita sen

.... group by to_char(date, 'YYYY') --> 1989

.... group by to_char(date,'MM') -->05

.... group by to_char(date,'DD') --->23

.... group by to_char(date,'MON') --->五月

.... group by to_char(date,'YY') --->89


这将非常非常缓慢。
O
O. Jones

这是另一种方法。这使用 [MySQL 的 LAST_DAY() 函数][1] 将每个时间戳映射到其月份。如果 record_date 上有索引,它还能够通过有效的范围扫描按年份进行过滤。

  SELECT LAST_DAY(record_date) month_ending, COUNT(*) record_count
    FROM stats
   WHERE record_date >= '2000-01-01'
     AND record_date <  '2000-01-01' + INTERVAL 1 YEAR
   GROUP BY LAST_DAY(record_date) 

如果您想要按天计算结果,请改用 DATE(record_date)

如果您希望按日历季度获得结果,请使用 YEAR(record_date), QUARTER(record_date)

这是一篇文章。 https://www.plumislandmedia.net/mysql/sql-reporting-time-intervals/ [1]:https://dev.mysql.com/doc/refman/8.0/en/date-and-time-functions.html#function_last-day