ChatGPT解决这个技术问题 Extra ChatGPT

MySQL 如何处理查询中的 ORDER BY 和 LIMIT?

我有一个看起来像这样的查询:

SELECT article FROM table1 ORDER BY publish_date LIMIT 20

ORDER BY 是如何工作的?它会排序所有记录,然后获取前 20 条记录,还是获取 20 条记录并按 publish_date 字段排序?

如果它是最后一篇,则不能保证您真正获得最新的 20 篇文章。

请注意,如果某些 publish_date 相等,则按它们排序不会给出确定的结果,这意味着如果您使用 LIMIT 进行分页,您最终可能会在不同的页面上获得相同的项目!
注意你应用这些的顺序。如果你先做 LIMIT 再做 ORDER BY,它会抛出一个错误。 ORDER BY 必须是查询中的第一个。

L
Leigh

它将首先排序,然后获取前 20 个。数据库还将处理 ORDER BY 之前的 WHERE 子句中的任何内容。


所以时间是一样的?
错误的! LIMIT 中断 ORDER BY。使用 LIMIT 时,ORDER BY 返回错误的结果。 LIMIT 以某种方式重新排序 ORDER BY 返回的结果集
@Green,你错了。阅读此内容以获得解释:dev.mysql.com/doc/refman/5.7/en/limit-optimization.html 当 ORDER BY 列被索引时,当该列中有超过 1 条具有相同值的记录时,它可能会以与没有 LIMIT 的情况下不同的顺序返回记录。
此类问题的一个快速解决方案是通过优选地具有唯一值来添加一个多列来排序,以便当多行的第一个按列排序的值相同时,数据库获得一致的行排序规则。
b
bensiu

LIMIT 子句可用于限制 SELECT 语句返回的行数。 LIMIT 接受一个或两个数字参数,它们都必须是非负整数常量(使用准备好的语句时除外)。

有两个参数,第一个参数指定要返回的第一行的偏移量,第二个参数指定要返回的最大行数。初始行的偏移量为 0(不是 1):

SELECT * FROM tbl LIMIT 5,10; # Retrieve rows 6-15

要检索从某个偏移量到结果集末尾的所有行,您可以为第二个参数使用一些较大的数字。此语句检索从第 96 行到最后一行的所有行:

SELECT * FROM tbl LIMIT 95,18446744073709551615;

使用一个参数,该值指定从结果集开头返回的行数:

SELECT * FROM tbl LIMIT 5; # Retrieve first 5 rows

换句话说,LIMIT row_count 等价于 LIMIT 0, row_count。

所有详细信息:http://dev.mysql.com/doc/refman/5.0/en/select.html


它不是检索第 5-14 行吗?
@adonis 不,不是。该示例来自 MySQL Documentation
5 号是第 6 行。 5 行(0 到 4)被忽略。
但是使用没有 ORDER BY 的 LIMIT 可能会产生不一致的结果!不幸的是,必须在应用 LIMIT 之前对整个结果集进行排序,否则 DBMS 可以随意对结果进行任意排序,然后对该结果集进行 OFFSET 和 LIMIT 排序。我读过这可能是由于 DBMS 选择了基于 OFFSET 和 LIMIT 的备用查询计划,因此是任意顺序。
问题是询问限制和顺序。但答案与这个问题完全无关
e
emanciperingsivraren

正如@James 所说,它将对所有记录进行排序,然后获取前 20 行。

如此一来,您一定会获得 20 篇首次发表的文章,较新的文章将不会显示。

在您的情况下,我建议您将 desc 添加到 order by publish_date,如果您想要最新的文章,那么最新的文章将是第一个。

如果您需要保持结果按升序排列,并且仍然只想要 10 篇最新文章,您可以让 mysql 对结果进行两次排序。

下面的这个查询将对结果进行降序排序并将结果限制为 10(即括号内的查询)。还是会按照降序排序,我们对此并不满意,所以要求mysql再排序一次。现在我们在最后一行有了最新的结果。

select t.article 
from 
    (select article, publish_date 
     from table1
     order by publish_date desc limit 10) t 

order by t.publish_date asc;

如果您需要所有列,则以这种方式完成:

select t.* 
from 
    (select * 
     from table1  
     order by publish_date desc limit 10) t 

order by t.publish_date asc;

当我手动编写查询来检查数据库的各种内容时,我会使用这种技术。我没有在生产环境中使用过它,但是现在当我对它进行基准标记时,额外的排序不会影响性能。


您的额外排序实际上不会对性能产生任何可衡量的影响,因为它仅限于 10 行/项目 :-)。通常,对内存表(子选择正在生成)进行排序非常快且几乎无法测量,除非您有数百万行或 DBMS 将结果集分页到磁盘,因为它不适合内存(在这种情况下根据 DBMS,它也可以中止查询)。
L
Leigh

您可以在订单末尾添加[asc]或[desc]以获取最早或最新的记录

例如,这将首先为您提供最新记录

ORDER BY stamp DESC

ORDER BY 之后附加 LIMIT 子句


欢迎来到stackoverflow。我想你可能误解了这个问题。我相信他们是在询问操作顺序而不是“如何排序”。 (但由于这个问题已经在不久前得到回答,所以没有实际意义;)
m
martin clayton

如果有合适的索引,在这种情况下是在 publish_date 字段上,那么 MySQL 不需要扫描整个索引来获取请求的 20 条记录——这 20 条记录将在索引的开头找到。但如果没有合适的索引,则需要对表进行全扫描。

有一个 2009 年的 MySQL Performance Blog article


g
gaurangkathiriya

您可以使用此代码 SELECT article FROM table1 ORDER BY publish_date LIMIT 0,10,其中 0 是记录的开始限制 & 10条记录


不,这不是必需的LIMIT 10LIMIT 0,10 的简写。
是的,LIMIT 0,10 不需要,但你可以像这个限制 10,20 一样需要
E
Egor Pavlikhin

LIMIT 通常作为最后一个操作应用,所以会先对结果进行排序,然后限制为 20 个。实际上,只要找到前 20 个排序结果,排序就会停止。


你的第二句话与你的第一句话背道而驰。找到前 20 个结果时,排序不能停止,因为正如您所说,排序将在返回结果之前完成。 MySQL 只能在排序完成后知道前 20 个结果是什么。
@Tom,如果按索引列排序,实际上可以。此处解释:dev.mysql.com/doc/refman/5.7/en/limit-optimization.html
D
Daniel Nelson

可以简化为:

SELECT article FROM table1 ORDER BY publish_date DESC FETCH FIRST 20 ROWS ONLY;

您还可以在 ORDER BY 中添加许多以逗号分隔的参数,例如:ORDER BY publish_date, tab2, tab3 DESC 等...