为什么 [] 比 list() 快？

python performance list instantiation literals

我最近比较了 [] 和 list() 的处理速度，并惊讶地发现 [] 的运行速度比 list() 快三倍。我对 {} 和 dict() 进行了相同的测试，结果几乎相同：[] 和 {} 都花费了大约 0.128 秒 / 百万个周期，而 list() 和 dict() 大约花费了 0.428 秒 / 百万个周期每个循环。

为什么是这样？执行 [] 和 {}（可能还有 () 和 ''）立即传回一些空股票文字的副本，而它们的明确命名的对应物（list()、dict()、tuple()、 str()) 完全创建一个对象，不管它们是否真的有元素？

我不知道这两种方法有何不同，但我很想知道。我在文档或 SO 上找不到答案，而且搜索空括号的问题比我预期的要严重。

我通过调用 timeit.timeit("[]") 和 timeit.timeit("list()") 以及 timeit.timeit("{}") 和 timeit.timeit("dict()") 来分别比较列表和字典来获得计时结果。我正在运行 Python 2.7.9。

我最近发现了将 if True 与 if 1 的性能进行比较的“Why is if True slower than if 1?”，并且似乎触及了类似的文字与全局场景；也许它也值得考虑。

注意：() 和 '' 是特殊的，因为它们不仅是空的，而且是不可变的，因此，将它们设为单例很容易；他们甚至不构造新对象，只为空的 tuple/str 加载单例。从技术上讲，这是一个实现细节，但我很难想象他们为什么出于性能原因不会缓存空的 tuple/str。所以你关于 [] 和 {} 传回股票文字的直觉是错误的，但它确实适用于 () 和 ''。

还相关：Why is {} faster than calling set()?

Boris Verkhovskiy

因为 [] 和 {} 是 文字语法。 Python 可以创建字节码来创建列表或字典对象：

>>> import dis
>>> dis.dis(compile('[]', '', 'eval'))
  1           0 BUILD_LIST               0
              3 RETURN_VALUE        
>>> dis.dis(compile('{}', '', 'eval'))
  1           0 BUILD_MAP                0
              3 RETURN_VALUE

list() 和 dict() 是独立的对象。需要解析它们的名称，必须涉及堆栈以推送参数，必须存储框架以供以后检索，并且必须进行调用。这一切都需要更多时间。

对于空的情况，这意味着您至少有一个 LOAD_NAME（它必须搜索全局命名空间以及 builtins module），然后是一个 CALL_FUNCTION，它必须保留当前帧：

>>> dis.dis(compile('list()', '', 'eval'))
  1           0 LOAD_NAME                0 (list)
              3 CALL_FUNCTION            0
              6 RETURN_VALUE        
>>> dis.dis(compile('dict()', '', 'eval'))
  1           0 LOAD_NAME                0 (dict)
              3 CALL_FUNCTION            0
              6 RETURN_VALUE

您可以使用 timeit 单独为名称查找计时：

>>> import timeit
>>> timeit.timeit('list', number=10**7)
0.30749011039733887
>>> timeit.timeit('dict', number=10**7)
0.4215109348297119

时间差异可能是字典哈希冲突。从调用这些对象的时间中减去这些时间，并将结果与使用文字的时间进行比较：

>>> timeit.timeit('[]', number=10**7)
0.30478692054748535
>>> timeit.timeit('{}', number=10**7)
0.31482696533203125
>>> timeit.timeit('list()', number=10**7)
0.9991960525512695
>>> timeit.timeit('dict()', number=10**7)
1.0200958251953125

因此，每 1000 万次调用，必须调用该对象需要额外的 1.00 - 0.31 - 0.30 == 0.39 秒。

您可以通过将全局名称别名为本地名称来避免全局查找成本（使用 timeit 设置，您绑定到名称的所有内容都是本地名称）：

>>> timeit.timeit('_list', '_list = list', number=10**7)
0.1866450309753418
>>> timeit.timeit('_dict', '_dict = dict', number=10**7)
0.19016098976135254
>>> timeit.timeit('_list()', '_list = list', number=10**7)
0.841480016708374
>>> timeit.timeit('_dict()', '_dict = dict', number=10**7)
0.7233691215515137

但是您永远无法克服CALL_FUNCTION的成本。

Dan D.

list() 需要全局查找和函数调用，但 [] 编译为单个指令。看：

Python 2.7.3
>>> import dis
>>> dis.dis(lambda: list())
  1           0 LOAD_GLOBAL              0 (list)
              3 CALL_FUNCTION            0
              6 RETURN_VALUE        
>>> dis.dis(lambda: [])
  1           0 BUILD_LIST               0
              3 RETURN_VALUE

Torxed

因为 list 是将字符串转换为列表对象的 function，而 [] 用于立即创建列表。试试这个（可能对你更有意义）：

x = "wham bam"
a = list(x)
>>> a
["w", "h", "a", "m", ...]

尽管

y = ["wham bam"]
>>> y
["wham bam"]

为您提供包含您放入其中的任何内容的实际列表。

这并没有直接解决这个问题。问题是为什么 [] 比 list() 快，而不是为什么 ['wham bam'] 比 list('wham bam') 快。

@JeremyVisser 这对我来说意义不大，因为 []/list() 与 ['wham']/list('wham') 完全相同，因为它们具有相同的变量差异，就像 1000/10 在数学中与 100/1 相同。理论上你可以去掉 wham bam 并且事实仍然是一样的，list() 试图通过调用函数名来转换某些东西，而 [] 将直接转换变量。函数调用是不同的，是的，这只是问题的逻辑概述，例如公司的网络图也是解决方案/问题的逻辑。随心所欲地投票。

@JeremyVisser 相反，它表明他们对内容做了不同的操作。

Dimitris Fasarakis Hilliard

这里的答案很好，切中要害，完全涵盖了这个问题。对于那些感兴趣的人，我将从字节码中进一步降低。我正在使用 CPython 的最新存储库；旧版本在这方面的行为相似，但可能会有细微的变化。

以下是其中每个的执行细分，BUILD_LIST 用于 []，CALL_FUNCTION 用于 list()。

BUILD_LIST 指令：

你应该只看到恐怖：

PyObject *list =  PyList_New(oparg);
if (list == NULL)
    goto error;
while (--oparg >= 0) {
    PyObject *item = POP();
    PyList_SET_ITEM(list, oparg, item);
}
PUSH(list);
DISPATCH();

我知道，非常令人费解。这很简单：

使用 PyList_New 创建一个新列表（这主要为新列表对象分配内存）， oparg 指示堆栈上的参数数量。开门见山。

检查 if (list==NULL) 没有出错。

使用 PyList_SET_ITEM （宏）添加位于堆栈上的任何参数（在我们的示例中不执行）。

难怪它很快！它是为创建新列表而定制的，仅此而已:-)

CALL_FUNCTION 指令：

这是您查看代码处理 CALL_FUNCTION 时首先看到的内容：

PyObject **sp, *res;
sp = stack_pointer;
res = call_function(&sp, oparg, NULL);
stack_pointer = sp;
PUSH(res);
if (res == NULL) {
    goto error;
}
DISPATCH();

看起来很无害，对吧？好吧，不，不幸的是，call_function 不是一个会立即调用函数的直截了当的人，它不能。相反，它从堆栈中抓取对象，抓取堆栈的所有参数，然后根据对象的类型进行切换；是不是：

PyCFunction_Type？不，它是列表，列表不是 PyCFunction 类型

PyMethodType?不，见前文。

PyFunctionType？不，见前面。

我们调用 list 类型，传递给 call_function 的参数是 PyList_Type。 CPython 现在必须调用一个通用函数来处理任何名为 _PyObject_FastCallKeywords 的可调用对象，还有更多的函数调用。

此函数再次对某些函数类型进行一些检查（我不明白为什么），然后在为 kwargs if required 创建一个 dict 之后，继续调用 _PyObject_FastCallDict。

_PyObject_FastCallDict 终于把我们带到了某个地方！在对我们传入的 type 执行更多检查后，它 grabs the tp_call slot from the type 会抓取 type.tp_call。然后它继续使用 _PyStack_AsTuple 传入的参数创建一个元组，最后是 a call can finally be made！

与 type.__call__ 匹配的 tp_call 接管并最终创建列表对象。它调用对应于 PyType_GenericNew 的列表 __new__ 并使用 PyType_GenericAlloc 为其分配内存：这实际上是它最终赶上 PyList_New 的部分。所有前面的都是以通用方式处理对象所必需的。

最后，type_call 调用 list.__init__ 并使用任何可用参数初始化列表，然后我们继续原路返回。 :-)

最后，请记住 LOAD_NAME，这是另一个在这里做出贡献的人。

很容易看出，在处理我们的输入时，Python 通常必须跳过一些环节才能真正找到合适的 C 函数来完成这项工作。它不能立即调用它，因为它是动态的，有人可能会掩盖 list（ 很多人都会这样做）并且必须采取另一条路径。

这就是 list() 损失很大的地方：探索 Python 需要做的是找出它到底应该做什么。