`if key in dict` 与 `try/except` - 哪个更易读？

python idioms readability defaultdict code-readability

我有一个关于习语和可读性的问题，对于这种特殊情况，Python 哲学似乎存在冲突：

我想从字典 B 构建字典 A。如果 B 中不存在特定键，则什么也不做并继续。

哪种方式更好？

try:
    A["blah"] = B["blah"]
except KeyError:
    pass

或者

if "blah" in B:
    A["blah"] = B["blah"]

“做并请求宽恕”与“简单明了”。

哪个更好？为什么？

第二个示例最好写成 if "blah" in B.keys() 或 if B.has_key("blah")。

A.update(B) 不适合您吗？

@Luke：has_key 已被弃用，取而代之的是 in 并且检查 B.keys() 将 O(1) 操作更改为 O(n) 操作。

@Luke：不是，不是。 .has_key 已弃用，keys 在 py2k 中创建不需要的列表，在 py3k 中是多余的

'build' A，例如，A 一开始是空的？我们只想要某些键？使用理解：A = dict((k, v) for (k, v) in B if we_want_to_include(k))。

Glenn Maynard

例外不是条件。

有条件的版本更清晰。这很自然：这是直接的流控制，这是为条件设计的，而不是例外。

在循环中进行这些查找时，异常版本主要用作优化：对于某些算法，它允许从内部循环中消除测试。这里没有这个好处。它有一个小优势，它避免了两次说 "blah"，但如果你做了很多这些，你可能应该有一个帮助器 move_key 函数。

一般来说，我强烈建议您默认使用条件版本，除非您有特定的理由不这样做。条件是执行此操作的明显方法，通常强烈建议首选一种解决方案而不是另一种解决方案。

我不同意。如果你说“做 X，如果这不起作用，做 Y”。这里反对条件解决方案的主要原因是，您必须更频繁地编写 "blah"，这会导致更容易出错的情况。

而且，特别是在 Python 中，EAFP 的使用非常广泛。

这个答案对于我知道的任何语言都是正确的，除了 Python。

如果你在 Python 中像使用条件一样使用异常，我希望没有其他人需要阅读它。

那么，最终的判决是什么？ :)

user121664

还有第三种方法可以避免异常和双重查找，如果查找成本很高，这可能很重要：

value = B.get("blah", None)
if value is not None: 
    A["blah"] = value

如果您希望字典包含 None 值，您可以使用一些更深奥的常量，例如 NotImplemented、Ellipsis 或创建一个新常量：

MyConst = object()
def update_key(A, B, key):
    value = B.get(key, MyConst)
    if value is not MyConst: 
        A[key] = value

无论如何，使用 update() 对我来说是最易读的选项：

a.update((k, b[k]) for k in ("foo", "bar", "blah") if k in b)

pyfunc

据我了解，您想使用 dict B 中的键、值对更新 dict A

update 是更好的选择。

A.update(B)

例子：

>>> A = {'a':1, 'b': 2, 'c':3}
>>> B = {'d': 2, 'b':5, 'c': 4}
>>> A.update(B)
>>> A
{'a': 1, 'c': 4, 'b': 5, 'd': 2}
>>>

“如果 B 中不存在特定键”对不起，应该更清楚，但如果 B 中存在特定键，我只想复制值。不是所有的都在 B 中。

@LeeMobile - A.update({k: v for k, v in B.iteritems() if k in specificset})

Drew Noakes

来自 Python 性能 wiki 的直接引用：

除了第一次，每次看到一个单词时，if 语句的测试都会失败。如果您计算大量单词，很多单词可能会出现多次。在值的初始化只会发生一次并且该值的增加会发生多次的情况下，使用 try 语句会更便宜。

因此，根据情况，这两种选择似乎都是可行的。有关更多详细信息，您可以查看此链接：Try-except-performance

这是一个有趣的阅读，但我认为有些不完整。使用的字典只有 1 个元素，我怀疑更大的字典会对性能产生重大影响

neil

我认为这里的一般规则是 A["blah"] 通常存在，如果是这样 try-except 是好的，如果不是那么使用 if "blah" in b:

我认为“尝试”在时间上很便宜，但“除外”更贵。

默认情况下不要从优化的角度来处理代码；从可读性和可维护性的角度来处理它。除非目标是专门优化，否则这是错误的标准（如果是优化，答案是基准测试，而不是猜测）。

我可能应该把最后一点放在括号中或者以某种方式模糊 - 我的主要观点是第一个，我认为它具有第二个的额外优势。

Omnifarious

我认为第二个例子是你应该去的，除非这段代码有意义：

try:
    A["foo"] = B["foo"]
    A["bar"] = B["bar"]
    A["baz"] = B["baz"]
except KeyError:
    pass

请记住，只要有不在 B 中的键，代码就会中止。如果这段代码有意义，那么你应该使用异常方法，否则使用测试方法。在我看来，因为它更短并且表达了意图，所以它比异常方法更容易阅读。

当然，告诉您使用 update 的人是正确的。如果您使用的是支持字典理解的 Python 版本，我强烈希望使用以下代码：

updateset = {'foo', 'bar', 'baz'}
A.update({k: B[k] for k in updateset if k in B})

“请记住，只要有不在 B 中的密钥，代码就会中止。” - 这就是为什么最好只在 try: 块中放置绝对最小值的原因，通常这是一行。第一个示例作为循环的一部分会更好，例如 for key in ["foo", "bar", "baz"]: try: A[key] = B[key]

Mark Ransom

其他语言的规则是为异常情况保留例外，即在常规使用中不会发生的错误。不知道该规则如何适用于 Python，因为该规则不应该存在 StopIteration。

我认为这个栗子起源于异常处理成本高昂的语言，因此会对性能产生重大影响。我从未见过任何真正的理由或理由。

@JohnLaRooy 不，性能并不是真正的原因。异常是一种 non-local goto，有些人认为它会妨碍代码的可读性。但是，以这种方式使用异常在 Python 中被认为是惯用的，因此上述内容不适用。

条件返回也是“非本地 goto”，许多人更喜欢这种风格，而不是在代码块末尾检查哨兵。

Xavier Guihot

从 Python 3.8 开始，并引入 assignment expressions (PEP 572)（:= 运算符），我们可以在变量 value 中捕获条件值 dictB.get('hello', None) 以检查它是否不是 None（如 dict.get('hello', None)返回关联值或 None)，然后在条件主体中使用它：

# dictB = {'hello': 5, 'world': 42}
# dictA = {}
if value := dictB.get('hello', None):
  dictA["hello"] = value
# dictA is now {'hello': 5}

如果 value == 0 这将失败

请注意，dict.get(key, None) 与 dict.get(key) 相同。 (docs)

girasquid

就个人而言，我倾向于第二种方法（但使用 has_key）：

if B.has_key("blah"):
  A["blah"] = B["blah"]

这样，每个赋值操作只有两行（而不是使用 try/except 的 4 行），并且抛出的任何异常都将是真正的错误或您错过的事情（而不仅仅是尝试访问不存在的键） .

事实证明（请参阅对您问题的评论），has_key 已被弃用 - 所以我想它最好写成

if "blah" in B:
  A["blah"] = B["blah"]

A.J

尽管公认的答案强调“先看再跳”原则可能适用于大多数语言，但基于 python 原则，更多的 Pythonic 可能是第一种方法。更不用说它在 python 中是一种合法的编码风格。重要的是确保您在正确的上下文中使用 try except 块并遵循最佳实践。例如。在 try 块中做了太多的事情，捕获了一个非常广泛的异常，或者更糟糕的是 - 赤裸裸的 except 子句等。

请求宽恕比请求许可更容易。 (EAFP)

请参阅 python 文档参考 here。

此外，核心开发人员之一 Brett 的这篇 blog 简要介绍了大部分内容。

请参阅另一个 SO 讨论 here：

Jens

除了讨论可读性之外，我认为性能在某些情况下也很重要。快速的timeit 基准表明测试（即“请求许可”）实际上比处理异常（即“请求宽恕”）稍快。

这是设置基准的代码，生成一个随机键值对的大字典：

setup = """
import random, string
d = {"".join(random.choices(string.ascii_letters, k=3)): "".join(random.choices(string.ascii_letters, k=3)) for _ in range(10000)}
"""

然后是 if 测试：

stmt1 = """
key = "".join(random.choices(string.ascii_letters, k=3))
if key in d:
    _ = d[key]
"""

给我们：

>>> timeit.timeit(stmt=stmt1, setup=setup, number=1000000)
1.6444563979999884

而利用异常的方法

stmt2 = """
key = "".join(random.choices(string.ascii_letters, k=3))
try:
    _ = d[key]
except KeyError:
    pass
"""

给我们：

>>> timeit.timeit(stmt=stmt2, setup=setup, number=1000000)
1.8868465850000575

有趣的是，将 key 代从实际基准提升到设置中，然后一遍又一遍地寻找 same 键，提供了截然不同的数字：

>>> timeit.timeit(stmt=stmt1, setup=setup, number=100000000)
2.3290171539999847
>>> timeit.timeit(stmt=stmt2, setup=setup, number=100000000)
26.412447488999987

我不想推测这是否强调了测试与异常处理的好处，或者字典是否缓冲了先前查找的结果，从而使基准测试结果偏向于测试......🤔

`if key in dict` 与 `try/except` - 哪个更易读？

关注公众号

想领先一步获取最新的外包任务吗？

相似问题

平台

支持

联系我们