我有一个 Python 对象列表,我想按每个对象的特定属性对其进行排序:
>>> ut
[Tag(name="toe", count=10), Tag(name="leg", count=2), ...]
如何按 .count
降序对列表进行排序?
# To sort the list in place...
ut.sort(key=lambda x: x.count, reverse=True)
# To return a new list, use the sorted() built-in function...
newlist = sorted(ut, key=lambda x: x.count, reverse=True)
更多关于sorting by keys。
一种最快的方法是使用 operator.attrgetter("count")
,尤其是在您的列表有很多记录的情况下。但是,这可能会在 Python 的预操作员版本上运行,因此最好有一个回退机制。然后,您可能想要执行以下操作:
try: import operator
except ImportError: keyfun= lambda x: x.count # use a lambda if no operator module
else: keyfun= operator.attrgetter("count") # use operator since it's faster than lambda
ut.sort(key=keyfun, reverse=True) # sort in-place
__init__
方法之后完成了 self.__dict__ = {'some':'dict'}
)。不过,我不知道为什么它会有所不同。
__dict__
。请注意,“具有动态添加属性的对象”和“设置对象的 __dict__
属性”几乎是正交的概念。我这么说是因为您的评论似乎暗示设置 __dict__
属性是动态添加属性的要求。
operator.attrgetter
的用法,我可以提供一个具有任何属性名称的函数并返回一个排序集合。
读者应该注意到 key= 方法:
ut.sort(key=lambda x: x.count, reverse=True)
比向对象添加丰富的比较运算符要快很多倍。我很惊讶地读到这个(“Python in a Nutshell”的第 485 页)。您可以通过在这个小程序上运行测试来确认这一点:
#!/usr/bin/env python
import random
class C:
def __init__(self,count):
self.count = count
def __cmp__(self,other):
return cmp(self.count,other.count)
longList = [C(random.random()) for i in xrange(1000000)] #about 6.1 secs
longList2 = longList[:]
longList.sort() #about 52 - 6.1 = 46 secs
longList2.sort(key = lambda c: c.count) #about 9 - 6.1 = 3 secs
我的,非常小的测试显示第一种慢了 10 倍以上,但书上说它通常只慢 5 倍。他们说的原因是由于python(timsort)中使用的高度优化的排序算法。
尽管如此,.sort(lambda) 比普通的旧 .sort() 更快,这很奇怪。我希望他们能解决这个问题。
__cmp__
相当于调用 .sort(cmp=lambda)
,而不是 .sort(key=lambda)
,所以一点也不奇怪。
longList2.sort(cmp = cmp)
。我试过了,它的性能几乎与 .sort()
相同。 (另外:请注意,“cmp”排序参数已在 Python 3 中删除。)
面向对象的方法
如果适用,最好将对象排序逻辑作为类的属性,而不是在需要排序的每个实例中合并。
这确保了一致性并消除了对样板代码的需求。
至少,您应该指定 __eq__
和 __lt__
操作以使其工作。然后只需使用 sorted(list_of_objects)
。
class Card(object):
def __init__(self, rank, suit):
self.rank = rank
self.suit = suit
def __eq__(self, other):
return self.rank == other.rank and self.suit == other.suit
def __lt__(self, other):
return self.rank < other.rank
hand = [Card(10, 'H'), Card(2, 'h'), Card(12, 'h'), Card(13, 'h'), Card(14, 'h')]
hand_order = [c.rank for c in hand] # [10, 2, 12, 13, 14]
hand_sorted = sorted(hand)
hand_sorted_order = [c.rank for c in hand_sorted] # [2, 10, 12, 13, 14]
__eq__
和 __lt__
是最低实施要求的文档?
•The sort routines are guaranteed to use __lt__() when making comparisons between two objects...
__eq__
、__lt__
、__le__
、__gt__
、__ge__
和 __ne__
并在内部只转发到属性特殊功能?
__eq__
和 __lt__
,然后使用 @functools.total_ordering
来获得其余部分。
from operator import attrgetter
ut.sort(key = attrgetter('count'), reverse = True)
它看起来很像 Django ORM 模型实例的列表。
为什么不在这样的查询中对它们进行排序:
ut = Tag.objects.order_by('-count')
向对象类添加丰富的比较运算符,然后使用列表的 sort() 方法。
参见rich comparison in python。
更新:虽然这种方法可行,但我认为 Triptych 的解决方案更适合您的情况,因为它更简单。
如果您要排序的属性是一个属性,那么您可以避免导入 operator.attrgetter
并改用属性的 fget
方法。
例如,对于具有属性 radius
的类 Circle
,我们可以按半径对 circles
的列表进行排序,如下所示:
result = sorted(circles, key=Circle.radius.fget)
这不是最知名的功能,但经常为我节省了导入的一行。
不定期副业成功案例分享