我有一个 2D NumPy 数组,想用 255.0 替换其中大于或等于阈值 T 的所有值。据我所知,最基本的方法是:
shape = arr.shape
result = np.zeros(shape)
for x in range(0, shape[0]):
for y in range(0, shape[1]):
if arr[x, y] >= T:
result[x, y] = 255
最简洁和最pythonic的方法是什么?是否有更快(可能不那么简洁和/或不那么 Pythonic)的方式来做到这一点?
这将是人体头部 MRI 扫描的窗口/水平调整子程序的一部分。 2D numpy 数组是图像像素数据。
我认为最快和最简洁的方法是使用 NumPy 的内置 Fancy 索引。如果您有一个名为 arr
的 ndarray
,则可以将所有元素 >255
替换为值 x
,如下所示:
arr[arr > 255] = x
我用 500 x 500 随机矩阵在我的机器上运行这个,用 5 替换所有 >0.5 的值,平均耗时 7.59 毫秒。
In [1]: import numpy as np
In [2]: A = np.random.rand(500, 500)
In [3]: timeit A[A > 0.5] = 5
100 loops, best of 3: 7.59 ms per loop
由于您实际上想要一个不同的数组,即 arr
其中 arr < 255
和 255
,否则可以简单地完成:
result = np.minimum(arr, 255)
更一般地,对于下限和/或上限:
result = np.clip(arr, 0, 255)
如果您只想访问超过 255 的值或更复杂的值,@mtitan8 的答案更笼统,但 np.clip
和 np.minimum
(或 np.maximum
)对于您的情况更好更快:
In [292]: timeit np.minimum(a, 255)
100000 loops, best of 3: 19.6 µs per loop
In [293]: %%timeit
.....: c = np.copy(a)
.....: c[a>255] = 255
.....:
10000 loops, best of 3: 86.6 µs per loop
如果您想就地进行(即修改 arr
而不是创建 result
),您可以使用 np.minimum
的 out
参数:
np.minimum(arr, 255, out=arr)
或者
np.clip(arr, 0, 255, arr)
(out=
名称是可选的,因为参数的顺序与函数定义的顺序相同。)
对于就地修改,布尔索引加快了很多(不必单独制作然后修改副本),但仍然不如 minimum
快:
In [328]: %%timeit
.....: a = np.random.randint(0, 300, (100,100))
.....: np.minimum(a, 255, a)
.....:
100000 loops, best of 3: 303 µs per loop
In [329]: %%timeit
.....: a = np.random.randint(0, 300, (100,100))
.....: a[a>255] = 255
.....:
100000 loops, best of 3: 356 µs per loop
为了比较,如果你想用最小值和最大值来限制你的值,如果没有 clip
,你将不得不这样做两次,比如
np.minimum(a, 255, a)
np.maximum(a, 0, a)
或者,
a[a>255] = 255
a[a<0] = 0
a[start:stop:step]
为您提供从 start
到 stop
的数组元素,但不是每个元素,它只需要每个 step
(如果忽略,默认为 1
)。因此,要将所有偶数设置为零,您可以执行 a[::2] = 0
a = np.maximum(a,0)
比 np.maximum(a,0,out=a)
快。
我认为您可以使用 where
函数最快地实现这一点:
例如,在 numpy 数组中查找大于 0.2 的项目并将其替换为 0:
import numpy as np
nums = np.random.rand(4,3)
print np.where(nums > 0.2, 0, nums)
另一种方法是使用 np.place
进行就地替换并与多维数组一起使用:
import numpy as np
# create 2x3 array with numbers 0..5
arr = np.arange(6).reshape(2, 3)
# replace 0 with -10
np.place(arr, arr == 0, -10)
np.place
与内置方法相比也较慢,尽管 this 评论中声称相反。
您可以考虑使用 numpy.putmask:
np.putmask(arr, arr>=T, 255.0)
这是与 Numpy 的内置索引的性能比较:
In [1]: import numpy as np
In [2]: A = np.random.rand(500, 500)
In [3]: timeit np.putmask(A, A>0.5, 5)
1000 loops, best of 3: 1.34 ms per loop
In [4]: timeit A[A > 0.5] = 5
1000 loops, best of 3: 1.82 ms per loop
0.5
而不是 5
的代码,并且 indexing
比 np.putmask
好大约两倍。
您还可以使用 &
、|
(和/或)以获得更大的灵活性:
5 到 10 之间的值:A[(A>5)&(A<10)]
大于 10 或小于 5 的值:A[(A<5)|(A>10)]
让我们假设您有一个 numpy
数组,其中包含从 0 一直到 20 的值,并且您想用 0 替换大于 10 的数字
import numpy as np
my_arr = np.arange(0,21) # creates an array
my_arr[my_arr > 10] = 0 # modifies the value
但是请注意,这将修改原始数组以避免覆盖原始数组尝试使用 arr.copy() 创建原始数组的新分离副本并改为修改它。
import numpy as np
my_arr = np.arange(0,21)
my_arr_copy = my_arr.copy() # creates copy of the orignal array
my_arr_copy[my_arr_copy > 10] = 0
np.where() 效果很好!
np.where(arr > 255, 255, arr)
例子:
FF = np.array([[0, 0],
[1, 0],
[0, 1],
[1, 1]])
np.where(FF == 1, '+', '-')
Out[]:
array([['-', '-'],
['+', '-'],
['-', '+'],
['+', '+']], dtype='<U1')
不定期副业成功案例分享
arr
,而不是像在 OP 中那样创建result
数组。A
而是创建一个新数组来做到这一点?np.array([1,2,3]
)array[ ? ] = x
,将每个值设置为 x。其次,是否可以执行多个条件,例如:array[ ? ] = 255 if array[i] > 127 else 0
我想优化我的代码,并且目前正在使用列表理解,这比这种花哨的索引要慢得多。