ChatGPT解决这个技术问题 Extra ChatGPT

连接两个一维 NumPy 数组

我在 NumPy 中有两个简单的一维数组。我应该能够使用 numpy.concatenate 连接它们。但我收到以下代码的此错误:

TypeError:只有长度为 1 的数组可以转换为 Python 标量

代码

import numpy
a = numpy.array([1, 2, 3])
b = numpy.array([5, 6])
numpy.concatenate(a, b)

为什么?

如果您想将它们沿一个轴串联(成一个数组),请使用 np.concatenat(..., axis)。如果要垂直堆叠,请使用 np.vstack。如果要将它们水平堆叠(成多个数组),请使用 np.hstack。 (如果您想按深度堆叠它们,即第 3 维,请使用 np.dstack)。请注意,后者类似于 pandas pd.concat

W
Winston Ewert

该行应该是:

numpy.concatenate([a,b])

您要连接的数组需要作为序列传递,而不是作为单独的参数。

NumPy documentation

numpy.concatenate((a1, a2, ...), axis=0) 将一系列数组连接在一起。

它试图将您的 b 解释为轴参数,这就是它抱怨无法将其转换为标量的原因。


谢谢!只是好奇-这背后的逻辑是什么?
@user391339,如果你想连接三个数组怎么办?如果只使用两个数组,该函数在获取序列时更有用。
@WinstonEwert 假设问题不在于它被硬编码为两个参数,如果您愿意,您可以像 numpy.concatenate(a1, a2, a3)numpy.concatenate(*[a1, a2, a3]) 一样使用它。 Python 的流畅性足以使差异最终感觉更像是表面上的而不是实质上的,但是当 API 一致时(例如,如果所有采用可变长度参数列表的 numpy 函数都需要显式序列)就很好。
@吉姆克。轴参数会发生什么?
假设要连接的东西都是位置参数,您可以将轴保留为关键字参数,例如 def concatx(*sequences, **kwargs))。这并不理想,因为您似乎无法以这种方式在签名中明确命名关键字 args,但有一些解决方法。
N
Nico Schlömer

连接一维数组有多种可能性,例如,

import numpy as np

np.r_[a, a]
np.stack([a, a]).reshape(-1)
np.hstack([a, a])
np.concatenate([a, a])

对于大型阵列,所有这些选项都同样快;对于小的,concatenate 有一点优势:

https://i.stack.imgur.com/QGRpq.png

该图是使用 perfplot 创建的:

import numpy
import perfplot

perfplot.show(
    setup=lambda n: numpy.random.rand(n),
    kernels=[
        lambda a: numpy.r_[a, a],
        lambda a: numpy.stack([a, a]).reshape(-1),
        lambda a: numpy.hstack([a, a]),
        lambda a: numpy.concatenate([a, a]),
    ],
    labels=["r_", "stack+reshape", "hstack", "concatenate"],
    n_range=[2 ** k for k in range(19)],
    xlabel="len(a)",
)

替代品都使用 np.concatenate。他们只是事先以各种方式按摩输入列表。 np.stack 例如为所有输入数组添加一个额外的维度。看看他们的源代码。仅编译 concatenate
只是为了添加到@hpaulj 的评论 - 随着数组大小的增长,所有时间都会收敛,因为 np.concatenate 会复制输入。然后,这种内存和时间成本超过了“按摩”输入所花费的时间。
谢谢!我还使用您的代码检查了数组数量(大小为 100)的影响,并得到了类似的结果:i.stack.imgur.com/w6ojK.png
P
Peter Mortensen

concatenate 的第一个参数本身应该是要连接的 数组序列

numpy.concatenate((a,b)) # Note the extra parentheses.

S
Semjon Mössinger

另一种方法是使用“连接”的缩写形式,即“r_[...]”或“c_[...]”,如下面的示例代码所示(有关更多信息,请参见 http://wiki.scipy.org/NumPy_for_Matlab_Users):

%pylab
vector_a = r_[0.:10.] #short form of "arange"
vector_b = array([1,1,1,1])
vector_c = r_[vector_a,vector_b]
print vector_a
print vector_b
print vector_c, '\n\n'

a = ones((3,4))*4
print a, '\n'
c = array([1,1,1])
b = c_[a,c]
print b, '\n\n'

a = ones((4,3))*4
print a, '\n'
c = array([[1,1,1]])
b = r_[a,c]
print b

print type(vector_b)

结果是:

[ 0.  1.  2.  3.  4.  5.  6.  7.  8.  9.]
[1 1 1 1]
[ 0.  1.  2.  3.  4.  5.  6.  7.  8.  9.  1.  1.  1.  1.] 


[[ 4.  4.  4.  4.]
 [ 4.  4.  4.  4.]
 [ 4.  4.  4.  4.]] 

[[ 4.  4.  4.  4.  1.]
 [ 4.  4.  4.  4.  1.]
 [ 4.  4.  4.  4.  1.]] 


[[ 4.  4.  4.]
 [ 4.  4.  4.]
 [ 4.  4.  4.]
 [ 4.  4.  4.]] 

[[ 4.  4.  4.]
 [ 4.  4.  4.]
 [ 4.  4.  4.]
 [ 4.  4.  4.]
 [ 1.  1.  1.]]

vector_b = [1,1,1,1] #short form of "array",这根本不是真的。 vector_b 将是标准的 Python 列表类型。然而,Numpy 非常擅长接受序列,而不是强制所有输入为 numpy.array 类型。
k
kmario23

以下是使用 numpy.ravel()numpy.array() 的更多方法,利用一维数组可以解压缩为普通元素的事实:

# we'll utilize the concept of unpacking
In [15]: (*a, *b)
Out[15]: (1, 2, 3, 5, 6)

# using `numpy.ravel()`
In [14]: np.ravel((*a, *b))
Out[14]: array([1, 2, 3, 5, 6])

# wrap the unpacked elements in `numpy.array()`
In [16]: np.array((*a, *b))
Out[16]: array([1, 2, 3, 5, 6])

P
Pe Dro

来自 numpy docs 的更多事实:

语法为 numpy.concatenate((a1, a2, ...), axis=0, out=None)

axis = 0 表示按行连接 axis = 1 表示按列连接

>>> a = np.array([[1, 2], [3, 4]])
>>> b = np.array([[5, 6]])

# Appending below last row
>>> np.concatenate((a, b), axis=0)
array([[1, 2],
       [3, 4],
       [5, 6]])

# Appending after last column
>>> np.concatenate((a, b.T), axis=1)    # Notice the transpose
array([[1, 2, 5],
       [3, 4, 6]])

# Flattening the final array
>>> np.concatenate((a, b), axis=None)
array([1, 2, 3, 4, 5, 6])

我希望它有帮助!