numpy数组拼接简单示例

(编辑：jimmy 日期: 2024/11/20 浏览：3 次 )

NumPy数组是一个多维数组对象，称为ndarray。其由两部分组成：

·实际的数据

·描述这些数据的元数据

大部分操作仅针对于元数据，而不改变底层实际的数据。

关于NumPy数组有几点必需了解的：

·NumPy数组的下标从0开始。

·同一个NumPy数组中所有元素的类型必须是相同的。

NumPy数组属性

在详细介绍NumPy数组之前。先详细介绍下NumPy数组的基本属性。NumPy数组的维数称为秩（rank），一维数组的秩为1，二维数组的秩为2，以此类推。在NumPy中，每一个线性的数组称为是一个轴（axes），秩其实是描述轴的数量。比如说，二维数组相当于是两个一维数组，其中第一个一维数组中每个元素又是一个一维数组。所以一维数组就是NumPy中的轴（axes），第一个轴相当于是底层数组，第二个轴是底层数组里的数组。而轴的数量——秩，就是数组的维数。

NumPy的数组中比较重要ndarray对象属性有：

1.ndarray.ndim：数组的维数（即数组轴的个数），等于秩。最常见的为二维数组（矩阵）。

2.ndarray.shape：数组的维度。为一个表示数组在每个维度上大小的整数元组。例如二维数组中，表示数组的“行数”和“列数”。ndarray.shape返回一个元组，这个元组的长度就是维度的数目，即ndim属性。

3.ndarray.size：数组元素的总个数，等于shape属性中元组元素的乘积。

4.ndarray.dtype：表示数组中元素类型的对象，可使用标准的Python类型创建或指定dtype。另外也可使用前一篇文章中介绍的NumPy提供的数据类型。

5.ndarray.itemsize：数组中每个元素的字节大小。例如，一个元素类型为float64的数组itemsiz属性值为8(float64占用64个bits，每个字节长度为8，所以64/8，占用8个字节），又如，一个元素类型为complex32的数组item属性为4（32/8）。

6.ndarray.data：包含实际数组元素的缓冲区，由于一般通过数组的索引获取元素，所以通常不需要使用这个属性。

数组拼接方法一

思路：首先将数组转成列表，然后利用列表的拼接函数append()、extend()等进行拼接处理，最后将列表转成数组。

示例1：

> import numpy as np
> a=np.array([1,2,5])
> b=np.array([10,12,15])
> a_list=list(a)
> b_list=list(b)
> a_list.extend(b_list)
> a_list
[1, 2, 5, 10, 12, 15]
> a=np.array(a_list)
> a
array([ 1, 2, 5, 10, 12, 15])

该方法只适用于简单的一维数组拼接，由于转换过程很耗时间，对于大量数据的拼接一般不建议使用。

数组拼接方法二

思路：numpy提供了numpy.append(arr,values,axis=None)函数。对于参数规定，要么一个数组和一个数值；要么两个数组，不能三个及以上数组直接append拼接。append函数返回的始终是一个一维数组。

示例2：

> a=np.arange(5)
> a
array([0, 1, 2, 3, 4])
> np.append(a,10)
array([ 0, 1, 2, 3, 4, 10])
> a
array([0, 1, 2, 3, 4])
 
> b=np.array([11,22,33])
> b
array([11, 22, 33])
> np.append(a,b)
array([ 0, 1, 2, 3, 4, 11, 22, 33])
 
> a
array([[1, 2, 3],
    [4, 5, 6]])
> b=np.array([[7,8,9],[10,11,12]])
> b
array([[ 7, 8, 9],
    [10, 11, 12]])
> np.append(a,b)
array([ 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12])

numpy的数组没有动态改变大小的功能，numpy.append()函数每次都会重新分配整个数组，并把原来的数组复制到新数组中。

数组拼接方法三

思路：numpy提供了numpy.concatenate((a1,a2,...),axis=0)函数。能够一次完成多个数组的拼接。其中a1,a2,...是数组类型的参数

示例3：

> a=np.array([1,2,3])
> b=np.array([11,22,33])
> c=np.array([44,55,66])
> np.concatenate((a,b,c),axis=0) # 默认情况下，axis=0可以不写
array([ 1, 2, 3, 11, 22, 33, 44, 55, 66]) #对于一维数组拼接，axis的值不影响最后的结果
 
> a=np.array([[1,2,3],[4,5,6]])
> b=np.array([[11,21,31],[7,8,9]])
> np.concatenate((a,b),axis=0)
array([[ 1, 2, 3],
    [ 4, 5, 6],
    [11, 21, 31],
    [ 7, 8, 9]])
> np.concatenate((a,b),axis=1) #axis=1表示对应行的数组进行拼接
array([[ 1, 2, 3, 11, 21, 31],
    [ 4, 5, 6, 7, 8, 9]])

对numpy.append()和numpy.concatenate()两个函数的运行时间进行比较

示例4：

> from time import clock as now
> a=np.arange(9999)
> b=np.arange(9999)
> time1=now()
> c=np.append(a,b)
> time2=now()
> print time2-time1
28.2316728446
> a=np.arange(9999)
> b=np.arange(9999)
> time1=now()
> c=np.concatenate((a,b),axis=0)
> time2=now()
> print time2-time1
20.3934997107

可知，concatenate()效率更高，适合大规模的数据拼接

总结

以上就是本文关于numpy数组拼接简单示例的全部内容，希望对大家有所帮助。感兴趣的朋友可以继续参阅本站：

浅谈numpy数组的几种排序方式

Python编程给numpy矩阵添加一列方法示例

Python numpy生成矩阵、串联矩阵代码分享

如有不足之处，欢迎留言指出。感谢朋友们对本站的支持！

上一篇：神经网络理论基础及Python实现详解
下一篇：浅谈机器学习需要的了解的十大算法