numpy中的matrix和array
Preface
在相关聚类算法的实现过程中,用python语言实现,会经常出现array和matrix的混淆,这里做个总结。
array数组
numpy中最基本(默认)的类型是array,他的相关操作都是按元素操作的即用作数值计算当中(按元素操作有+,-,,/,*等)。相乘举例:
from numpy import *
>>> a=array([1,2])
>>> a
array([1, 2])
>>> b=array([2,3])
>>> b
array([2, 3])
>>> c=a*b
>>> c
array([2, 6])
>>> dot(a,b)
8
两个array的相乘*指的是对应元素的相乘;两个array的dot表示矩阵的相乘。
- 若a是array,则a.T表示转置。
把array转换为matrix用asmatrix()
多数numpy函数返回的是array类型,不是matrix类型。
matrix矩阵
在numpy中的特殊类型,是作为array的子类出现,所以继承了array的所有特性并且有自己的特殊的地方,专门用来处理线性代数操作(*表示矩阵的相乘,但是对于两个matrix的除/则表示对应元素的相除。)。乘法举例如:
“
`
>>> m=mat([2,3])
>>> m
matrix([[2, 3]])
>>> n=([1,2])
>>> n
[1, 2]
>>> p=m*n
Traceback (most recent call last):
File "<stdin>", line 1, in <module>
File "C:\Python27\lib\site-packages\numpy\matrixlib\defmatrix.py", line 341, i
n __mul__
return N.dot(self, asmatrix(other))
ValueError: objects are not aligned
>>> dot(m,n)
matrix([[8]])
>>> multiply(m,n)
matrix([[2,6]])
** 两个matrix相乘*错误原因是m的列不等于n的行,也即不对齐(aligned),若对齐了,则是对应元素的相乘,返回一个matrix;两个matrix的*表示是两个矩阵的相乘。两个matrix的dot表示矩阵相乘。两个matrix的multiply表示对应元素的相乘。**
- matrix中.H,.A,.I表示共轭,转置,逆矩阵。
- 把matrix转换为array用asarray()
- asanyarray()根据和你的输入的类型保持一致。
## array和matrix的一个很难理解的点 ##
这里会涉及到rank的概念,在线性代数(math)rank表示秩,但是必须明确的是在numpy里rank不是表示秩的概念,是表示维数的概念,这个理解的话需要看此文章:对于多维arrays的数据结构解释:
[多维arrays数据结构理解][1]
这里暂时理解为秩,虽然这样理解是错误的,但是可以说的通一些事情。(在实际的array和matrix里,英文里介绍的关于rank就用线性代数的秩来理解,但是英文会出现dimensions等于多少等,要求matrix的dimesions必须为2,这里其实指的就是秩,dimensions才是在numpy里的真实的理解形式)
array要求秩为1(N*1,1*N等)或者大于2
matrix要求秩必须为2(rank必须为2)
- 下面是关于ndim和size的理解:
>>> a
array([1, 2])
>>> b
array([[1, 2],
[2, 3]])
>>> c
matrix([[1, 2, 3, 4],
[2, 3, 4, 5]])
>>> d
array([[1, 2, 3, 4],
[2, 3, 4, 5]])
>>> e
matrix([[1, 2, 3, 4],
[2, 3, 4, 5],
[3, 4, 5, 6]])
>>> a.size
2
>>> a.ndim
1
>>> b.size
4
>>> b.ndim
2
>>> c.size
8
>>> c.ndim
2
>>> d.size
8
>>> d.ndim
2
>>> e.ndim
2
>>>e.size
12
**这里ndim就是求的是rank,所以会发现matrix的都是2,但是array的就会存在差异,需要计算等。size返回的是元素的个数**
- 关于dim, shape, rank, dimension and axis in numpy的细节的问题理解:
[stackoverflow地址][2]
## 补充 ##
如何让
M = matrix([1, 2, 3, [4]])
如何转变为
array([1, 2, 3, 4])
比较优雅的办法:
x=matrix(arange(12).reshape((3,4)))
x
matrix([[ 0, 1, 2, 3],
[ 4, 5, 6, 7],
[ 8, 9, 10, 11]])
x.getA1()
array([ 0, 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11])
“`
总结
在运用中,还是用array好点,array的唯一缺陷就是在表示矩阵的相乘时候,要用dot,而不是*。
关于numpy里的array和matrix的其余的操作函数,另见wiki地址:http://wiki.scipy.org/NumPy_for_Matlab_Users