APP下载

人工智能基础-矩阵的基本几何意义

消息来源:baojiabao.com 作者: 发布时间:2024-05-05

报价宝综合消息人工智能基础-矩阵的基本几何意义

1.行列式的几何意义

一个方阵

的行列式的绝对值是其行向量或列向量所张成的平行几何体的空间积,对于二阶行列式,就是向量张成的平行四边形的面积,对于三阶行列式,就是对应平行六面体的体积;如方阵

的行列式绝对值为27,它就是下图平行四边形的面积

2.克拉默法则的几何意义

以二维形式为例来说明其几何意义:

方程Ax=b,设A=

,b=

,待求的x=

将A的两个列向量分别表示为a1,a2,那么原方程可表示为x1a1+x2a2=b,这样可以把x1与x2看作是列向量a1,a2的伸缩因子,经过伸缩后再叠加即得到和向量b,故原方程可以看作已知列向量被伸缩并叠加后的向量b,求伸缩因子x我们已经知道行列式的几何意义,显然矩阵A对应的平行四边形的面积就是|A|(这里以带符号的有方向面积表示,因为伸缩因子也是有符号的),当某一个向量被伸缩后,如图将OB边伸长至OE,形成新的平行四边形OAFE,记其面积为

,这样a1的伸缩因子x1可表示为

显然只要求出OAFE的面积即可解出未知量;

图中OG即向量b,因为它是x1a1,x2a2的线性叠加,所以G点必在EF的延长线上,这样OG和OE相对OA边的高就是相同的,故OA与OG组成的平行四边形面积和OAFE相同,即所求面积为|b a2|,所以可求得x1=|b a2|/|A|,同理可得x2=|a1 b|/|A|,可以看出此表示式和克拉默法则等价

3.矩阵乘法的几何意义

我们知道矩阵是由若干向量组成的,因此可自然地把矩阵乘法看作是两个矩阵的同维向量之间做内积(或点乘),而内积的意义是两向量同向投影的乘积,但这只是一个表面的几何含义,比较抽象(也有应用之处,后面会提到);实际上,对于矩阵乘法C=AB,作用后得到的新矩阵C可以看作是矩阵A经过某种变换得到的,也可以看作是矩阵B经过某种变换后得到的,而这种变换显然就是乘以另一个矩阵的过程,结合前面提到的矩阵的几何意义,故可以把矩阵乘法C=AB看作是图形A(或B)经过变换B(或A)后得到新图形C,或者是向量空间A(或B)经过变换B(或A)后得到新的向量空间C,对于简单的变换矩阵这一点最容易感性体会到;例如变换矩阵

会把原3D图形向x-y面投影,变换矩阵

会把原图形对x轴映象,变换矩阵会把原图形对x轴映象,变换矩阵

会把原2D图形相对原点逆时针旋转30度。

4.初等变换的几何意义由前面叙述的部分几何意义

我们很快就能看出初等变换的几何含义了

交换矩阵的两行(列):改变向量在矩阵中的排列顺序,当矩阵表示图形时,此操作对图形没有影响,因而矩阵张成的空间维数(秩)不变,但是当矩阵代表向量空间时,会改变此座标系的手性,当计算方阵的行列式时,会改变其符号;

以一个非零数k乘矩阵的某一行(列):即对矩阵中某一向量进行伸缩变换,整个矩阵代表的图形对应发生变化,由于k不能为0,所以矩阵张成空间的维数(秩)不变,方阵张成的平行几何体的空间积(行列式)变成原来的k倍

把矩阵的某一行(列)的k倍加于另一行(列)上:对矩阵中某一向量做线性叠加,且新向量终点总是在另一向量的平行线上,所以对任意矩阵,图形产生了剪下变形,由于剪下变形不会使向量重叠或缩为0,所以张成空间的维数也不变;对于方阵,由前面几何推导克拉默法则的过程知道,如果把某一向量加上矩阵内另一向量的k倍,由于新向量和原向量相对其余向量组成的平行体的高不变,所以方阵对应的平行几何体的空间积不变(行列式不变),

例如在matlab中用矩阵

作用下面左图对应的矩阵(第三行乘以0.2,即缩短z方向座标5倍),得到的新图形如下右图所示

Matlab程式如下,可以动手试一试,还可修改其中的变换矩阵以得到不同效果

x=0:0.1:5;

y=x

;[x y]=meshgrid(x,y); %构造网格z=sin(x).cos(y).x.y;

surf(x,y,z); %绘制原图形

x=reshape(x,2601,1);

y=reshape(y,2601,1);

z=reshape(z,2601,1);

m=[x y z]; %几何图形对应的n3矩阵

t=[1 0 0;0 1 0;0 0 0.2]; %变换矩阵

m=m*t; %进行变换

x=m(:,1);

y=m(:,2);

z=m(:,3);

x=reshape(x,51,51);

y=reshape(y,51,51);

z=reshape(z,51,51);

figure;

surf(x,y,z) %绘制变换后的图形

然后我们把变换矩阵修改为

即把第二行乘以2加到第一行,由上述分析知道这样会把原图形沿y方向剪下变形,剪下量为对应x座标的二倍,实际效果如下图所示,这里我们取俯视角以观察x-y面的情形,从右图可以看出理论分析是正确的(注意观察变换前后的y向座标值)

5.矩阵秩的几何意义

矩阵的秩即矩阵的各向量所张成空间的维数不能说秩是矩阵对应图形的维数,因为矩阵的图形只取了各向量的终点,而不含有这些向量的之间的几何关系,故二者的维数不一定相等,而矩阵的秩按定义应取其向量空间维数。如下图中的空间向量a,b,c可以张成一个三维空间,故矩阵(a b c)的秩为3,但是其终点组成的图形是一平面,维数为2,显然和秩是不一样的

结合上面对初等变换的几何解释,正是因为三种初等变换都不改变矩阵向量空间的维数,所以对于复杂的难以观察维数的矩阵,我们可以先用初等变换作用于矩阵进行简化,然后到容易观察的形式时求出它的秩;

6.向量组线性相关/无关的几何意义

注:在讨论向量张成的空间相关问题时,某种程度上我们可以把向量组和矩阵等价对待,二者都是一组向量的集合,只是向量组相对矩阵明确了向量的维数与向量个数,而矩阵有行与列两种选择,所以只要确定矩阵的向量取行还是列,就可以把矩阵当作向量组讨论;线性相关在代数上就是一组向量中至少有一个向量能用其余向量线性表示,而几何意义是它们所张成的向量空间维数少于这些向量的个数,这样就至少存在一个向量落在其余向量形成的向量空间中,而向量空间实际上是一个座标系统,所以处于其中的点(向量)都可以由这些向量定位出来(线性表示),在向量之间表现出一种相关性;而线性无关的几何意义就是一组向量张成空间的维数等于这些向量的个数,这样没有任何一个向量落在其余向量形成的空间里,每一个向量对其余向量来说都是超越自身空间维度的(独立的),因而无法被定位(线性表示),表现成一种相互无关性

以上图棱锥为例,因为HI处于GH和GI所形成的面里,所以HI必然可以由这两个向量表示,所以三者线性相关(三者形成的空间维数为2

7.方程Ax=0的几何意义

由前面叙述容易看出此方程表示向量x与A的每一个行向量都垂直,或者说向量x垂直于矩阵A的行向量空间。这样我们可以直接根据几何意义得到结论:Ax=0有非零解的充要条件是矩阵A的秩要小于x的维数n;这是因为对于确定维度的向量空间M,如果我们可以找出独立于它的一维或多维空间N,则在空间N里的向量总是垂直于空间M;例如在直角座标系O-xyz中,设A是x-y平面上的向量空间,x是空间向量,因为z维上的向量总是垂直于A,所以x在这一方向上存在无数非零解。反之若矩阵A的秩等于n,且x非零,则由于x也在n维空间内,所以它和A中的行向量必然线性相关,无法独立于A的行向量空间,所以这时仅有零解。

当方程有非零解时,设A的向量空间维数为R(秩),由上叙述可知解向量x中存在n-R个分量取值自由,如果我们把这n-R个自由变数看作是一个n-R维空间中的向量座标时,显然此空间中每一个向量都能确定原方程组的一个解,又因为每一个向量都可以用这个n-R维空间的一组单位正交基线性表示,所以这组单位正交向量所确定的一组解通过线性组合就可以表示出原方程的任意解,故这组解就是原方程的一个基础解系,上述叙述也正是基础解系的几何意义

8.方程Ax=b的几何意义

设A是m*n矩阵,x是n维向量,由前述几何意义知道,如果b处于A的向量空间中(b和A的向量线性相关),则一定可以由A的向量线性表示,也即解存在,而b落在A的向量空间等价于b的维数小于等于向量空间A的维数,也可表述为R(A)=R(A b)=R,即A的秩等于增广矩阵的秩,这种表达也是许多教科书中常用的。当R=n时,n维向量x的每个分量都是线性表示的确定系数,故只有唯一解,而R作者:Vieta_Qiu

连结:https://www.jianshu.com/p/d22051caeb6b

来源:简书

简书著作权归作者所有,任何形式的转载都请联络作者获得授权并注明出处。

2019-11-14 16:52:00

相关文章