数缺形时少直观,形少数时难入微;数形结合百般好,隔离分家万事休。——华罗庚
在学习线性代数时,常常在二维和三维空间中想象,将事半功倍。——Terrence
向量
作为线性代数学科的基础,向量是我们的重要研究对象。与标量不同,向量具有长度和方向两个性质(标量只有大小),因此我们很容易就可以想到,用一个二元组(长度,方向),来表示一个特定的向量,这样做毫无问题,可是却不便于我们的计算。由于特定的向量无关与其起始位置,所以我们常用当向量起于坐标原点时,其终点的坐标,来表示一个特定的向量,为了区别于单纯坐标,通常我们将终点坐标的各个元素从上到下竖着排列,也称“列向量”,常用$\alpha$表示。
矩阵
从形式上来看,矩阵似乎不过是一些具有特定位置信息的标量(数字),不过,最好不要把一个矩阵的每个元素看成是单独的个体,正如之前所说,向量是线性代数整个学科的基础,其原子性时刻提醒我们:向量不可再分。所以我们应该将矩阵看作多个向量的组合,即向量组。特殊的,当一个矩阵是方阵时,我们还可以将其看作为一种线性变换,下面分别来看:
向量组
将多个向量,放在一起写做$[\alpha_1,\alpha_2,…\alpha_n]$,就成为了向量组矩阵,由于此时向量的维数并不一定等于组中向量的个数,所以该终矩阵可以是任意形状的,同时也不排除其是方阵的可能。由于此时矩阵就是向量组,所以二者的各种性质息息相关。
线性表示
当多个向量放在一起,我们就可以通过两个基本运算:数乘与相加,将其组中各向量进行线性组合,从而得到其他向量,而这个过程被称为线性表示,如果由向量组$(\alpha_1,\alpha_2,…\alpha_n)$通过线性组合能够得到$\beta$,我们就称$\beta$能够由$(\alpha_1,\alpha_2,…\alpha_n)$线性表出。转化为“矩阵语言”就是,存在一组系数$x_1,x_2,…x_n$,使得:
如果要用一个向量组去表示另一个向量组,则需要一个系数矩阵$A$,使得:
此时我们可知,所有的$\beta$都在向量组$\alpha$所张成的线性空间中,而通过研究这个矩阵$A$,有时我们也可以获得$\beta$是否线性相关等性质。
线性相关
当向量组中某个向量能够被其他向量线性表示,我们称之为线性相关。严格的,我们将其定义为:
从空间的角度理解,就是向量组中的某个向量,落在了其他向量所张成的空间中。在研究这种性质时,有一个十分重要的方法就是:将各个列向量组成矩阵,做行变换对其化简,通过研究化简后的矩阵来研究各向量的线性关系。这是因为,当矩阵中,出现很多$0$时,我们很容易就能看出哪些向量之间能够线性表示。
比如,我们常将其化为行阶梯矩阵来判断向量组的秩并寻找极大无关向量组。
向量组张成的空间
向量组所能线性表示的所有向量,就构成了这个向量组所张成的空间,这个空间的维数就是该向量组的秩,同时秩也是这个向量组极大无关向量组中向量的个数。
并且只有在两个向量组张成的空间是同一个空间时,我们才说两个向量组等价。通常,我们也说需要“三秩相等”,即:
线性变化
根据b站上广受好评的视频:线性代数的本质,我们可以想象,一个矩阵就是对空间及空间中向量一种线性变换。
不过我更喜欢这样思考,设有一种线性变换,我们称它为$甲$变换,由于“变换”是一个抽象的概念,为了能让这种抽象具体化,我们将这种变换应用于一个单位矩阵上,我们就可以得到单位矩阵经过这种变换后的模样,即$AE$。又因$E$作为单位元可消去,所以我们就可以用$A$这种具体的矩阵来表示$甲$变换。同理,一个“向量”也是抽象的,我们只是用其是在标准基(即单位矩阵)下的坐标来表示,通常我们也会省略单位矩阵。
可能在许多读者看来,如此思考多此一举,但在许多情况下,我们将消去的$E$还原回来,一个表达式所代表的含义就一目了然了。
与向量组不同的时,两个矩阵等价(这里的矩阵指线性变换),我们只要求他们的秩相等即可,而不要求“三秩相等”。
方阵的运算
转置矩阵
将矩阵中的元素沿主对角线反转,就得到了其转置矩阵。
逆矩阵
将矩阵作为一种线性变换,其逆变换就是其逆矩阵,所以有:
伴随矩阵
在求逆矩阵的过程中,一个中间产物,即矩阵各元素代数余子式矩阵的转置,由于其有一些特殊性质,我们将其命名为“伴随矩阵”。事实上,其不过逆矩阵的数乘:
所以在研究其性质时,可以直接研究逆矩阵的性质,再计算其与逆矩阵的数乘关系即可。
运算法则
值得注意的是,上述三种运算都是作用于一个矩阵的(单目运算),因此我们可以将其想象为一个函数。
例如,”逆“可以是一个函数$f$,其作用于一个矩阵后,结果是该矩阵的逆矩阵,即:$f(A) = A^{-1}$
以上提的三种运算(转置、逆、伴随),作用顺序不影响结果:
例如:$(A^{-1})^{T} = (A^{T})^{-1}$
而矩阵乘法不满足交换率,所以有“穿脱原则”:
例如:$(AB)^{-1}=B^{-1}A^{-1}$
虽然矩阵加法满足交换率,但两个矩阵即使可逆(伴随),他们的和也不一定可逆(伴随),所以只有:
$(A+B)^{T}=A^T+B^T$
至于交换率,我们可以说,只有在乘法结果是单位矩阵的数乘时才满足,即:
若$AB=kE$ 则,$AB=BA$