矩阵方程$Ax=b$的初步理解.

对于矩阵方程 $A\textbf{\textit{x}}=\textbf{\textit{b}}$ ，可能就是一学而过，也可能也就会做做题，但是从如何直观地理解它呢?
这个等式可以用多种理解方式，这里就从向量变换角度浅谈一下。其中的 $A$ 是矩阵，可以理解为变换系数，而对于 $\textbf{\textit{x}}$ 和 $\textbf{\textit{b}}$ 而言，则是向量.向量 $\textbf{\textit{x}}$ 经过矩阵 $A$ 的变换，变成了向量 $\textbf{\textit{b}}$ ，这是最简单直观的理解。可是要深入剖析，就需要深入理解向量。下面的内容是我昨天解决了之前关于向量的一个困惑点，今天早上又思考了一下矩阵方程 $A\textbf{\textit{x}}=\textbf{\textit{b}}$ 切实意义后写出来的，很新鲜，但是缺少图片讲解。当然，下面分析只是我深入理解线性代数的学习过程，出现错误在所难免，仅供参考.
在此之前，先说一说向量方面的困惑点。高中时期做题，对于 $\overrightarrow{AB}$ 而言，求解其向量坐标的方法就是 $B$ 点坐标减去 $A$ 点坐标，然后得到了一个类似点坐标的坐标，其实就是向量坐标。当时只知道这么去做，但是这么去做的原因并不清楚。深入理解需要从物理中位移矢量角度讲解比较好，但这里就不涉及了。
昨天看书的时候，又看到了向量方程的定义，摘要到下面。

$\mathbb{R}^2$ 中的向量
仅含一列的矩阵成为列向量，或简称向量。包含两个元素的向量如下所示.
$\textbf{\textit{u}}= \begin{bmatrix} \begin{align*} &3\\ -&1 \end{align*} \end{bmatrix} , \textbf{\textit{v}}= \begin{bmatrix} \begin{align*} &0.2\\ -&0.3 \end{align*} \end{bmatrix} , \textbf{\textit{w}}= \begin{bmatrix} \begin{align*} &w_1\\ &w_2 \end{align*} \end{bmatrix}$
其中 $w_1$ , $w_2$ 表示任意实数.所有两个元素的向量的集记为 $\mathbb{R}^2$ ， $\mathbb{R}$ 表示向量中的元素是实数，而指数 $2$ 表示每个向量包含两个元素。

深入理解加黄的这句话之前，先说一说我所了解的知识.之前学概率论的时候，又重新学习了集合相关内容.集合中有 $\mathbb{R}^n$ 的表述方式，而单单讨论集合中的 $\mathbb{R}$ 的话，就代表实数域，高中时期就学过，不过当时 $\textbf{R}$ 表示的，而大学书中，经常用 $\mathbb{R}$ 来表示，其实是一样的(至少目前我是这么认为的)。大学学概率论分析集合的时候，有了一种突破性见解，就是集合可以抽象成坐标系。所以对于实数域 $\mathbb{R}$ 而言，可以直接抽象成 $x$ 轴，如果增加一个维度，则对于平面 $\mathbb{R}^2$ 来说，其含义是 $\mathbb{R}\times\mathbb{R}$ ，也就是两个实数域 $\mathbb{R}$ 的笛卡尔积(笛卡尔积是在离散数学中学的，但当时不知道有什么应用，后来才知道，在组建坐标系的时候很有用处，如果不清楚笛卡尔积的话可以去了解一下)。如果我们将两个 $\mathbb{R}$ 分别对应 $x 、 y$ 轴,那么对于笛卡尔坐标系，在平面中其点坐标实际上就是 $x 、 y$ 轴对应点( $x$ , $y$ )(也就是对应实数域集合中的笛卡尔积)。其实深入理解，还需要再去说函数、映射等等，这并不在今天的讨论中。如果看不懂上面说的，只需要知道，实数域集合可以抽象成坐标轴就行。
在此基础之上，我们再来看看概念中加黄的话 $\mathbb{R}$ 表示向量中的元素是实数，而指数 $2$ 表示每个向量包含两个元素。如果按照之前的抽象，这里其实可以将坐标轴中的 $x 、 y$ 轴抽象成向量(思考一下，我们画坐标轴的时候，总会在 $x 、 y$ 的正方向画个箭头，不就代表着方向吗？)。为了方便，我们就仅讨论正交的笛卡尔坐标系。
笛卡尔坐标系下的任意一点坐标，可以用两种方法解释，第一种就是上述概率论中，将实数域集合抽象成坐标轴，然后坐标轴上所有的 $x, y$ 点，通过笛卡尔积的计算方式，建立起笛卡尔坐标系中所有的点坐标.整个平面是通过一个一个点组合而成的。注意，我们之前强调了是实数域，包括所有有理数和无理数，所有点的组合就是完整平面。
另一个解释方法就是将坐标系抽象成向量，为了方便讲解向量构成的平面，这里默认向量的起点是坐标轴原点，沿 $x, y$ 正方向规定向量方向为正，负方向则规定方向为负。所以，此时坐标轴上，并不会再用集合中点的笛卡尔积的方式构建平面了，而是采用基础的向量的加法、减法方式构建。我们先来看 $x$ 轴上的点 $A$ 所组成的向量 $\overrightarrow{OA}$ ，由于起点为原点，所以向量的 $x$ 坐标就是以其终点 $A$ 的 $x$ 坐标为主，这么来看的话，其实在 $x$ 轴上，可以任意伸缩的向量 $\overrightarrow{OA}$ 的向量坐标，其实就是 $A$ 的 $x$ 坐标，这么来看，将原点默认为向量起点的话，可以将复杂的向量问题转化为点的问题。那么平面中任意一点 $B$ 的点坐标，可以通过其与坐标原点 $O$ 组成的向量 $\overrightarrow{OB}$ 分解，分解为沿 $x, y$ 轴方向的子向量 $\overrightarrow{OB_X}$ 和 $\overrightarrow{OB_y}$ ，由于笛卡尔坐标系是正交系，所以对应的 $x 、 y$ 值所组成的数值对 $(x, y)$ 就是 $\overrightarrow{OB}$ 的向量坐标，而由于其起点为原点，所以向量坐标就是 $B$ 点坐标。加黄话中强调了元素是实数，所以对于平面中所有的点，都能通过这种方式构建，自然组成了 $\mathbb{R}^2$ 平面。(对于 $\mathbb{R}^2$ 具体解释，由于参考资料有限，我也不清楚具体细节，只能从简思考)
通过上面解释，我们知道了，从向量角度构建的坐标系，以坐标原点为向量起点的好处。但不过，并没有解释为何 $\overrightarrow{OA}$ 的向量坐标是以 $A$ 点坐标减 $O$ 点坐标，一开始也说了"深入理解需要从物理中位移矢量角度讲解比较好，但这里就不涉及了。 "，所以具体原因自己查阅。那么如何解释 $\overrightarrow{AB}$ 形成原因呢？从分解角度来讲，我们仍然可以将 $\overrightarrow{AB}$ 分解到 $x 、 y$ 轴上，然后做简单的加减运算就好。另一方面，我们也可以将其与坐标原点建立起来关系，就是 $\overrightarrow{AB}=\overrightarrow{OB}-\overrightarrow{OA}$ ，然后再按照我们上述的基础分解角度，再通过简单加减运算，也就得到了 $\overrightarrow{AB}$ 的向量坐标了.当然，我们也可以将默认的向量起点坐标原点换成 $A$ 点，这样也就能直接解释了。
上面的内容就是我昨天明白了的内容，这也只是深入线性代数的基础。在此基础上，再来说说今天明白了的 $A\textbf{\textit{x}}=\textbf{\textit{b}}$ 。
还是先从线性方程组入手说明。对于初中的二元一次方程组
$\left\{\begin{matrix} \begin{align*} x+y&=1\\ 2x+y&=3 \end{align*} \end{matrix}\right.$
可以很容易地解出来，而且也可通过图像直观地看出来，其解为对应直线的交点。当然，图像所对应的坐标系是集合所组成的笛卡尔坐标系。那么我们可否直接将其中的 $x 、 y$ 视为向量，从而获得其向量组成的笛卡尔坐标系下的图像呢？我们来分析一下。如果 $x 、 y$ 是向量，那么向量加向量，肯定也等于向量，但不幸的是，等号右侧是一个数，标量，并不是向量。但不过可以通过一种巧妙的方式，将其转化为向量，也就是 $A\textbf{\textit{x}}=\textbf{\textit{b}}$ 的方式。其中 $A$ 是系数矩阵，也就是
$\begin{bmatrix} 1 & 1 \\ 2 & 1 \\ \end{bmatrix}$
而变量 $x, y$ 用向量方式表示
$\begin{bmatrix} \textbf{\textit{x}}\\ \textbf{\textit{y}}\\ \end{bmatrix}$
等号右侧也为向量
$\begin{bmatrix} 1 \\ 3\\ \end{bmatrix}$

综合来看的话，就是
$\begin{bmatrix} 1 & 1 \\ 2 & 1 \\ \end{bmatrix} \begin{bmatrix} \textbf{\textit{x}}\\ \textbf{\textit{y}}\\ \end{bmatrix}= \begin{bmatrix} 1 \\ 3\\ \end{bmatrix}$
这是显而易见的，因为书上就是这么讲的。而一开始我所讲解的向量的理解，这里向量坐标 $(\textbf{\textit{x}},\textbf{\textit{y}})'$ (这里的 $^{'}$ 是转置的意思，也就是将列向量变为行向量，这里是为了与上面表达一致)，其实就是 $\mathbb{R}^2$ 向量空间中，以原点为起点，坐标为 $(x, y)$ 的点所组成的向量(这里应该贴个图片，方便理解，但是没有制作)，自然，向量坐标 $(1, 3)^{'}$ 则是原点与点坐标 $(1, 3)$ 所组成的向量。向量 $(\textbf{\textit{x}},\textbf{\textit{y}})'$ 经过矩阵 $A$ 的系列作用，变成了向量 $(1, 3)^{'}$ ，由于起点是坐标原点，其实也就是将集合域笛卡尔坐标系下的点 $(x, y)$ ，经过一定的变换，变成了点 $(1, 3)$ 。其实也可以分解向量 $(\textbf{\textit{x}},\textbf{\textit{y}})'$ 到 $x, y$ 轴上，分析矩阵 $A$ 对子向量 $(\textbf{\textit{x}},\textbf{\textit{0}})'$ 和 $(\textbf{\textit{0}},\textbf{\textit{y}})'$ 的作用，其作用后的子向量，叠加后一定是 $(1, 3)^{'}$ 。
明白了上述问题，对于学习线性代数，或许会有很大很大的帮助。思考维度增加，见解也就不同。但是想要深入理解线性代数，单纯看些文章、博客肯定是远远不够的，需要很多的积累，而且必须有自己独立的思考。每个人学习层次、掌握的知识不同，理解线性代数的方式、方法肯定也不同。上面我写的内容也仅限于我自己的理解，肯定也会有误，但是否适合你，我也不清楚，所以最后想要真正理解线性代数，还是需要考你自己。
通过图片形式表示的方式更加直观，但确实没太有时间制作。据说mit的线性代数Strang教师对 $A\textbf{\textit{x}}=\textbf{\textit{b}}$ 有独到见解，不过我没听过，大家有机会可以去看看他的理解。