![机器学习数学基础](https://wfqqreader-1252317822.image.myqcloud.com/cover/482/43738482/b_43738482.jpg)
2.2.2 线性映射
在2.2.1节中解释函数的时候,曾经说它是非空集合之间的对应法则,诸如等,都是这句话的具体表现形式。这是用集合论的观点看待函数,还可以称之为映射。
定义 设两个非空集合与
间存在着对应关系
,而且对于
中的每一个元素
,
中总有唯一的一个元素
与之对应,这种对应称为从
到
的映射(map),记作
。
其中,称为元素
在映射
下的像,
称为
关于映射
的原像。
上面的定义,可以用图2-2-3直观地表示。
![](https://epubservercos.yuewen.com/39156C/23020656909779806/epubprivate/OEBPS/Images/txt002_307.jpg?sign=1739274519-o88mv4x7uL89Bg6klytVD0mymKIsZuKF-0-99902dbd7ea3db92028615c2bc3da4ab)
图2-2-3
例如,有向量,经过映射
,得到了向量
,并且所有输入向量和输出向量各自形成一个集合。这个映射,可以用类似于函数的形式写成:
![](https://epubservercos.yuewen.com/39156C/23020656909779806/epubprivate/OEBPS/Images/txt002_311.jpg?sign=1739274519-XyflHCmgjKr5K32VPX5yIBRmB4LcP96u-0-9f2aa7e5d4f842d1b14777bbe25005cd)
(2.2.3)
之所以能够如此表示,是因为函数本质上也是一种映射,只不过在线性代数之前的函数,多数是的映射,现在,将它推广到了
的映射。表2-2-1列出了初等代数中函数概念向线性代数中映射的推广。
表2-2-1
![](https://epubservercos.yuewen.com/39156C/23020656909779806/epubprivate/OEBPS/Images/txt002_314.jpg?sign=1739274519-oZOew6OdZgS93Pm0nAGngSotGcsdxKfs-0-930724374a428f6088a13f1e307e5281)
表2-2-1中有些关于矩阵的概念会在后续内容中逐一介绍。
因为映射是函数的推广,并且形式雷同,我们就大胆地根据第2章2.2.1节对线性函数的定义来操作(2.2.3)式,看看结果如何。
![](https://epubservercos.yuewen.com/39156C/23020656909779806/epubprivate/OEBPS/Images/txt002_315.jpg?sign=1739274519-lEg4KLZ4axmr4uE61vu14leAPVEHdJPc-0-0838fdd0a355ef8e908297cbd42c57d9)
由上述计算结果不难得知:(2.2.3)式居然符合前述线性函数的规定,只是我们这里说的是映射,所以就称之为线性映射(Linear Map)。
定义 设和
是实数域上的两个向量空间,
到
的一个映射T如果具有加法和数量乘法运算,即:
![](https://epubservercos.yuewen.com/39156C/23020656909779806/epubprivate/OEBPS/Images/txt002_320.jpg?sign=1739274519-ahrdi4IiRwSp4gU7w9ZkgAxJN3hnkffP-0-51740ddfc6a5502095de0899fe866eee)
![](https://epubservercos.yuewen.com/39156C/23020656909779806/epubprivate/OEBPS/Images/txt002_321.jpg?sign=1739274519-nYHEBCmUkssb4Cfgqesp6sh88kqMfd2v-0-73b84bf9a6d8f700406eb834b6b7040e)
则称是
到
的一个线性映射。
继续考查(2.2.3)式,可以将它写成:
![](https://epubservercos.yuewen.com/39156C/23020656909779806/epubprivate/OEBPS/Images/txt002_325.jpg?sign=1739274519-kzJXEChe9f8647kXGYtN0L4qHsEBaxaG-0-a54216bfad71bc6dc87c3ee86ab8454e)
(2.2.4)
由此,我们可以看到,如果一个线性映射的输入是向量,并将这个线性映射用矩阵
表示,那么,用矩阵乘以输入向量(
)就得到了此线性映射的输出
。这个过程可以记作:
。也就是现在我们发现,可以用矩阵表示线性映射。
但是,还要谨慎地考查,如果用矩阵表示了线性映射,是否还符合前述线性映射定义中的加法和数量乘法封闭的要求?
容易验证:
![](https://epubservercos.yuewen.com/39156C/23020656909779806/epubprivate/OEBPS/Images/txt002_331.jpg?sign=1739274519-LV40QRgsXRakb5mhusSyuCM3IQNAEtIX-0-a3f67dc248071c46648b8c8f03795b64)
![](https://epubservercos.yuewen.com/39156C/23020656909779806/epubprivate/OEBPS/Images/txt002_332.jpg?sign=1739274519-TmPIXnk3ec6YzCsSyhszGdJKIBKY7boO-0-cecd6869c16916f30f60afa1d96a0ce4)
依然符合线性映射定义。
再比如线性映射,用矩阵表示,可以写成:
![](https://epubservercos.yuewen.com/39156C/23020656909779806/epubprivate/OEBPS/Images/txt002_334.jpg?sign=1739274519-hZ5K4sFhzuoeZb0tav9wgKblXgKpSsiF-0-b6ca7dbb622b4cef5454907277fc8ea5)
(2.2.5)
如果三维向量空间中的向量是,那么经过线性映射之后,
,就得到了二维向量空间中的一个向量(如图2-2-4所示),用符号表示为:
。
![](https://epubservercos.yuewen.com/39156C/23020656909779806/epubprivate/OEBPS/Images/txt002_338.jpg?sign=1739274519-haX75dFWleBaDtB47kj3Jr6OBI5jvKme-0-32687787b8be394d6498005888f31a23)
图2-2-4
第1章1.3.2节中的坐标变换公式(),表示的是在同一个向量空间中,某个向量在不同基下坐标之间的关系。现在用线性映射的概念来理解此公式,即向量在同一向量空间不同基下的映射。
例如:二维向量空间中的向量,在映射
下:
![](https://epubservercos.yuewen.com/39156C/23020656909779806/epubprivate/OEBPS/Images/txt002_342.jpg?sign=1739274519-GLFY9rgFQ0JFspQ4KpoA5MqfaCFOuPkk-0-cf51bf2270681f96a18760b99cd6e645)
对上面的计算过程,可以有两种理解方式:
● 按照坐标变换的思路,可以理解为将向量在标准基下的坐标
变换为另外一个基
下的坐标
。这是第1章1.3.2节已经阐述过的。
● 如图2-2-5所示,标准基构建的坐标系中,向量
经过映射
变换为向量
,即相对
轴的对称变换。
![](https://epubservercos.yuewen.com/39156C/23020656909779806/epubprivate/OEBPS/Images/txt002_352.jpg?sign=1739274519-3u4Boe0xzHjwbD7uPHEO8OKvgvlfN0kk-0-fce1f7e76a6d15ca43aab86ab8461275)
图2-2-5
第一种理解从基的角度,向量“客观不变”,变换的是在不同基下的坐标——正所谓“横看成岭侧成峰”;第二种理解则认为坐标系固定,因映射而使向量变换——正所谓“物换星移几度秋”。二者殊途同归。
在前面的几个示例中,有的线性映射发生在不同向量空间,有的则发生在同一个向量空间内。对于在同一向量空间发生的线性映射,常称为线性变换(注意:“线性映射”和“线性变换”这两个术语,不同作者有不同的理解。有的认为线性映射是不同向量空间之间的映射,线性变换是同一向量空间内的映射;有的认为两个术语是同义语,可以互换。本书在行文中采用前一种说法)。