![大模型时代的基础架构:大模型算力中心建设指南](https://wfqqreader-1252317822.image.myqcloud.com/cover/214/51090214/b_51090214.jpg)
上QQ阅读APP看本书,新人免费读10天
设备和账号都新为新人
1.3 一元线性回归算法剖析
一元线性回归算法,指的是根据平面上有限个离散的点,找出与这些点距离之和最小的直线。
有初中以上数学水平的读者可以很容易地回忆起来,在平面直角坐标系上,表示一条直线的方程是一次函数:
![](https://epubservercos.yuewen.com/4B3087/30122173303507506/epubprivate/OEBPS/Images/48123_23_1.jpg?sign=1739314583-hK3duippcv3OqbpMaUCzuJPSI6ucS58F-0-c5a0dd8465d25bcfe1dacb3c0b701299)
一次函数在平面直角坐标系上的图像如图1-2所示。
![](https://epubservercos.yuewen.com/4B3087/30122173303507506/epubprivate/OEBPS/Images/48123_23_2.jpg?sign=1739314583-G3OmrSjGN9i9PopOOD4FKPCBcEMIdp6X-0-da74322ff7a83f9918a0d2f8fe80d87c)
图1-2
可以看出,一次函数在平面直角坐标系上的图像为一条直线。如果在平面直角坐标系上有若干离散的点,那么我们也可以找出这些点所在的直线并得到对应的方程,或得到与这些点距离之和最小的直线对应的方程,如图1-3所示。
![](https://epubservercos.yuewen.com/4B3087/30122173303507506/epubprivate/OEBPS/Images/48123_24_1.jpg?sign=1739314583-WI7cqOS9amEeDAWaT1zgThglNvawNs68-0-d1e137105de684fed9b3c77430c78741)
图1-3
在图1-3中展示的直线,就是在平面直角坐标系中,与各离散点的距离之和最小的直线。
一元线性回归算法使用的核心算法为最小二乘法(Least Squares Method),下面对最小二乘法进行详细解释。
在平面直角坐标系上,假设有n个点,分别为
![](https://epubservercos.yuewen.com/4B3087/30122173303507506/epubprivate/OEBPS/Images/48123_24_2.jpg?sign=1739314583-4KzFS2DAXtjQrH8qdyGZw8UwFz5UJZYS-0-fb4c6443acecd330682489240b39e4df)
令
![](https://epubservercos.yuewen.com/4B3087/30122173303507506/epubprivate/OEBPS/Images/48123_24_3.jpg?sign=1739314583-zVrDMa5FEhmSiA4VbynlONwP1qTrgdTk-0-b40c4b10d01a853b415523ebcdb348c3)
可以解得
![](https://epubservercos.yuewen.com/4B3087/30122173303507506/epubprivate/OEBPS/Images/48123_24_4.jpg?sign=1739314583-wpd4LvVJdbWeKfrb9S65GCKE7XpPljHo-0-77c97bb7e4a97f342048cccee98d44b5)
我们用机器学习算法相关术语来描述这一算法。
• 训练样本:平面直角坐标系上的n个点。
• 模型:描述平面直角坐标系上直线的一次方程。
• 模型的权重参数:一次方程中的参数a和b。
• 训练:根据样本计算出权重参数的过程。
• 基于模型和权重的推理:得到公式(1)中参数a和b的值后,根据x计算出y的值的过程。
如果我们将一元线性回归算法推广到多元非线性函数,那么实际上就是用线性多项式函数无限逼近无理函数(非整数次幂函数)和超越函数(指数/对数函数、三角/反三角函数和双曲/反双曲函数)。而基于深度学习算法计算出的结果,就是多项式中各项的系数,也就是模型的权重参数。