人工智能 — 数学基础
向量、线性变换、矩阵、导数&偏导数、梯度、概率学基础、熵
目录
一、向量
具有大小和方向的量。
a
→
=
(
x
,
y
)
\stackrel{\rightarrow}{a} = (x, y)
a→=(x,y)
二、线性变换
线性变换通常用一个矩阵表示。
设 T 是一个从向量空间 V 到向量空间 W 的线性变换,对于 V 中的每个向量 x,存在一个矩阵 A,使得 T(x) = Ax,其中 A 是一个固定的矩阵。
- 加法保持性质
对于任意两个向量 x 和 y,线性变换 T 满足 T(x + y) = T(x) + T(y)。
- 标量乘法保持性质
对于任意标量 c 和向量 x,线性变换 T 满足 T(cx) = cT(x)。
三、矩阵
1、概念
矩阵是一个由数字排列成的矩形阵列,其中包含 m 行 n 列的数学对象。
A
=
[
a
11
a
12
…
a
1
n
a
21
a
22
…
a
2
n
⋮
⋮
⋱
⋮
a
m
1
a
m
2
…
a
m
n
]
A = \begin{bmatrix} a_{11} & a_{12} & \ldots & a_{1n} \\ a_{21} & a_{22} & \ldots & a_{2n} \\ \vdots & \vdots & \ddots & \vdots \\ a_{m1} & a_{m2} & \ldots & a_{mn} \end{bmatrix}
A=
a11a21⋮am1a12a22⋮am2……⋱…a1na2n⋮amn
其中 a i j 表示矩阵中第 i 行第 j 列的元素 其中 a_{ij} 表示矩阵中第 i 行第 j 列的元素 其中aij表示矩阵中第i行第j列的元素
2、加减法
矩阵的加法和减法按元素进行,即对应位置上的元素相加或相减。
两个相同维度的矩阵(两个矩阵的列数和行数一致)才能相加或相减。
C
=
A
+
B
⇒
c
i
j
=
a
i
j
+
b
i
j
C = A + B \Rightarrow c_{ij} = a_{ij} + b_{ij}
C=A+B⇒cij=aij+bij
A = [ 3 1 2 4 ] , B = [ 5 2 1 6 ] , C = A + B = [ 3 + 5 1 + 2 2 + 1 4 + 6 ] = [ 8 3 3 10 ] A = \begin{bmatrix} 3 & 1 \\ 2 & 4 \end{bmatrix} ,B = \begin{bmatrix} 5 & 2 \\ 1 & 6 \end{bmatrix} ,C = A + B = \begin{bmatrix} 3+5 & 1+2 \\ 2+1 & 4+6 \end{bmatrix} = \begin{bmatrix} 8 & 3 \\ 3 & 10 \end{bmatrix} A=[3214],B=[5126],C=A+B=[3+52+11+24+6]=[83310]
X = [ 7 4 3 9 ] , Y = [ 2 1 5 2 ] , Z = X − Y = [ 7 − 2 4 − 1 3 − 5 9 − 2 ] = [ 5 3 − 2 7 ] X = \begin{bmatrix} 7 & 4 \\ 3 & 9 \end{bmatrix}, Y = \begin{bmatrix} 2 & 1 \\ 5 & 2 \end{bmatrix},Z = X - Y = \begin{bmatrix} 7-2 & 4-1 \\ 3-5 & 9-2 \end{bmatrix} = \begin{bmatrix} 5 & 3 \\ -2 & 7 \end{bmatrix} X=[7349],Y=[2512],Z=X−Y=[7−23−54−19−2]=[5−237]
3、乘法
矩阵的乘法不同于加法,是按行和列进行的。
如果矩阵 A 的列数等于矩阵 B 的行数,则它们可以相乘。
C
=
A
B
⇒
c
i
j
=
∑
k
=
1
n
a
i
k
⋅
b
k
j
C = AB \Rightarrow c_{ij} = \sum_{k=1}^{n} a_{ik} \cdot b_{kj}
C=AB⇒cij=k=1∑naik⋅bkj
A
=
[
2
3
4
1
]
,
B
=
[
5
6
7
8
]
A = \begin{bmatrix} 2 & 3 \\ 4 & 1 \end{bmatrix},B = \begin{bmatrix} 5 & 6 \\ 7 & 8 \end{bmatrix}
A=[2431],B=[5768]
C
=
A
×
B
=
[
2
×
5
+
3
×
7
2
×
6
+
3
×
8
4
×
5
+
1
×
7
4
×
6
+
1
×
8
]
=
[
31
34
27
28
]
C = A × B = \begin{bmatrix} 2 × 5 + 3 × 7 & 2 × 6 + 3 × 8 \\ 4 × 5 + 1 × 7 & 4 × 6 + 1 × 8 \end{bmatrix} = \begin{bmatrix} 31 & 34 \\ 27 & 28 \end{bmatrix}
C=A×B=[2×5+3×74×5+1×72×6+3×84×6+1×8]=[31273428]
A
=
[
1
2
3
4
5
6
7
8
9
]
,
B
=
[
9
8
7
6
5
4
3
2
1
]
A = \begin{bmatrix} 1 & 2 & 3 \\ 4 & 5 & 6 \\ 7 & 8 & 9 \end{bmatrix},B = \begin{bmatrix} 9 & 8 & 7 \\ 6 & 5 & 4 \\ 3 & 2 & 1 \end{bmatrix}
A=
147258369
,B=
963852741
C
=
A
×
B
=
[
1
×
9
+
2
×
6
+
3
×
3
1
×
8
+
2
×
5
+
3
×
2
1
×
7
+
2
×
4
+
3
×
1
4
×
9
+
5
×
6
+
6
×
3
4
×
8
+
5
×
5
+
6
×
2
4
×
7
+
5
×
4
+
6
×
1
7
×
9
+
8
×
6
+
9
×
3
7
×
8
+
8
×
5
+
9
×
2
7
×
7
+
8
×
4
+
9
×
1
]
=
[
30
26
22
84
71
58
138
116
94
]
C = A × B = \begin{bmatrix} 1 × 9 + 2 × 6 + 3 × 3 & 1 × 8 + 2 × 5 + 3 × 2 & 1 × 7 + 2 × 4 + 3 × 1 \\ 4 × 9 + 5 × 6 + 6 × 3 & 4 × 8 + 5 × 5 + 6 × 2 & 4 × 7 + 5 × 4 + 6 × 1 \\ 7 × 9 + 8 × 6 + 9 × 3 & 7 × 8 + 8 × 5 + 9 × 2 & 7 × 7 + 8 × 4 + 9 × 1 \end{bmatrix} = \begin{bmatrix} 30 & 26 & 22 \\ 84 & 71 & 58 \\ 138 & 116 & 94 \end{bmatrix}
C=A×B=
1×9+2×6+3×34×9+5×6+6×37×9+8×6+9×31×8+2×5+3×24×8+5×5+6×27×8+8×5+9×21×7+2×4+3×14×7+5×4+6×17×7+8×4+9×1
=
30841382671116225894
A = [ 1 2 3 4 5 6 ] , B = [ 7 8 9 10 11 12 ] A = \begin{bmatrix} 1 & 2 & 3 \\ 4 & 5 & 6 \end{bmatrix},B = \begin{bmatrix} 7 & 8 \\ 9 & 10 \\ 11 & 12 \end{bmatrix} A=[142536],B= 791181012
A × B = [ 1 × 7 + 2 × 9 + 3 × 11 1 × 8 + 2 × 10 + 3 × 12 4 × 7 + 5 × 9 + 6 × 11 4 × 8 + 5 × 10 + 6 × 12 ] = [ 58 64 139 154 ] A \times B = \begin{bmatrix} 1 \times 7 + 2 \times 9 + 3 \times 11 & 1 \times 8 + 2 \times 10 + 3 \times 12 \\ 4 \times 7 + 5 \times 9 + 6 \times 11 & 4 \times 8 + 5 \times 10 + 6 \times 12 \end{bmatrix} = \begin{bmatrix} 58 & 64 \\ 139 & 154 \end{bmatrix} A×B=[1×7+2×9+3×114×7+5×9+6×111×8+2×10+3×124×8+5×10+6×12]=[5813964154]
B × A = [ 7 × 1 + 8 × 4 7 × 2 + 8 × 5 7 × 3 + 8 × 6 9 × 1 + 10 × 4 9 × 2 + 10 × 5 9 × 3 + 10 × 6 11 × 1 + 12 × 4 11 × 2 + 12 × 5 11 × 3 + 12 × 6 ] = [ 39 54 69 49 68 87 59 82 105 ] B \times A = \begin{bmatrix} 7 \times 1 + 8 \times 4 & 7 \times 2 + 8 \times 5 & 7 \times 3 + 8 \times 6 \\ 9 \times 1 + 10 \times 4 & 9 \times 2 + 10 \times 5 & 9 \times 3 + 10 \times 6 \\ 11 \times 1 + 12 \times 4 & 11 \times 2 + 12 \times 5 & 11 \times 3 + 12 \times 6 \end{bmatrix} = \begin{bmatrix} 39 & 54 & 69 \\ 49 & 68 & 87 \\ 59 & 82 & 105 \end{bmatrix} B×A= 7×1+8×49×1+10×411×1+12×47×2+8×59×2+10×511×2+12×57×3+8×69×3+10×611×3+12×6 = 3949595468826987105
4、单位矩阵
单位矩阵是一个特殊的方阵,主对角线上的元素全为1,其余元素为0。
表示为
I
或
I
n
,其中
n
是矩阵的阶数
表示为 I 或 I_{n},其中 n 是矩阵的阶数
表示为I或In,其中n是矩阵的阶数
I = [ 1 0 0 1 ] I = \begin{bmatrix} 1 & 0 \\ 0 & 1 \end{bmatrix} I=[1001]
I = [ 1 0 0 0 1 0 0 0 1 ] I = \begin{bmatrix} 1 & 0 & 0 \\ 0 & 1 & 0 \\ 0 & 0 & 1 \end{bmatrix} I= 100010001
I = [ 1 0 0 0 0 1 0 0 0 0 1 0 0 0 0 1 ] I = \begin{bmatrix} 1 & 0 & 0 & 0 \\ 0 & 1 & 0 & 0 \\ 0 & 0 & 1 & 0 \\ 0 & 0 & 0 & 1 \end{bmatrix} I= 1000010000100001
I = [ 1 0 … 0 0 1 … 0 ⋮ ⋮ ⋱ ⋮ 0 0 … 1 ] I = \begin{bmatrix} 1 & 0 & \ldots & 0 \\ 0 & 1 & \ldots & 0 \\ \vdots & \vdots & \ddots & \vdots \\ 0 & 0 & \ldots & 1 \end{bmatrix} I= 10⋮001⋮0……⋱…00⋮1
如果 A 是 n×n 矩阵,I 是单位矩阵,则 AI= A,IA = A
[
3
1
2
4
]
×
[
1
0
0
1
]
=
[
1
×
3
+
0
×
2
1
×
1
+
0
×
4
0
×
3
+
1
×
2
0
×
1
+
1
×
4
]
=
[
3
1
2
4
]
\begin{bmatrix} 3 & 1 \\ 2 & 4 \end{bmatrix}×\begin{bmatrix} 1 & 0 \\ 0 & 1 \end{bmatrix}= \begin{bmatrix} 1 × 3 + 0 × 2 & 1 × 1 + 0 × 4 \\ 0 × 3 + 1 × 2 & 0 × 1 + 1 × 4 \end{bmatrix} = \begin{bmatrix} 3 & 1 \\ 2 & 4 \end{bmatrix}
[3214]×[1001]=[1×3+0×20×3+1×21×1+0×40×1+1×4]=[3214]
[ 1 0 0 1 ] × [ 5 2 1 6 ] = [ 5 × 1 + 2 × 0 5 × 0 + 2 × 1 1 × 1 + 6 × 0 1 × 0 + 6 × 1 ] = [ 5 2 1 6 ] \begin{bmatrix} 1 & 0 \\ 0 & 1 \end{bmatrix}× \begin{bmatrix} 5 & 2 \\ 1 & 6 \end{bmatrix}= \begin{bmatrix} 5 × 1 + 2 × 0 & 5 × 0 + 2 × 1 \\ 1 × 1 + 6 × 0 & 1 × 0 + 6 × 1 \end{bmatrix} = \begin{bmatrix} 5 & 2 \\ 1 & 6 \end{bmatrix} [1001]×[5126]=[5×1+2×01×1+6×05×0+2×11×0+6×1]=[5126]
单位矩阵在矩阵乘法中的作用相当于数字1。
5、逆矩阵
若矩阵 A 存在逆矩阵,记为 A − 1 ,满足 A ⋅ A − 1 = A − 1 ⋅ A = I , I 是单位矩阵。 若矩阵 A 存在逆矩阵,记为 A^{-1},满足 A \cdot A^{-1} = A^{-1} \cdot A = I,I 是单位矩阵。 若矩阵A存在逆矩阵,记为A−1,满足A⋅A−1=A−1⋅A=I,I是单位矩阵。
A = [ 2 3 4 5 ] , A − 1 = 1 a d − b c [ d − b − c a ] , A − 1 = 1 − 2 [ 5 − 3 − 4 2 ] = [ − 5 2 3 2 2 − 1 ] A = \begin{bmatrix} 2 & 3 \\ 4 & 5 \end{bmatrix} ,A^{-1} = \frac{1}{ad - bc} \begin{bmatrix} d & -b \\ -c & a \end{bmatrix} ,A^{-1} = \frac{1}{-2} \begin{bmatrix} 5 & -3 \\ -4 & 2 \end{bmatrix} = \begin{bmatrix} -\frac{5}{2} & \frac{3}{2} \\ 2 & -1 \end{bmatrix} A=[2435],A−1=ad−bc1[d−c−ba],A−1=−21[5−4−32]=[−25223−1]
A = [ 3 − 4 2 − 5 ] , A − 1 = 1 a d − b c [ d − b − c a ] , A − 1 = 1 − 7 [ − 5 4 − 2 3 ] = [ 5 7 − 4 7 2 7 − 3 7 ] A = \begin{bmatrix} 3 & -4 \\ 2 & -5 \end{bmatrix},A^{-1} = \frac{1}{ad - bc} \begin{bmatrix} d & -b \\ -c & a \end{bmatrix},A^{-1} = \frac{1}{-7} \begin{bmatrix} -5 & 4 \\ -2 & 3 \end{bmatrix} = \begin{bmatrix} \frac{5}{7} & -\frac{4}{7} \\ \frac{2}{7} & -\frac{3}{7} \end{bmatrix} A=[32−4−5],A−1=ad−bc1[d−c−ba],A−1=−71[−5−243]=[7572−74−73]
6、奇异矩阵
当一个矩阵没有逆矩阵的时候,称该矩阵为奇异矩阵。
当且仅当一个矩阵的行列式为零时,该矩阵是奇异矩阵。
A
=
[
2
4
1
2
]
,Determinant
(
A
)
=
(
2
×
2
)
−
(
4
×
1
)
=
0
A= \begin{bmatrix} 2 & 4 \\ 1 & 2 \end{bmatrix},\text{Determinant}(A) = (2 × 2) - (4 × 1) = 0
A=[2142],Determinant(A)=(2×2)−(4×1)=0
7、矩阵的转置
矩阵的转置是将其行和列互换得到的新矩阵。
A
=
[
1
2
3
4
5
6
]
,
A
T
=
[
1
4
2
5
3
6
]
A = \begin{bmatrix} 1 & 2 & 3 \\ 4 & 5 & 6 \end{bmatrix},A^T = \begin{bmatrix} 1 & 4 \\ 2 & 5 \\ 3 & 6 \end{bmatrix}
A=[142536],AT=
123456
转置运算特性
- 对称矩阵的转置
A T = A A^T = A AT=A
- 转置的转置
( A T ) T = A (A^T)^T = A (AT)T=A
- 矩阵加法的转置
( A + B ) T = A T + B T (A + B)^T = A^T + B^T (A+B)T=AT+BT
- 矩阵乘法的转置
( A B ) T = B T A T (AB)^T = B^T A^T (AB)T=BTAT
- 标量乘法的转置
( c A ) T = c A T (cA)^T = c A^T (cA)T=cAT
8、对称矩阵
如果一个矩阵转置后等于原矩阵,那么这个矩阵称为对称矩阵。
一个矩阵转置和这个矩阵的乘积就是一个对称矩阵。
A
T
=
A
A^T = A
AT=A
A = [ 1 2 3 2 4 5 3 5 6 ] , A T = [ 1 2 3 2 4 5 3 5 6 ] = A A = \begin{bmatrix} 1 & 2 & 3 \\ 2 & 4 & 5 \\ 3 & 5 & 6 \end{bmatrix}, A^T = \begin{bmatrix} 1 & 2 & 3 \\ 2 & 4 & 5 \\ 3 & 5 & 6 \end{bmatrix} = A A= 123245356 ,AT= 123245356 =A
( A T × A ) T = A T × ( A T ) T = A T A (A^T×A)^T = A^T×(A^T)^T=A^TA (AT×A)T=AT×(AT)T=ATA
A
=
[
1
2
3
4
5
6
]
A = \begin{bmatrix} 1 & 2 \\ 3 & 4 \\ 5 & 6 \end{bmatrix}
A=
135246
(
A
T
×
A
)
T
=
(
[
1
3
5
2
4
6
]
×
[
1
2
3
4
5
6
]
)
T
=
A
T
×
(
A
T
)
T
=
[
1
3
5
2
4
6
]
×
[
1
2
3
4
5
6
]
=
A
T
×
A
=
[
1
3
5
2
4
6
]
×
[
1
2
3
4
5
6
]
(A^T \times A)^T = \left(\begin{bmatrix} 1 & 3 & 5 \\ 2 & 4 & 6 \end{bmatrix} \times \begin{bmatrix} 1 & 2 \\ 3 & 4 \\ 5 & 6 \end{bmatrix}\right)^T= A^T \times (A^T)^T = \begin{bmatrix} 1 & 3 & 5 \\ 2 & 4 & 6 \end{bmatrix} \times \begin{bmatrix} 1 & 2 \\ 3 & 4 \\ 5 & 6 \end{bmatrix} = A^T \times A = \begin{bmatrix} 1 & 3 & 5 \\ 2 & 4 & 6 \end{bmatrix} \times \begin{bmatrix} 1 & 2 \\ 3 & 4 \\ 5 & 6 \end{bmatrix}
(AT×A)T=
[123456]×
135246
T=AT×(AT)T=[123456]×
135246
=AT×A=[123456]×
135246
9、欧氏变换
两部分组成:旋转和平移。
a
′
=
R
a
+
t
a' = Ra+t
a′=Ra+t
10、齐次坐标
就是用 N+1 维来代表 N 维坐标。
两个矩阵运算时,大小不一样,可以使用齐次坐标补齐成行列大小一致后运算。
可以在一个二维坐标末尾加上一个额外的变量 w 来形成二维齐次坐标。
因此,一个点 (X,Y) 在齐次坐标里面变成了(x,y,w),并且有 X = x/w,Y = y/w。
例如:(1,2) 的齐次坐标可以表示为 (1,2,1)。
如果点 (1,2) 移动到无限远处,在笛卡尔坐标下它变为 (∞,∞),然后它的齐次坐标表示为 (1,2,0) ,因为 (1/0, 2/0) = (∞,∞),就可以不用 “∞” 来表示一个无穷远处的点了,这样方便做运算。
四、导数&偏导数
导数(微分):
是代表函数(曲线)的斜率,是描述函数(曲线)变化快慢的量,同时曲线的极大值点也可以使用导数来判断,即极大值点的导数为0,此时斜率为0。
偏导数:
是指在多元函数的情况下,对其每个变量进行求导,求导时,把其它变量看做常量进行处理,物理意义就是查看这一个变量在其它情况不变的情况下对函数的影响程度。
f
′
(
x
0
)
=
lim
Δ
x
→
0
Δ
y
Δ
x
=
lim
Δ
x
→
0
f
(
x
0
+
Δ
x
)
−
f
(
x
0
)
Δ
x
f'(x_0)= \lim_{{\Delta x \to 0}}\frac{\Delta y}{\Delta x} = \lim_{{\Delta x \to 0}} \frac{f(x_0 + \Delta x) - f(x_0)}{\Delta x}
f′(x0)=Δx→0limΔxΔy=Δx→0limΔxf(x0+Δx)−f(x0)
五、梯度
梯度的本意是一个向量(矢量),表示某一函数在该点处的方向导数沿着该方向取得最大值,即函数在该点处沿着该方向(此梯度的方向)变化最快,变化率最大(为该梯度的模) 。
简而言之,对多元函数的各个自变量求偏导数,并把求得的这些偏导数写成向量形式,就是梯度。
∇
f
(
x
0
,
y
0
)
=
(
∂
f
∂
x
,
∂
f
∂
y
)
\nabla f(x_0,y_0) = \left( \frac{\partial f}{\partial x}, \frac{\partial f}{\partial y} \right)
∇f(x0,y0)=(∂x∂f,∂y∂f)
梯度下降法
是一种寻找函数极小值的方法。
该方法最普通的做法是:在已知参数当前值的情况下,按当前点对应的梯度向量的反方向,并按事先给定好的步长大小,对参数进行调整。 按如上方法对参数做出多次调整之后,函数就会逼近一个极小值。
存在的问题
参数调整缓慢,收敛于局部最小值。
六、概率学基础
1、事件与关系运算
2、事件运算定律
- 交换律
并集的交换律
A
∪
B
=
B
∪
A
A \cup B = B \cup A
A∪B=B∪A
交集的交换律
A
∩
B
=
B
∩
A
A \cap B = B \cap A
A∩B=B∩A
- 结合律
并集的结合律
(
A
∪
B
)
∪
C
=
A
∪
(
B
∪
C
)
(A \cup B) \cup C = A \cup (B \cup C)
(A∪B)∪C=A∪(B∪C)
交集的结合律
(
A
∩
B
)
∩
C
=
A
∩
(
B
∩
C
)
(A \cap B) \cap C = A \cap (B \cap C)
(A∩B)∩C=A∩(B∩C)
- 分配律
并集对交集的分配律
A
∪
(
B
∩
C
)
=
(
A
∪
B
)
∩
(
A
∪
C
)
A \cup (B \cap C) = (A \cup B) \cap (A \cup C)
A∪(B∩C)=(A∪B)∩(A∪C)
交集对并集的分配律
A
∩
(
B
∪
C
)
=
(
A
∩
B
)
∪
(
A
∩
C
)
A \cap (B \cup C) = (A \cap B) \cup (A \cap C)
A∩(B∪C)=(A∩B)∪(A∩C)
3、概率
1、概念
事件发生的可能性大小的度量。
概率 P(g) 为定义在事件集合上的满足下面2个条件的函数:
对任何事件A,P(A) >= 0
对必然事件B,P(B) = 1
2、基本性质
P ( A ) = 1 − P ( A ′ ) A ′ 表示事件 A 的对立事件 P(A)=1−P(A^′)\\ A^′ 表示事件 A 的对立事件 P(A)=1−P(A′)A′表示事件A的对立事件
3、公式
古典型概率:实验的所有结果只有有限个,且每个结果发生的可能性相同。
P
(
A
)
=
事件
A
发生的基本事件数
基本事件总数
P(A)=\frac{事件 A 发生的基本事件数}{基本事件总数}
P(A)=基本事件总数事件A发生的基本事件数
4、独立性
设 A,B 为随机事件,若同时发生的概率等于各自发生的概率的乘积,则 A,B 相互独立。
P
(
A
B
)
=
P
(
A
)
P
(
B
)
P(AB)=P(A)P(B)
P(AB)=P(A)P(B)
5、离散
离散就是不连续。
6、数学期望、方差、标准差
- 数学期望(均值):表示一件事平均发生的概率,记为 E(x)。
E ( x ) = ∫ − ∞ ∞ x f ( x ) d x E(x) = \int_{-\infty}^{\infty} x f(x) \,dx E(x)=∫−∞∞xf(x)dx
-
方差:用来刻画随机变量 x 和数学期望 E(x) 之间的偏离程度,记做D(x)。
(表示离散程度,越大离均值越远。)
D ( x ) = ∫ − ∞ ∞ [ x k − E ( x ) ] 2 f ( x ) d x D(x) = \int_{-\infty}^{\infty} [x_k - E(x)]^2 f(x) \,dx D(x)=∫−∞∞[xk−E(x)]2f(x)dx
样本方差
s
2
=
1
n
[
(
x
1
−
x
ˉ
)
2
+
(
x
2
−
x
ˉ
)
2
+
…
+
(
x
n
−
x
ˉ
)
2
]
s^2 = \frac{1}{n} \left[ (x_1 - \bar{x})^2 + (x_2 - \bar{x})^2 + \ldots + (x_n - \bar{x})^2 \right]
s2=n1[(x1−xˉ)2+(x2−xˉ)2+…+(xn−xˉ)2]
- 标准差(均方差):是方差的算术平方根。标准差能反映一个数据集的离散程度。
7、正态分布(高斯分布)
若随机变量 X 服从一个数学期望为 μ、方差为 σ^2 的正态分布,记为 N(μ,σ^2)。
μ 决定了其位置(中心线),其标准差 σ 决定了分布的幅度(胖瘦)。
标准正态分布:当 μ = 0,σ = 1 时的正态分布是标准正态分布。
f
(
x
)
=
1
σ
2
π
e
−
(
x
−
μ
)
2
2
σ
2
f(x) = \frac{1}{\sigma \sqrt{2\pi}} e^{-\frac{(x - \mu)^2}{2\sigma^2}}
f(x)=σ2π1e−2σ2(x−μ)2
七、熵
物理学上,是“混乱” 程度的量度。
系统越有序,熵值越低;系统越混乱或者分散,熵值越高。
信息理论:
1、当系统的有序状态一致时,数据越集中的地方熵值越小,数据越分散的地方熵值越大。
这是从信息的完整性上进行的描述。
2、当数据量一致时,系统越有序,熵值越低,系统越混乱或者分散,熵值越高。
这是从信息的有序性上进行的描述。
若不确定性越大,则信息量越大,熵越大,
若不确定性越小,则信息量越小,熵越小。
假如事件 A 的分类划分是 (A1,A2,…,An),每部分发生的概率是 (p1,p2,…,pn),那信息熵定义为公式如下
E
n
t
(
A
)
=
−
∑
k
=
1
n
p
k
log
2
p
k
Ent(A) = -\sum_{k=1}^{n} p_k \log_2p_k
Ent(A)=−k=1∑npklog2pk
记录学习过程,欢迎讨论交流,尊重原创,转载请注明出处~
更多推荐
所有评论(0)