「机器学习-李宏毅」：Deep Learning-Introduction

2020-04-182020-07-03 机器学习-李宏毅 7 minutes read (About 1099 words) 0 visits

这篇文章中，介绍了Deep Learning的一般步骤。

Up and downs of Deep Learning

1958: Perceptron (linear model)
1969: Perceptron has limitation
1980s: Multi-layer perceptron

Do not have significant difference from DNN today
1986: Backpropagation

Usually more than 3 hidden layers is not helpful
1989: 1 hidden layer is “good enough”, why deep?
2006: RBM initialization (breakthrough)
2009: GPU
2011: Start to be popular in speech recognition【语音辨识】
2012: win ILSVRC image competition 【图像识别】

Step 1: Neural Network

在将Regression 和 Classification时，Step 1 是确定一个function set。

在Deep Learning中，也是相同的，只是这里的function set就是一个neural network的结构。

上图中，一个Neuron就是如上图所示的一个unit，neuron之间不同的连接方式构成不同的Neural Network。

Fully Connect Feedforward Network

这是一个Fully Connect Feedforward Network【全连接反馈网络】，其中每个neuron的activation function都是一个sigmod函数。

为什么说neural network其实就是一个function呢？上面两张图中，输入是一个vector，输出也是一个vector，可以用下面函数来表示。

$$ f\left(\left[\begin{array}{c}1 \\ -1\end{array}\right]\right)=\left[\begin{array}{c}0.62 \\ 0.83\end{array}\right] f\left(\left[\begin{array}{l}0 \\ 0\end{array}\right]\right)=\left[\begin{array}{l}0.51 \\ 0.85\end{array}\right] $$

上图为全连接网络的一般形式，第一层是Input Layer，最后一层是Output Layer，中间的其他层称为Hidden Layer。

而Deep Learning中的Deep的含义就是Many hidden layers的意思。

Matrix Operation

上图的全连接网络中，第一个hidden layer的输出可以写成矩阵和向量的形式：

$$ \sigma\left(\left[\begin{array}{cc}1 & -2 \\ -1 & 1\end{array}\right]\left[\begin{array}{c}1 \\ -1\end{array}\right]+\left[\begin{array}{c}1 \\ 0\end{array}\right]\right)=\left[\begin{array}{c}0.98 \\ 0.12\end{array}\right] $$