ニューラルネットワーク

Notes

式	意味	出てきた場所
$y_{p r e d} = w \times x$	予測	Forward
$L = (y_{p r e d} - y_{t r u e})^{2}$	誤差の大きさ	Loss
$\frac{d L}{d w} = 2 (y_{p r e d} - y_{t r u e}) x$	傾き	Backward
$w = w - l r \times \frac{d L}{d w}$	更新	学習ステップ
$P(w_t	w_1, …, w_{t-1})$	次トークン確率
$L = -\sum \log P(w_t	… )$	交差エントロピー損失
$min_{θ} L (θ)$	損失最小化	最終目的