人工ニューラルネットワークの一つである「ボルツマンマシン」について解説!
本書は,人工ニューラルネットワークの一つであるボルツマンマシンについて,その基本的な理論から学習方法そして機械学習や強化学習への用い方について直観的に理解できるように解説をした。
★主要目次★
1. はじめに
1.1 ボルツマンマシンと深層学習
1.2 ボルツマンマシンの定義
1.3 ボルツマンマシンの可能性
1.4 学習の目的関数
1.5 勾配法
1.6 確率的勾配法
2. ボルツマンマシンの学習
2.1 可視ユニットのみの場合
2.2 隠れユニットを持つ場合
2.3 判別モデルの学習
2.4 回帰モデルの学習
3. サンプリングと期待値の評価
3.1 ギブスサンプリング
3.2 コントラスティブダイバージェンス
3.3 制限ボルツマンマシンからのサンプリング
3.4 平均場近似
3.5 その他の手法
4. 深層モデルとその他の関連するモデル
4.1 深層信念ネットワーク
4.2 深層ボルツマンマシン
4.3 ガウスボルツマンマシン
4.4 マルコフ確率場
5. 時系列モデルの学習
5.1 目的関数と勾配法
5.2 条件付き制限ボルツマンマシン
5.3 再帰的時間的制限ボルツマンマシン
6. 時系列モデルのオンライン学習
6.1 はじめに
6.2 動的ボルツマンマシン
6.3 制約の緩和
6.4 連続値をとる時系列に対する動的ボルツマンマシン
6.5 動的ボルツマンマシンの連続拡張
7. 強化学習
7.1 マルコフ決定過程
7.2 最適性方程式と価値反復法
7.3 Q学習
7.4 活用と探索
7.5 SARSA法
7.6 方策反復法
7.7 価値関数の近似
7.8 自由エネルギーを用いた強化学習
7.9 部分観測環境における強化学習
付録:隠れユニットを持つ動的ボルツマンマシン
A.1 確率分布
A.2 学習則