強化学習とは、ごく普通のコンピュータープログラムに驚異的な力を与えるAI技術である。
2017年、その力を得たAlphaGo Masterというプログラムが世界トップのGo playerを打ち負かし、強化学習は今やロボットの巧妙な動作や金融取引など多くの分野の技術を向上させている。
強化学習により、ロボット、ゲームのキャラクターや他の自律エージェントはまさに人間が現実の世界で学習するようなやり方で、試行錯誤をしながら学習していく。
例えば、3Dゲームの環境でこれを利用すれば、車にトラックの周りを運転する方法を学習させることができる。車は始めのうちはすぐに衝突してしまうが、アメとムチを与えられながらだんだんと学習していき、ついには無傷でトラックの周りを操縦することができるようになる。
もしプログラマーがもっと複雑な、動く障害物のようなものを加えていくと、しまいには、極端に言うとミハエル・シューマッハのような運転技術を持つ車になるというわけだ。
基礎的なプログラミング技術を持っている人なら誰でも、Unityなどの利用しやすいテスト環境で強化学習を習得することができる。そうすればスーパー・パワーを持った独自のプログラムを構築することが可能になるのだ!
IMAGES
Superheroes https://www.flickr.com/photos/doctorow/2799822258
Go https://commons.wikimedia.org/wiki/File:Stones_go.jpg
Car game https://www.flickr.com/photos/stefans02/27606249167