会社で調べたいろんなこと

ブログに残していきたいんだけど、会社で書くわけにはいかないしねー。かといって、最近はそれぐらいしか書くネタがないので、それを書かない結果が今のありさまなわけで……。

というわけで、先週ちょっと気になったネタ。
人工知能の話題: TDギャモン (TD-Gammon)
バックギャモンというボードゲームをTD学習という強化学習の手法を用いて学習させる話。最近ぷよぷよをプレイするプログラムを検討中で参考になるかなと思った。ぷよぷよも基本的には効率の良い手を探索する必要があるはずだけど、将棋や囲碁と違って落ちてくるぷよがランダムなのでちょっと違う。二人零和有限確定完全情報ゲーム - Wikipediaになってない。
強化学習自体は使わなくても動くものは作れるはずなので、とりあえず簡単な思考を実装してみる予定。