Tip:
Highlight text to annotate it
X
基本的な用語の紹介をしたいと思います。
人工知能の分野で広く使われるもので、様々な問題を区別するのに有効です。
まず最初に紹介するのは「完全観測可能」と「部分観測可能」です。
以下のような環境は「完全観測可能」と呼ばれます。
最適解を導くための情報がいつでも得られるような環境です。
カードゲームを例にとります。
全てのカードがテーブルの上にあり、いつでもそれらのカードを見ることで
最適な選択肢を導くのに充分な情報を得られれば「完全観測可能」です。
それとは対照的に、最適解を導くのに、
過去の情報を記憶しておく必要があるような環境があります。
例えば、ポーカーでは、カードはテーブルの上でふせられています。
そして、過去のカードの動きを記憶しておくと、よりよい選択ができます。
違いをより理解するために、人工知能のセンサーとアクチュエータが、
どのように環境と相互作用するかに注目してみましょう。
この相互作用は繰り返し起こります。
それを、知覚-行為サイクルと呼びます。
多くの環境において、ある環境は何らかの内部状態を持っていると
仮定すると考えやすいです。
例を挙げます。テーブルの上でカードが伏せられているゲームでは
内部状態は手に持っているカードと関係があります。
センサーがゲーム環境の状態を全て見ることができる場合
完全観測可能といいます。
状態の一部だけ見ることができる環境は部分観測可能といいます。
ただ、そのような環境でも過去の測定を覚えておくことで、状態についての付加情報を得ることができます。
今現在はその情報を観測できなくなっているとしても。
例えば、過去のカードの動きが手持ちのカードについての手がかりとなるようなゲームは
部分観測可能なゲームといえます。
それらのゲームは異なる扱いが必要です。
部分観測可能な環境と作用するエージェントは
その環境の状態を推測するするため、
内部記憶を持つ必要があります。
このあとさらに、隠れマルコフモデルについて話す際に、
どのようにそのような内部記憶をもつかについて話します。
二番目の用語は、ある環境が
「決定的」か「確率的」かについてです。
決定的な環境では人工知能エージェントは
単一の結果を決定できます。
例えば、チェスでは駒の動きにランダムさはありません。
ある駒を動かした際の効果は完全に決められています。
どこに駒を動かすかに関わらず、同じ駒を同じ所に動かせば同じ結果が得られます。
そのような環境を「決定的」といいます。
サイコロを使うゲーム、例えばバックギャモンは、「確率的」といいます。
決定的に駒を動かすこともできますが、
その行動の結果はサイコロを振ることで決まり、
予測することができません。
サイコロの結果にはいくらかのランダムさが含まれ、
そのため、「確率的」と呼んでいます。
次に「離散的」か「連続的」かについて話します。
離散的な環境とは、取りうる選択肢が有限な環境のことです。
知覚できる入力値も有限個です。
再びチェスを例にとります。チェスでは盤面の駒の配置は有限個です。
駒の動かし方も限られています。
連続的な環境ではそれとは状況が異なります。
行動できる範囲や知覚できる状態が無限な場合のことです。
例えば、ダーツでは、どのような角度で、どれぐらいの強さで投げるかは
無限の投げ方があります。
最後に紹介するのは、「友好的」と「敵対的」な環境の区別です。
友好的な環境では、その環境はランダムです。
確率的とも言えますが、それ自身は目的を持たず
矛盾することもありません。
例えば、天気は「友好的」です。
天気はランダムで、あなたの行動に影響を与えますが、
それを意図的に強いているわけではありません。
「敵対的」な環境と比べてみます。チェスなど、多くのゲームでは
対戦相手は意図的にあなたの行動を強いようとします。
このため、敵対的な環境ではよりよい選択をするのがいっそう困難です。
なぜなら、対戦相手は積極的にあなたを観察し、あなたがやりたいことをさせないようにするからです。
友好的な環境ではそれより簡単です。友好的な環境は単純に確率的で、
あなたを負かそうとする意図を持たないからです。
以上の説明がどのぐらい伝わったかどうか確かめるため、
次のクイズを出します。
4つの概念を振り返ります。「部分観測可能」と「完全観測可能」、
「確率的」と「決定的」、「連続的」と「離散的」、
「敵対的」と「友好的」です。
チェッカーというゲームについて質問します。
これらの属性について当てはまるものに印をつけてください。
チェッカーゲームが「部分観測可能」と思うなら、ここに印をつけます。
そうでないなら、印をつけません。
「確率的」に当てはまるなら、ここに印をつけます。
「連続的」なら、同じく印を。「敵対的」なら、ここに印です。
チェッカーゲームを知らない人は、ウェブやGoogleで調べてみてください。
チェッカーについての情報があると思います。