理化学研究所、選んだ行動の正解/不正解から学ぶ脳のメカニズムを発見
正解/不正解から学ぶ脳のメカニズムを発見
- 脳科学の教育への応用に新たな手がかり -
◇ポイント◇
選んだ行動の正解/不正解に反応する二種類の神経細胞が前頭前野に存在
正解であることがあらかじめわかっていたときには発見した神経細胞は活動しない
教育場面での評価(正しいか/正しくないか)の最適化の手がかりに
独立行政法人理化学研究所(野依良治理事長)は、サルの前頭前野における神経細胞の電気活動を詳しく解析し、選んだ行動が正解か不正解かわかったときに、それぞれ活動する神経細胞があることを世界で初めて発見しました。さらに、これらの神経細胞は、行動選択を次に正しく行うための正解/不正解を区別しており、選んだ行動が正解であることが、あらかじめわかっていたときには反応せず、正解/不正解を区別していないことがわかりました。理研脳科学総合研究センター(甘利俊一センター長)認知機能表現研究チームの松元健二研究員、松元まどか研究員、阿部央研究員(現・東京工業大学特別研究員)、田中啓治チームリーダーによる研究成果です。
私たちは、状況に応じて行動を柔軟に変化させることによって、さまざまな環境に適応することができます。今までの研究から、行動の柔軟性には大脳の前頭葉、特に額のすぐ奥に位置する前頭前野と呼ばれる脳の領域の働きが重要であることが知られています。環境に柔軟に適応するためには、実際に行動を起こし、その結果から行動が正しかったか、正しくなかったかを判断し、正しい行動の選択について学習していく必要があります。しかしながら、この行動結果の評価をもとに、正しい行動を学習する前頭前野のメカニズムはわかっていませんでした。
研究チームでは、サルの前頭前野における神経細胞活動を電気的に記録し、選んだ行動の正解/不正解を認識する際、正解と不正解それぞれに対して反応する2つの神経細胞群があることを世界で初めて発見しました。つまり、前頭前野には、選んだ行動が正しかった際に反応している神経細胞と、正しくなかった際に反応している神経細胞の2種類が存在することが明らかになったのです。さらに、これらの神経細胞の反応は、正しい行動が十分に学習された後では消失し、学習が進んでいるときだけ現れる特徴があることも突き止めました。
今回の発見は、教育における評価(行動が正しいか/正しくないか)の役割に、脳科学的な意味づけを与えるという点で意義深く、教育効果を最大限に引き出すための最適な行動評価の与え方を考える上で、大きな手がかりを提供する成果です。
本研究成果は、米国の科学雑誌『Nature Neuroscience』のオンライン版(4月22日付け)に掲載されます。
1.背 景
大脳の最前部、額のすぐ奥に位置する前頭前野と呼ばれる脳領域(図1)は、私たちヒトやサルなど、知的能力の高い霊長類で大きく発達しています。この高い知的能力は、種々の複雑な環境の中で、適切な行動を見出すことを可能にします。行動を柔軟に変化させることによって、さまざまな環境に適応するためには、大脳の前頭前野が特に重要であることが知られています。前頭前野が外傷や脳疾患などにより損傷すると、同じ行動を意味もなく繰り返したり、非社会的な行動をとる場合などがあります。
環境に柔軟に適応するためには、実際に行動を起こしてみて、その結果をもとに、その環境における正しい行動を学習していく必要があります。例えば、転居直後に初めて買い物に行ったスーパーマーケットでは、買いたいものをたまたますぐに見つけられることもあれば、なかなか見つけられずにあちこち動き回ることもあります。つまり、まず動いてみて得た結果から、どのコーナーに行けば何を買えるかを繰り返し学習するうちに、何でもすぐに見つけられるようになります。その際の脳内の活動は、起こした行動が間違いだったときには、前頭前野の内側部が強く働くことが、脳の活動を可視化する研究や脳波を調べる研究によってわかっていました。しかし、これらの研究では、せいぜい1mm程度の空間解像度しかないため、1mm角に含まれる神経細胞の平均的な活動を知ることしかできず、前頭前野における個々の神経細胞が、選択した行動評価(正解/不正解)の表現に際して、どのような情報を担っているかわかりません。したがって、行動が不正解であった際に反応している神経細胞群のなかに、正解に対して反応している神経細胞が混ざっていたとしても、それらを検出することができませんでした。
2.研究手法と成果
研究チームはまず始めに、サルに特定の絵柄と報酬(水)を組み合わせて経験させることによって、後で正解の合図として使う絵柄を教えました(図2上)。次に、モニター上に目印が出た後、右レバーと左レバーのどちらかを選んで押させ、正解か、不正解かをサルに予測させました。サルの選択が正しかったときには、教えておいた正解の絵柄を、不正解であったときには、別の絵柄をモニター上に見せました(図2下)。左右どちらのレバー押しが正解かは実験者が、その都度決めました。サルがこの課題を行っている間に前頭前野の内側部(図1右下)に記録電極を入れて、一つ一つの神経細胞の活動を記録しました。
最初は、左右どちらのレバー押しが正解かサルにはわからなかったため、正解率は50%でした。したがって、正解/不正解のどちらの合図が出るかを正しく予測することもできませんでした。1回の実験サイクルの間は、正解のレバーは、左右いずれかに固定しました。そのため1回目に行った行動と、その正解/不正解の合図を見ることによりサルはどちらのレバー押しが正解かを学習し、2回目は90%以上の正解率を示しました。したがって、2回目以降は、正解の合図が出ることを容易に予測することができました。3回ないし4回連続して正解レバーを押すことができた後は、再び正解のレバーをランダムに設定し直し、改めてサルに、どちらのレバー押しが正しいか、学習し直させました。
これら一連の課題を通して、正解の合図が出たときと、不正解の合図が出たときの、前頭前野の個々の神経細胞の反応(活動)の強さを調べました。前頭前野内側部には、正解の合図が出たときに強く反応する神経細胞(図3)と、不正解の合図が出たときに強く反応する神経細胞(図4)の2種類があることがわかりました。これらの神経細胞は、正解のレバーが設定し直された直後、つまり、どちらのレバーが正解か、不正解かわからない状態で強く反応し、選択したレバー押しの結果に伴い、サルは正解のレバーを学習し、次からはどちらのレバーが正解かわかるようになりました。正解のレバーがわかった後は、正しいレバー押しに対して正解の合図が出ても、発見した神経細胞はほとんど反応しませんでした。このことは、正解/不正解の合図が、正しい行動選択の学習を大きく進めるときには前頭前野内側部の神経細胞は強い反応を示しますが、学習を終わってしまった後では反応も弱くなることを示しています。
このように選んだ行動が、正解だったときと不正解だったときとでは、前頭前野内側部の異なる神経細胞群が反応し、正解と不正解とがはっきり区別されます(図5左)。それをもとに、正解だった行動を積極的に繰り返すか、不正解だった行動から別の行動へと切り替えるかが決定されます。この繰り返しにより、行動選択はより適応的で確かなものになっていきます。正しい行動を十分学習した後には、前頭前野内側部の神経細胞は、あまり反応しなくなりなります(図5右)。このような、行動選択の結果のよしあしの評価をもとに、正しい行動を学習する際の前頭前野のメカニズムが、本研究によって初めて明らかになりました。
3.今後の期待
本研究成果は、教育場面で、どのような評価をどのような場面で示すのがよいかを考える上での手がかりを提供するものです。「子供は褒めて伸ばしましょう」とよく言われます。こうした考えに基づいて、子供が正しい行動をとったときだけ「よくできたね」と評価し、間違った行動をとった場合には、特に指摘をしない親や教師もいるでしょう。しかし、今回、サルを用いた実験では、正解という結果と不正解という結果は、脳内で独立に処理されることがわかりました。この結果を、人間で実証するためには、教育学と脳科学との連携が必要ですが、今回得られた知見を踏まえると、正しい行動や回答を“正しい”と指摘することと、間違った行動や回答を“正しくない”と指摘することとは、両方とも大事であり、正解したときに褒めるだけでは十分ではないと考えられます。また、行動の結果を見るまで正解なのか不正解なのかわからない中で結果が示されることにより、正しい行動の学習は大きく進みます。したがって、正解のわからない問題を用意し、その答えを予想させた後で、正解または不正解という結果を返すことが、学習を進める上で有効であると考えられます。
正しい行動の学習の進み具合は、起こした行動の正解/不正解をどれほど予測できていないかに依存します。今後は、このような行動の結果予測の不確実さの認識、言い換えれば、正解/不正解がわかったときの驚きの程度の予測のような、もう一段高次なレベルでの前頭前野の働きについてさらに研究を進め、環境への柔軟な適応を支える前頭前野メカニズムの全容の解明を目指します。
*添付資料あり。