赤ちゃんは、限られた情報から迅速に言語や概念を学ぶことができる。高性能のAI(人工知能)には、何兆ものデータを学習するものもあるが、赤ちゃんが聞くのは年間1千万語ほど。それでも2歳で約300語を理解できると言われている。なぜ赤ちゃんは効率よく学べるのか。その学習方法をAIに活用できないか。
物をつかみ、口に入れ、投げる……。赤ちゃんは積極的に環境に働きかけることで多くの感覚情報を得ている。そして、親などの日常的な会話を聞く中で、言語を覚えていく。
一方、AIに使われる大規模言語モデル(LLM)は、インプットの多くは文字データだ。膨大な量のデータを学習する中で、自らパターンやルールを見つけ、自然な文章で、質問に応答できるようになっていく。
米スタンフォード大学のマイケル・フランク教授は昨年の論文で、最新のLLMは数兆ものデータを学習していると説明する。人間が5歳になるまでに学習するデータとの間には5桁ほど、20歳になるまでに学ぶデータとは少なくとも3桁の差があるという。
見て聞いて触って学ぶ赤ちゃん
この違いはどこから来るのか。
まず、赤ちゃんの脳は世界を…