研究者たちは再び小さな子供のようにニューラルネットワークを扱っています
ブロックドロップを見てください-ブーム!
世界を支配する物理学の基本原理の研究は、子供が(逆さまの虫のように振る舞うのではなく)腕と脚の動きを制御し始める生後1年で始まります。次に、赤ちゃんは手の届くところにある物体を捕まえ、それらを実験し始めます。おそらくすべてを口に詰め込む最も一般的な反射に加えて(おそらく子供自身よりも年上のソファの下にある犬のクランチの味を味わう必要があるため)、押す、引く、または子供の口に落ちた物を投げる。腕。これは子供が物理学を学ぶ方法です。伸ばされたものは私たちに向かって落下し、反対方向に押し、投げて落下します(または千個に砕けます。それは花瓶、お母さんにとって残念です)。
少し前に、AI学習へのアプローチを変更することについて書きました。これにより、段階的に改善され、小さな子供を教えるようなモデルになります。DeepMindによって提案された研究は、このアイデアを拡張しているようです。さらに、研究者たちは、観測されたオブジェクトが期待どおりに動作しない場合に、サプライズメカニズムを実装しようとしました。
仮想ブロック
PLATO(自動オブジェクトコーディングと追跡による物理学習)と呼ばれるニューラルネットワークは、立方体のブロックや球などの動きのある単純なオブジェクトを示す約30時間のビデオでトレーニングされました。彼は要素の位置と速度の変化に対応することを学びました。AIが確立できた最も重要なパターンは、オブジェクトの存在の一定の連続性に関連していました。たとえば、ローリングボールは、あるポイントから別のポイントにテレポートするだけでなく、その軌道に沿ってポイントAからポイントBに連続的に移動しました。
2番目の重要な問題は、提示された要素の強度であり、それらの形状が変化したり、互いに浸透したりすることはできませんでした。
ボールを手に入れました、ボールはありません
トレーニング後、PLATOは、彼に提示された映画に含まれていた要素のさらなる動きを予測する能力を獲得しました。しかし、画面上のオブジェクトがAIによって予測されたとおりに動作しなかった場合、それは驚きを示しました。研究者にとって、この驚きの尺度は、映画の状況とPLATOによって生成された予測との違いの大きさでした。
PLATOは、人間の赤ちゃんを模倣した行動モデルではないことを忘れないでください。ただし、その結果は、子供の学習に関する仮説をテストするために使用できます。
私たちが最近聞いている最先端のAI作業が、研究者たちに私たち自身についての興味深い結論をすぐに導くことを期待しましょう。
出典:nature.com
コメントを残す