Die volle Komplexität soll es ja gar nicht sein, so hieß es ja am Anfang.
Der Roboter fährt also auf ein Ziel zu, beispielsweise auf eine Lichtquelle.
Dabei trifft er auf ein Hindernis, das eben nicht die Lichtquelle verdeckt, aber seinen Weg blockiert.
Es könnte durchsichtig sein oder halb hoch.
Er muss dann eine Entscheidung treffen, nämlich beispielsweise links oder rechts um das Hindernis herumfahren.
Wenn die Hindernisse so aussehen das eine Richtung beim Ausweichen erfolgreicher ist dann kann er sich das merken, aufsummieren über die Anzahl der Versuche und gegebenenfalls die Erfahrung später auch altern lassen.
(Erfolgreicher hieße in dem Fall vielleicht auch schon: er kann nach seitlichem Versatz ein Stück weiter auf die Lichtquelle zufahren.)
In dem Beispiel wäre das System überschaubar.
Der Lernerfolg wäre, Hindernisse sollte man rechts umfahren, nicht links.
Bei geeigneter Umgebung könnte das ein Lernerfolg sein.
Lesezeichen