Invarianzlernen mit neuronalen Karten

Menschen haben die Fähigkeit, visuelle Objekte schnell und zuverlässig zu erkennen, unabhängig vom Blickwinkel oder der Entfernung, aus der das Objekt betrachtet wird. Für Computer hingegen war diese Aufgabe lange Zeit eine Herausforderung. Mit Methoden der Muster-Erkennung können zwar Bilder wiedererkannt werden. Aber wenn sich ein Objekt dreht oder aus einer anderen Entfernung betrachtet wird, erzeugt es auf der Netzhaut (oder in einem Kamera-Chip) ein völlig anderes Muster von Bildpunkten („Pixeln“). Die Fähigkeit, Objekte auch bei Variation von Blickwinkel, Entfernung oder Beleuchtungs-Bedingungen robust wiederzuerkennen, nennt man „Invariante Objekterkennung“.

Ortsfrequenzen im Sehsystem

Dass die Nervenzellen im primären Sehkortex selektiv auf die Orientierung (den Winkel) von Helligkeitskanten reagieren, ist seit den Arbeiten von Hubel und Wiesel (1962) bekannt. Später fand man heraus, dass diese Nervenzellen auch auf Streifenmuster reagieren und ihre Antwort vom Abstand der Streifen und damit von der „Ortsfrequenz“ (dem Kehrwert der Periodenlänge) abhängt.

Motivation für diesen KI-Blog

Das Thema „Künstlichen Intelligenz“ – KI – wird in den nächsten Jahren drastische Auswirkungen auf alle Lebensbereiche haben. Es hat das Potential, uns Menschen viel Arbeit abzunehmen, so dass wir produktiver werden und mehr Zeit für die schönen Dinge des Lebens haben. KI kann aber auch Leben zerstören und Freiheiten einschränken, z.B. wenn sie für Kampfroboter oder den Ausbau des Überwachungsstaates eingesetzt wird. Genaugenommen ist es nicht die KI selbst, welche diese negativen Folgen hervorbringt, sondern die menschlichen Nutzer dieser KI-Systeme.