Visuelle Wahrnehmung


Übergeordnet
Wahrnehmung
Gene Ontology
QuickGO

In der Physiologie ist visuelle Wahrnehmung die Aufnahme und Verarbeitung von visuellen Reizen, bei der über Auge und Gehirn eine Extraktion relevanter Informationen, Erkennung von Elementen und deren Interpretation durch Abgleich mit Erinnerungen stattfindet. Somit geht die visuelle Wahrnehmung weit über das reine Aufnehmen von Information hinaus.

Physiologische Einzelheiten zum Wahrnehmungsapparat finden sich unter visuelles System.

Geschichte

Im Altertum existierten unterschiedliche Theorien über die visuelle Wahrnehmung:

Die Wahrnehmungstheorie von Euklid (365–300 v. Chr.) setzte sich mit Problemen der Raumwahrnehmung (z. B. Perspektive und Größenkonstanz) auseinander. Die Sehlinien gehen nach dieser Theorie vom Auge aus und bestimmen die Wahrnehmung. Diese Theorie des „Sehstrahls“ scheint im Lichte physikalischer Betrachtungen ziemlich absurd zu sein, erhält aber durch die modernen Erkenntnisse der Blickbewegungsanalysen eine Art späte Rehabilitation (siehe foveale Wahrnehmung).

Die Wahrnehmungstheorie von Empedokles (492–432 v. Chr.) besagte scheinbar das Gegenteil. Die von den Poren (heute würde man sagen Pigmente) der Dinge ausgehenden Einflüsse, eine Art von Strahlungen, die durch das Licht beeinflusst (heute würde man sagen reflektiert) werden, dringen in die Sinnesorgane ein, und werden wahrgenommen, wenn sie dort eine Entsprechung finden (Gleiches wird durch Gleiches erkannt). Auch diese Theorie, die sich mit dem Erkennen von Dingen der Außenwelt befasst, ist in ihrem Ansatz moderner als es scheint. Sie bezieht sich aus heutiger Sicht auf die periphere Wahrnehmung, die ja auch auf den Betrachter einwirkt, selbst wenn dieser gar nicht hinschaut.

Leonardo da Vinci: "Das Auge hat eine einzige Zentrallinie, und alle Dinge, welche durch diese Linie zum Auge gelangen, werden gut gesehen."

Alhazen oder Ibn al-Haytham, der „Vater der Optik“ (965–1040), bewies als Erster, dass die visuelle Wahrnehmung mit dem Licht zusammenhängt, das ins Auge fällt. Er stellte als Erster die Hypothese auf, dass die Sehwahrnehmung im Gehirn und nicht im Auge stattfindet.

Durch Versuche wies er nach, dass die Wahrnehmung durch die persönliche Erfahrung eines Menschen beeinflusst wird. [1] Al-Haytham führte Experimente über menschliche Wahrnehmung durch und ergänzte die Arbeiten des Ptolemäus über stereoskopisches Sehen. [2][3]

Leonardo da Vinci (1452–1519) erkannte als Erster die optische Besonderheit des menschlichen Auges. Er schrieb: „Das Auge hat eine einzige Zentrallinie, und alle Dinge, welche durch diese Linie zum Auge gelangen, werden gut gesehen. Um diese Linie gibt es eine unendlich große Anzahl anderer Linien, die mit der Zentrallinie in Berührung kommen und die umso wirkungsloser sind, je weiter sie von besagter Zentrallinie entfernt sind.“[4]

Zu dieser Ansicht gelangte Leonardo durch Beobachtungen und mit Hilfe von optischen Experimenten. "Das Auge, von welchem uns die Erfahrung so deutlich die Funktion offenbart, wurde von einer unendlich großen Anzahl von Autoren in einer bestimmten Weise beschrieben; ich aber finde, dass es ganz anders ist.“ Damit ist er der Entdecker des Unterschieds zwischen fovealem und peripherem Sehen. [5]

Hermann von Helmholtz [6] wird oft als Vater der modernen visuellen Wahrnehmungstheorie betrachtet. Er verglich das Auge mit optischen Geräten und fand seine Konstruktionsmerkmale sehr primitiv. Theoretisch konnte das Auge gar keine brauchbaren Sehresultate liefern. Er schloss daraus, dass die Wahrnehmung nur durch „unbewusste Schlüsse“ zustande kommen könne, die durch bereits vorhandene Wahrnehmungserfahrungen ermöglicht werden.

Solche Wahrnehmungserfahrungen sind z. B.:

  • Licht kommt gewöhnlich von oben
  • Gegenstände werden nicht von unten gesehen
  • Gesichter werden in aufrechter Position erkannt [7]

Das Studium der optischen Täuschungen hat gezeigt, welche unbewussten Schlüsse im Wahrnehmungsvorgang enthalten sein können.

Eine andere Art unbewusster Schlüsse basiert auf der Wahrscheinlichkeitsempfindung, welche durch die Häufigkeit bereits gemachter ähnlicher Wahrnehmung bestimmt wird. [8]

Wahrnehmungsprozess

Reizaufnahme

Durch den dioptrischen Apparat des Auges wird auf der Netzhaut ein seitenverkehrtes und auf dem Kopf stehendes Bild erzeugt. Die Lichtreize werden von den Sinneszellen der Retina, den Stäbchen (Helligkeit) und Zapfen (Farbsehen), registriert. Das Verhältnis der Zelltypen unterscheidet sich je nach Ort auf der Netzhaut; in der Fovea befinden sich ausschließlich Zapfen. Zapfen und Stäbchen bilden bei Lichteinfall ein Membranpotential, das über bipolare Zellen an Ganglienzellen weitergeleitet wird.

Weiterleitung und Encodierung

Jede Ganglienzelle verarbeitet Informationen aus einem rezeptiven Feld (einem räumlich begrenzten Bereich der Retina). Es gibt zwei Haupttypen von Ganglienzellen, On- und Off-Center-Zellen, welche vor allem bei der Kantendetektion eine wichtige Rolle spielen. On-Center-Zellen sprechen an, wenn Licht in das Zentrum des rezeptiven Feldes fällt, und senken ihre Feuerrate, wenn periphere Bereiche des Feldes stärker belichtet werden. Off-Center-Zellen verhalten sich genau andersherum und feuern verstärkt, wenn Lichtreize in Randbereichen des rezeptiven Feldes aufgenommen werden.

Die Informationen von den Ganglienzellen werden über die Sehbahn zum linken und rechten seitlichen Kniehöcker geleitet. Der Output der On- und Off-Center-Zellen wird in den seitlichen Kniehöckern so verschaltet, dass Kanten (also Bereiche, in denen ein Helligkeitswechsel stattfindet) oder Balken (Helligkeitswechsel und Rückkehr zur Ausgangsintensität) extrahiert werden. Die aufbereiteten Informationen werden von den seitlichen Kniehöckern auf den visuellen Cortex projiziert. Diese Aufbereitung der Signale umfasst auch eine Steigerung des Kontrastempfindens über Rückkopplungsvorgänge, welche dafür sorgen, dass gleichzeitig zur Kontrastverstärkung die hohe Lichtempfindlichkeit gewahrt bleibt[9].

Interpretation

Raumwahrnehmung

Die Raumwahrnehmung stützt sich auf mehrere Verfahren, um aus dem zweidimensionalen Bild auf der Netzhaut eine Repräsentation der dreidimensionalen Welt zu erstellen. Durch das stereoskope Sehen können Rauminformationen aus den leichten Unterschieden zwischen den vom Augenpaar aufgenommenen Bildern konstruiert werden. Bewegt sich der Betrachter relativ zu Gegenständen im Raum, so bewegen sich die Abbilder auf der Netzhaut umso langsamer, je weiter der Gegenstand vom Betrachter entfernt ist. Daneben kann räumliche Wahrnehmung über den Texturgradienten stattfinden, d.h. über die Veränderungen der Textur je nach räumlichem Abstand.

Objektextraktion

Bevor Objekte erkannt und interpretiert werden können, muss erst aus den Informationen extrahiert werden, wo sich Objekte befinden und welche der erkannten Linien zu einem Objekt gehören. Diese Gestaltheuristiken (auch Gestaltprinzipien; der historische Begriff Gestaltgesetze sollte allerdings vermieden werden) funktionieren alle nach dem Prinzip eine möglichst prägnante Lösung zu finden (Gestaltpsychologie):

  • Prägnanz: Eine Figur wird so wahrgenommen, dass sie einer möglichst einfachen Struktur entspricht
  • Nähe: Bildelemente werden als zusammengehörig empfunden, wenn diese nahe beieinanderliegen
  • Ähnlichkeit: Bildteile gleicher Form oder Farbe werden als Ganzes gesehen
  • Symmetrie: symmetrische Strukturen werden dem gleichen Objekt zugeordnet
  • Gemeinsame Bewegung (Common fate): Gleiche Bewegungen und gleichzeitiges Erscheinen oder Verschwinden von Bildelementen erzeugt eine Zusammengehörigkeit
  • Kontinuität: Bildelemente, die eine Fortsetzung vorangehender oder unterbrochener Elemente zu sein scheinen, werden als zusammengehörig angesehen
  • Geschlossenheit: Linien, die eine Fläche umschließen, werden unter sonst gleichen Umständen leichter als eine Einheit aufgefasst als diejenigen, die sich nicht zusammenschließen
  • Gemeinsame Region: Elemente in abgegrenzten Gebieten werden als zusammengehörig empfunden
  • Verbundene Elemente: Verbundene Elemente werden als ein Objekt wahrgenommen

Objekterkennung

In der Objekterkennung werden die extrahierten Objekte interpretiert und können mit Erinnerungen abgeglichen werden.

Abgleich an Merkmalen

Ein Objekt kann mit einer bestehenden Erinnerung durch eine Merkmalanalyse abgeglichen werden. In diesem Modell wird vorausgesetzt, dass eine Form oder ein Objekt in einen Satz abstrakter Merkmale repräsentiert wird. Der Buchstabe K hat z.B. die Merkmale „langer senkrechter Stich“ „kürzerer Strich mit ca. 30° Neigung“ und „kürzerer Strich mit ca 75° Neigung“. Dieses Modell ist dem eines Schablonenabgleichs dadurch überlegen, dass auch abgeänderte Muster erkannt werden. Beim „K“ können Größe, Lage, Rotation oder Schriftart geändert werden, sodass eine „Schablone“ nicht mehr passen würde. Unter all diesen Transformationen bleiben die Merkmale jedoch gleich. Zudem entspricht der Merkmalsabgleich der Encodierung durch die Ganglionzellen (Extraktion von Linien)[10].

Erkennung komplexer Objekte

Zur Erkennung komplexer Objekte existiert die „Theorie der volumetrischen Erkennung“ [11]

  • Das komplexe Objekt wird in einfachere (dreidimensionale) Komponenten gegliedert, und jede Komponente einem „Geon“ (von: „Geometrical Icon“) zugeordnet. Geons sind ein Satz einfacher, dreidimensionaler Objekte, aus denen man durch Kombination komplexere Objekte erzeugen kann.
  • Sind die Unterobjekte (= Geons) erkannt und deren Anordnung zueinander bestimmt, kann das (Gesamt-)Objekt zugeordnet werden.

Bei der Zuordnung findet das eigentliche Erkennen statt. Das Objekt wird eingeordnet und repräsentiert dann ein Objekt einer Kategorie (wie z.B. Zuordnung als „Hund“ oder „Telefon“)

Gesichtswahrnehmung

Das Erkennen von Gesichtern zählt zu den wichtigsten sozialen Wahrnehmungsleistungen des Menschen. Gesichter müssen im Gegensatz zu vielen Alltagsobjekten singulär identifiziert werden und sind daher eine besondere Art von Wahrnehmungsschemata. Zur Gesichtserkennung dient aber nicht nur die Einprägung von konkreten Merkmalen (z.B.: Größe der Nase), sondern auch von deren Relationen (z.B.: Augenabstand).

Wie wichtig die Konfiguration von Merkmalen ist, konnten Leder und Bruce (2000) belegen. Probanden sollten sich verschiedene Gesichter einprägen und wurden danach abgeprüft. Dabei wurden ihnen die Bilder sowohl aufrecht als auch auf dem Kopf stehend gezeigt. In dieser umgekehrten Position waren es vor allem die Relationen zwischen den Merkmalen, die es den Probanden ermöglichten, die Gesichter zu erkennen.

Wie bereits aus der Gehirnforschung bekannt ist, ist bei Verletzung oder Schädigung bestimmter Kortexareale die Identifikation von bekannten Gesichtern nicht mehr möglich (Prosopagnosie). Dies legt die Theorie nahe, dass die Wahrnehmung von Gesichtern wohl durch spezialisierte Kortexfelder unterstützt wird. [12]

Beispiele für Untersuchung der visuellen Wahrnehmung

Die ersten zwei Sekunden bei der Betrachtung eines Bildes

In den Jahren nach 1960 wurden vermehrt Blickbewegungen aufgezeichnet und analysiert, z. B. beim Lesen von Texten [13] bei der Bildbetrachtung [14] und später auch beim Lösen visueller Probleme [15] und beim Autofahren. [16] Das Bild links zeigt, was in den ersten 2 Sekunden der Betrachtung eines Bildes geschehen kann. Der Hintergrund ist durch peripheres Sehen unscharf. Trotzdem kann man erkennen, dass es sich um eine Szene in einem Zimmer mit Personen handelt. Die erste Augenfixation zeigt ein paar Männerschuhe, vielleicht weil diese einen starken Kontrast aufweisen und außerdem sehr nahe bei der Grundposition der Augenfixationen liegen. Alle folgenden Fixationen springen von Gesicht zu Gesicht.

Man kann daraus schließen, dass das menschliche Gesicht im Normalfall die meiste Beachtung erhält, weil es eine Identifikation oder eine Beurteilung einer Person auf Grund biometrischer Ähnlichkeiten ermöglicht und so bereits eine erste Beurteilung einer zwischenmenschlichen Situation gestattet.

Eine wesentliche Tatsache: Die menschliche Wahrnehmung ist heuristisch und nicht linear d. h. es werden diejenigen Teile eines Bildes betrachtet, die zusätzliche Informationen enthalten, während subjektiv unwichtige oder bereits gut bekannte Bildelemente nicht fixiert werden (zusätzliche Beispiele siehe Blickbewegungsregistrierung).

Auf rechnerischer Ebene wurde von David Marr in der 1980er Jahren eine Theorie der Verarbeitung der Seheindrücke zur visuellen Wahrnehmung im Gehirn erstellt, die im Bereich der künstlichen Intelligenz ihre Anwendung findet. Diese Theorie wurde niemals experimentell überprüft.

Neurophysiologische Theorie

Eine neurophysiologisch orientierte Theorie der visuellen Wahrnehmung ist exemplarisch im Artikel Wahrnehmung dargestellt.

Verwandte Gebiete

Literatur

  • Jürg Nänni: Visuelle Wahrnehmung / Visual Perception. 2. Aufl., Niggli, Sulgen [u.a.] 2009, ISBN 978-3-7212-0618-0.

Quellen

  1. Bradley Steffens (2006). Ibn al-Haytham: First Scientist, Chapter 5. Morgan Reynolds Publishing. ISBN 1-59935-024-6.
  2. Howard, I: Alhazen's neglected discoveries of visual phenomena. In: Perception. 25. Jahrgang, 1996, S. 1203–1217, doi:10.1068/p251203.
  3. Omar Khaleefa: Who Is the Founder of Psychophysics and Experimental Psychology? In: American Journal of Islamic Social Sciences. 16. Jahrgang, Nr. 2, 1999.
  4. Quaderni d'anatomia IV fol. 12 verso, zitiert in Sandro Piantanida, Costantino Baroni (ed.), Kurt Karl Eberlein (Übersetzung): Leonardo da Vinci - Das Lebensbild eines Genies". Dokumentation der Leonardo-da-Vinci-Ausstellung in Mailand 1938. Lüttke-Verlag Berlin o.J. (1939/40). Nachdruck Emil Vollmer Verlag 1955. S. 430 http://books.google.de/books?id=qHASAQAAMAAJ&q=wirkungsloser
  5. Hans-Werner Hunziker, (2006) Im Auge des Lesers: foveale und periphere Wahrnehmung – vom Buchstabieren zur Lesefreude, Transmedia Stäubli Verlag Zürich 2006 ISBN 978-3-7266-0068-6
  6. Handbuch der physiologischen Optik / Bd. 1. Die Dioptrik des Auges 1909, 3. Aufl. / erg. u. hrsg. in Gemeinsch. mit A. Gullstrand; J. von Kries v. W. Nagel
  7. Hans-Werner Hunziker, (2006) Im Auge des Lesers: foveale und periphere Wahrnehmung – vom Buchstabieren zur Lesefreude, Transmedia Stäubli Verlag Zürich 2006 ISBN 978-3-7266-0068-6
  8. Mamassian, Landy & Maloney (2002) http://www.purveslab.net/research/ A Primer on Probabilistic Approaches to Visual Perception]
  9. Autorenkürzel hrb: Bildverarbeitung: Wie das Auge Signale verstärkt (HTML) Spiegel Online. 4. Mai 2011. Abgerufen am 5. Mai 2011.
  10. John R. Anderson:Kognitive Psychologie, ISBN 978-3-8274-1024-5
  11. Biederman: Recognition-by-Components:A Theory of Human Image http://geon.usc.edu/~biederman/publications/Biederman_RBC_1987.pdf
  12. Maderthaner, R. (2008). Psychologie. ISBN 978-3-8252-2772-2.
  13. TAYLOR, ST.: Eye Movements in Reading: Facts and Fallacies. American Educational Research Association, 2 (4), 1965, 187–202.
  14. Yarbus, A. L. (1967). Eye movements and vision, Plenum Press, New York
  15. Hunziker, H. W. (1970). Visuelle Informationsaufnahme und Intelligenz: Eine Untersuchung über die Augenfixationen beim Problemlösen. Schweizerische Zeitschrift für Psychologie und ihre Anwendungen, 1970, 29, Nr 1/2
  16. Cohen, A. S. (1983). Informationsaufnahme beim Befahren von Kurven, Psychologie für die Praxis 2/83, Bulletin der Schweizerischen Stiftung für Angewandte Psychologie

News mit dem Thema Visuelle Wahrnehmung

Die News der letzten Tage