Warum fällt es uns schwer, unsere Stimme zu erkennen, wenn sie aufgenommen wird?

Wir schreiben nicht dasselbe, wie wir sprechen. Durch eine gesunde Sprache kümmern wir uns um viele Details und passen die Intonation an, um wichtige Ideen zu wiederholen, Missverständnisse, Verwirrung oder Doppeldeutigkeiten zu vermeiden oder genau das Gegenteil zu bewirken.

Und die menschliche Stimme ist der wichtigste Ton in unserer Umgebung, möglicherweise der, den wir unser ganzes Leben lang am häufigsten hören. Wenn es sich bei dem Sprecher um eine bekannte Person handelt, können wir sie anhand ihrer Stimme identifizieren und das visuelle Bild aktivieren, das wir von ihr in unserem Gedächtnis gespeichert haben, eine Fähigkeit, die im Alter von etwa sieben Monaten zum Vorschein kommt.

Es fällt uns schwer, unsere Stimme zu erkennen

In gewisser Weise ist unsere Stimme sehr spezifisch, sie sagt viel über uns aus, sie ist eine unserer Visitenkarten für die Welt und mit ihr bilden die Menschen um uns herum ein nicht immer zutreffendes Stereotyp von uns, wenn sie uns treffen.

Und was uns eine laute Stimme vermittelt, ist ganz anders als das, was uns eine laute, energische und dröhnende Stimme vermittelt. Das Gleiche passiert mit einer hohen, kaskadierenden, metallischen oder silbrigen Stimme.

Durch künstliche Intelligenz ist seit einiger Zeit eine Spracherkennung möglich, deren Leichtigkeit darin besteht, die Kommunikation zwischen Menschen und Computersystemen zu ermöglichen. Durch ein Erkennungssystem können die Wörter, die ein Mensch auf natürliche Weise ausstößt, erkannt und verstanden werden.

Es ist offensichtlich, dass „Maschinen“ uns erkennen können, aber was ist mit uns? Erkennen wir uns in einer Aufnahme wieder? Sicherlich haben wir uns selbst mehr als einmal in einer Audio- oder Sprachnotiz gehört und es hat uns überhaupt nicht gefallen, wir identifizieren diese Stimme als seltsam, fremd für uns. Es erscheint uns anders und in der Regel von schlechterer Qualität, sehr unradiofreundlich.

Lesen Sie auch  Die neue Smart Gun von Biofire nutzt Biometrie als Sicherheitsmechanismus

Und wenn wir noch hinzufügen, dass die Menschen um uns herum bestätigen, dass unsere Stimme tatsächlich so klingt, ist der Grad der Fremdartigkeit noch größer.

In einer klassischen Studie, die vor mehr als fünf Jahrzehnten durchgeführt wurde, wurde eine Gruppe von Freiwilligen verschiedenen Reizen ausgesetzt, um zu überprüfen, inwieweit sie sich darin wiedererkannten. Die Ergebnisse waren schockierend: Nur 38 % konnten ihre Stimme sofort erkennen. Kürzlich, im Jahr 2010, bestätigte eine weitere Studie die Geschwindigkeit der Selbsterkennung. In diesem Fall war die Überraschung groß: 90 % erreichten sie.

Zwei verschiedene Kanäle für dieselbe Version

Wenn wir sprechen, vibrieren unsere Stimmbänder und erzeugen einen Ton, der durch den Mund austritt und durch die Luft zur Außenseite unseres Ohrs gelangt, wo er mit dem Trommelfell in Kontakt kommt und eine Vibration verursacht.

Durch das Hören durch die Luft nehmen wir die Stimmen der Menschen um uns herum wahr, von Freunden und Fremden, mit denen wir ein Gespräch führen.

Die Trommelfellschwingung erreicht das Innenohr, insbesondere einen anatomischen Bereich namens Cochlea oder Schnecke, der den Schall in einen elektrischen Impuls umwandelt, der schließlich über den Hörnerv das Gehirn erreicht.

In gewisser Weise verarbeiten die kortikalen Bereiche den Reiz und bilden einen „Durchschnitt“ zwischen den beiden Signalwegen – der Luft und dem Knochen – und das Ergebnis ist, dass sie diese Stimme als unsere, als ihre eigene identifizieren, ja, etwas tiefer als die andere hören zu.

Auch unsere Worte, die wir im Kehlkopf erzeugen, folgen einem anderen, direkteren Weg, nämlich durch die Schädelknochen. Intuitiv wissen wir das alle, deshalb halten wir uns die Ohren zu, wenn wir singen und stimmen wollen, um das Eintreffen von Informationen durch die Luft zu verhindern.

Lesen Sie auch  die Vergangenheit am Fuße der Pyrenäen

Dieser Weg – der Knochenweg – verläuft über einen „Pflaster“ mit histologischen Strukturen größerer Dichte, weshalb seine Reisenden schwerwiegendere Frequenzen aufweisen. Dies erklärt, warum wir die aufgenommene Version unserer Stimme, die nur den durch die Luft transportierten Anteil enthält, fälschlicherweise als höher wahrnehmen.

Leave a Reply

Your email address will not be published. Required fields are marked *

This site uses Akismet to reduce spam. Learn how your comment data is processed.