Technischer Quantensprung: Beim Telefonieren mit dem Handy werden Stimmen künftig sehr viel natürlicher klingen. Denn Forscher haben einen neuen Codex entwickelt, der das hörbare Frequenzspektrum der Sprache komplett übertragen kann, statt wie bisher Teile wegzulassen. Dadurch klingen die Worte des Telefonpartners so natürlich, als würde er neben einem stehen. Der neue Codec EVS ist bereits weltweit eingeführt und in ersten Smartphones enthalten.
Smartphones sind wahre Alleskönner: Mit ihnen surfen, twittern oder mailen wir, sie helfen beim Navigieren, dienen als chemische Analysehelfer oder erkennen sogar Herzrhythmusstörungen. Ausgerechnet beim Hauptzweck der Handys gab es aber bisher kaum Fortschritte: der Sprachqualität beim Telefonieren.
Hohe Frequenzen weggeschnitten
Der Hauptgrund ist der bisherige Übertragungsstandard: „Das menschliche Ohr nimmt Frequenzen bis rund 20 Kilohertz wahr. Der bisherige Codec übermittelt aber nur Tonsignale in einem Frequenzbereich bis 3,4 Kilohertz“, erklärt Guillaume Fuchs vom Fraunhofer-Institut für Integrierte Schaltungen IIS in Erlangen. Das spart zwar Bandbreite, aber die Stimme dadurch dumpf und viele Stimmmerkmale werden weggeschnitten.
Das wird sich künftig ändern. Denn Fuchs und seine Kollegen haben gemeinsam mit Mobilfunkbetreibern und Geräteherstellern nun einen neuen Übertragungsstandard entwickelt. Der neue Codex „Enhanced Voice Services“ (EVS) ermöglicht es erstmals, das komplette hörbare Frequenzspektrum der Sprache zu übertragen – und dies bei Datenraten, die mit bisherigen Mobilfunkcodecs vergleichbar sind.
Wie von Angesicht zu Angesicht
„Der neue Codec überträgt je nach Bitrate Frequenzen bis 16 beziehungsweise bis 20 Kilohertz“, berichtet Fuchs. Statt dumpf und verzerrt hört man die Stimme des Telefonpartners dadurch so klar und natürlich wie im Gespräch von Angesicht zu Angesicht. Die Forscher vergleichen diese Entwicklung mit dem Technologiesprung vom Röhrenfernseher zum Flachbildschirm.
In Hörtests mit weltweit mehreren tausend Testpersonen hat sich der neue EVS-Standard bereits bewährt: Die Tester konnten kaum noch Unterschiede zwischen übertragener und natürlicher Sprache ausmachen. „Durch die bessere Reproduktion auch des Hintergrunds, nicht nur des primären Sprechers, ermöglicht der Codec auch eine wesentlich realistischere Durchführung von Video- oder Telefonkonferenzen“, ergänzt Markus Multrus vom IIS.
Als weltweiter Standard angenommen
Mittlerweile ist der Codec vom internationalen Standardisierungsgremium 3GPP angenommen. „In Japan, Korea, den USA und Deutschland wird EVS bereits kommerziell eingesetzt“, berichtet Stefan Döhla vom Fraunhofer IIS. „Schätzungen zufolge sind bereits 50 bis 100 Millionen Geräte mit EVS ausgerüstet.“
Die Anforderungen an einen solchen neuen Mobilfunk-Übertragungsstandard sind hoch. „Die Grundvoraussetzung besteht zunächst einmal darin, Sprache in guter Qualität zu übertragen – und zwar bei niedrigen Datenraten, so dass die Übertragung wirtschaftlich bleibt“ erklärt Multrus. Zudem sollte der Codec robust gegenüber Übertragungs-Fehlern sein, damit das Gespräch nicht abbricht.
Hinzu kommt, dass der Codex erkennen muss, ob gerade Musik oder Sprache übertragen wird – denn beides erfordert völlig andere Bearbeitungs- und Übertragungsmodi. Damit dies klappt, analysiert der EVS-Codec alle 20 Millisekunden, ob gerade Sprache oder Musik übertragen wird – und verwendet die jeweils passenden Algorithmen.
Stellvertretend für das 50-köpfige Team von Wissenschaftlern und Ingenieuren haben Multrus, Fuchs und Döhla jetzt für die Entwicklung des Sprachcodecs EVS den diesjährigen Joseph-von-Fraunhofer-Preis erhalten.
(Fraunhofer-Gesellschaft, 31.05.2017 – NPO)