Neuronales Audio Codec von Facebook

Facebook Research hat ein neuronales Audio Codec mit hoher Kompressionsrate und HiFi Qualität entwickelt und veröffentlicht. github.com/facebookresearch/encodec. Das Codec läuft in Echtzeit auf einer CPU und erreicht eine Kompression auf 1,5 kbps für Musik und 0,9 kbps für Sprache bei einer Audio-Bandbreite von 12 kHz. Es basiert auf schon länger bekannten Vorarbeiten und einer sogenannten CNN Architektur (Convolutional-Neural-Network). Neuronale Netze werden für Sprachassistenten und zur Sprachverbesserung verwendet, haben aber noch wenig Verwendung im Amateurfunk gefunden. Da ein großer Anteil (82%) des Internet-Verkehrs aus Audio- und Videoübertragung resultiert, gibt es ein hohes Interesse effiziente, d.h. hochkomprimierende Codecs zu entwickeln. Mit FreeDV gibt es ein digitales Sprachübertragungsverfahren für HF, das aber noch keine neuronalen Codecs benutzt. Neuronale, quelloffene Codecs können zukünftig zu einer deutlich verbesserten Sprachqualität und Frequenznutzung auf allen Afu-Bändern führen und bieten ein weites Feld für den digitalen Selbstbau.   Zur Demonstration und Beurteilung der Sprachqualität des EnCodecs hat Dr. Matthias Jung, DL9MJ, Audio-Files mit unterschiedlichen Kompressionsfaktoren erstellt. https://dl9mj.de/encodec/ . Dabei erreicht EnCodec eine Kompression bis zum Faktor 700 gegenüber dem originalen WAV-File, während ein Standard-MP3-File nur bei dem Faktor 2 liegt. Aktuelle Informationen dazu gibt es auch im DARC-Chat unter https://matrix.to/#/#nachrichtentechnik:darc.de . Eine HAM-Group zum Thema „KI im Amateurfunk“  ist in Vorbereitung.   Autor: Dr. Axel Richter, DM1AR / Foto: DL9MJ

Zurück