Jump to content

Häufig gestellte Fragen zu Polycom® Siren/G.722.1

Kontakt

Was ist G.722.1?

Die ITU-T-Empfehlung G.722.1 wurde am 30. September 1999 nach einem vierjährigen Auswahlprozess mit intensiven Testphasen zugelassen und stellt einen der modernsten Breitband-Audiokomprimierungsalgorithmen nach internationalen Standards dar. Er basiert auf der Polycom Siren-Komprimierungstechnologie der dritten Generation und ist vom bewährten Polycom PT716plus-Algorithmus abgeleitet. Polycom hat diese Technologie entwickelt, um die anspruchsvollen Audiofunktionen zu liefern, die die Multimedia-Community erwartet. G.722.1 bietet qualitativ hochwertige Audioausgabe bei geringen Bitraten mit geringer Verzögerung und sehr geringer Komplexität. Der Standard funktioniert mit allen Audiosignalen, auch Sprache, Musik und Gesang.

Zurück zum Seitenanfang

Was ist Siren mit 16 Kbps?

Siren mit 16 Kbps ist eine Erweiterung des Standards G.722.1, die mit 16 Kbps funktioniert.

Zurück zum Seitenanfang

Wie erhalte ich die ITU-T-Empfehlung G.722.1?

Ein elektronisches Exemplar der G.722.1 kann direkt in der Online-Bibliothek der ITU erworben werden: http://www.itu.int/rec/T-REC-G.722.1/en.

Die Nutzung der ITU-T-Empfehlung G.722.1 geschieht über eine Lizenzvereinbarung mit Polycom.

Zurück zum Seitenanfang

Was genau steht in der ITU-T-Empfehlung G.722.1?

Die ITU-T-Empfehlung G.722.1 umfasst die folgenden Punkte:

  • Beschreibung des Breitband-Codieralgorithmus.
  • C-Referenzcode für Encoder und Decoder.
  • Testvektoren (Signale), ein Tool für die Überprüfung der korrekten Implementierung.

Zurück zum Seitenanfang

Wie implementiere ich G.722.1?

Erwerben Sie zuerst ein Exemplar der G.722.1 von der ITU-T. Die Empfehlung G.722.1 enthält alle wichtigen Informationen zur Implementierung des Algorithmus'. Die Ausgabesignale der G.722.1-Implementierung sollten auf jeder Hardware der des C-Referenzcodes entsprechen, wenn dieselben Eingabesignale verarbeitet werden. Die Testvektoren, die mit dem Standard geliefert werden, sind für Testzwecke vorgesehen, um so die Richtigkeit der Implementierung zu überprüfen.

Es stehen Eingabe- und Ausgabe-Testvektoren zur Verfügung, um die Encoder- und Decoder-Implementierungen zu prüfen. Die Testvektoren wurden so entwickelt, dass sie den allergrößten Teil des Algorithmuscodes ausführen. Deshalb kann jede Implementierung, die die Ausgabe-Testvektoren erfolgreich ausgeführt hat, auch den C-Referenzcode korrekt wiedergeben.

Zurück zum Seitenanfang

Herunterladen einer Demo für G.722.1

Das Programm SirenZip lässt sich unter Microsoft Windows 95 oder einer neueren Version des Betriebssystems Microsoft Windows ausführen. Es führt G.722.1 mit einer von drei auswählbaren Bitraten aus (16 Kbps, 24 Kbps oder 32 Kbps). Laden Sie das kostenlose SirenZip herunter (Größe: 208 KB).

So verwenden Sie SirenZip

  • Sobald Sie SirenZip heruntergeladen haben, ist das Programm ausführbereit.
  • Doppelklicken Sie auf „SirenZip.exe“ und anschließend auf „Siren Encode“. Geben Sie die entsprechende Audioquelle und die Dateinamen für den Ausgabe-Bitstrom ein. Wählen Sie die richtige Bitrate, und klicken Sie dann auf „Play Wav Input“, um die Eingabedatei wiederzugeben, oder klicken Sie auf „Encode Wave Input“, um die Datei mit G.722.1 zu komprimieren.
  • Um sie zu decodieren, klicken Sie auf Siren Decode, und geben Sie die entsprechende Audioquelle und die Dateinamen für den Ausgabe-Bitstrom ein. Klicken Sie dann auf Play Wav Output, um die mit G.722.1 decodierte Ausgabedatei wiederzugeben, oder klicken Sie auf Decode Bitstream, um die Audioausgabe mit G.722.1 zu synthetisieren.
  • Sie sollten bei der Verwendung von SirenZip Folgendes beachten:
    • Der Encoder unterstützt Audio-Eingabedateien in einem Mono-Wave-Format.
    • Der Decoder gibt Audiodateien in einem Mono-Wave-Format aus.
    • Die Bitrate kann im Encoder festgelegt werden, und der Decoder erkennt die richtige Bitrate automatisch.
    • Audio-Eingabedateien, die länger als 60 Sekunden sind, werden nach 60 Sekunden abgeschnitten.
    • Die Audio-Eingabe kann zwei Raten nutzen: 16.000 Hz oder 22.050 Hz. Wenn die Eingabe mit 22.050 Hz geschieht, wird sie von SirenZip in die korrekten 16 kHz umgewandelt, was zu Änderungen in der Audio-Klangtreue führen kann. Es wird empfohlen, immer 16 kHz zu verwenden.

Zurück zum Seitenanfang

Technische Daten

G.722.1 wird im ITU-T-Standard als Festkomma-Algorithmus spezifiziert. Eine Gleitkomma-Version wird von der ITU-T in der Zukunft als Standard festgelegt, der mit dem Festkomma-Standard kompatibel sein wird. (Polycom verfügt über eine kompatible Gleitkomma-Version.) Die unten angegebenen MIPS-Komplexitäten sind Beispiele aus nicht optimierten Implementierungen auf drei verschiedenen DSP-Typen. Zwei der dargestellten DSPs sind Gleitkommaeinheiten.

Allgemeine Parameter für G.722.1

Parameter

Wert

Audiorate

16 kHz

Bitrate (Rate kann sich an den Frame-Grenzen ändern)

16, 24, 32 Kbps (16 Kbps ist eine Erweiterung des Standards von Polycom)

Audiobandbreite

 

50 Hz – 7 kHz

Audio-Frame-Größe

 

20 ms

Algorithmische Verzögerung (siehe Hinweis 1)

 

40 ms

 

RAM (Festkomma)

 

< 7,5 KB

ROM-Tabellenbereich (Festkomma)

 

~ 20 KB

 

MIPS-Verhältnis zwischen Encoder und Decoder

 

etwa 1:1

 

MIPS-Beispiele für verschiedene Prozessoren

 

Prozessor

MIPS (Encoder und Decoder)

TI TMS320C50

 

13,9 (= 6,95 + 6,95) (nicht optimierter Code für G.722.1 mit Festkomma)

 

TriMedia TM 1300

 

4 (= 2+2) (Gleitkomma-Implementierung)

 

TI TMS320C31

9,25 (= 4,51+4,51) (Gleitkomma-Implementierung)

 

Zurück zum Seitenanfang

Warum Breitband?

Herkömmliche Telefonie wird als „Schmalband“ bezeichnet, da sie Audiosignale nur im Bereich von 300 bis 3500 Hz verarbeiten kann, was einer Bandbreite von nur 3,2 kHz entspricht. Dadurch erhalten Telefongespräche ihren typischen „blechernen“ Klang im Vergleich zum reichen Breitbandklang von Hi-Fi-Systemen. G.722.1 stellt 7 kHz Audio-Bandbreite (50 – 7000 Hz) zur Verfügung – eine deutliche Verbesserung, die eher Radioqualität entspricht als der herkömmlichen Telefonqualität. Breitband-Audio erhält im Vergleich zu Schmalband-Audioqualität immer den Vorzug.

Haben Sie zum Beispiel in einem Telefongespräch schon einmal die Wörter „sein“ und „fein“ falsch verstanden? Die Töne „s“ und „f“ werden besonders häufig verwechselt, da die hohen Frequenzen, in denen diese Unterscheidung normalerweise stattfindet, nicht gut genug wiedergegeben werden. Eine solche Verwechslung tritt mit der Breitbandcodierung nicht mehr auf, da alle Frequenzen, die für die menschliche Sprache benötigt werden, vollständig wiedergegeben werden.

Das gesamte Audioerlebnis bei der Verwendung von Breitband ist wesentlich natürlicher und entspannender für die Ohren.

G.722.1 kann auch hervorragend Musik wiedergeben, was bislang nur bei wesentlich höheren Bitraten der Fall war. Der Klang übertrifft sogar den von AM-Radio.

Zurück zum Seitenanfang

Anwendungen

Beispiel für Anwendungen von G.722.1 und Siren mit 16 Kbps:

  • Breitband-IP-Telefonie
  • Streaming-Audio (einschließlich Musik!) über das Internet
  • Videokonferenzen
  • Audiokonferenzen
  • Wiedergabe gespeicherter Audiodateien (z. B. Recorder)
  • Messaging-Programm (Voicemail)
  • Audio auf Websites

IP-Telefonie sowie Video- und Audiokonferenzen haben sehr ähnliche Anforderungen an ihre Audiodaten: Hohe Qualität mit geringen Latenzzeiten und geringer Komplexität. Zudem muss die Bitrate geändert werden können, wenn verschiedene Kanäle genutzt werden. G.722.1 ermöglicht in einer Frame-Grenze von 20 ms eine Änderung der Rate zwischen 24 und 32 Kbps und die Siren-Erweiterung mit 16 Kbps.

Bei Streaming-Anwendungen sind eine geringe Komplexität und geringe Kosten ein absolutes Muss. G.722.1 erfüllt diese Anforderungen, ohne Abstriche bei der Qualität machen zu müssen. Die Bitraten von 16, 24 und 32 Kbps ermöglichen Audio mit besserer Qualität, selbst bei Modemverbindungen mit 56 Kbps (V.90).

Bei Voicemail handelt es sich um eine Anwendung, für die Daten gespeichert und weitergeleitet werden. Eine geringe Komplexität ermöglicht eine Implementierung kostengünstiger Hardware. Die qualitativ hochwertige Audiokomprimierung sorgt für eine hervorragende Wiedergabe von Musik-Clips wie auch der Sprache des Anrufenden.

Zurück zum Seitenanfang

Hören Sie sich G.722.1 und Siren mit 16 Kbps selbst an.

Laden Sie diese WAV-Dateien herunter, um sich die Qualität von G.722.1 selbst anzuhören.

(Diese Beispieldateien sind nicht komprimierte WAV-Dateien, die sich auf allen Computern wiedergeben lassen. Sie benötigen den G.722.1-Codec nicht, um sie abzuspielen; jedoch verlängern sich hierdurch die Download-Zeiten.)

Sprachdateien

Download

3,5 kHz Audiobandbreite, Qualität eines POTS-Ferngesprächs

  speech_3p5kHz_mulaw.wav (Download-Größe: 114 KB)

7 kHz Audiobandbreite, codiert mit 16 Kbps über Siren

 speech_16kbps_siren.wav (Download-Größe: 452 KB)

7 kHz Audiobandbreite, codiert mit 24 Kbps über G.722.1

 speech_24kbps_g722p1.wav (Download-Größe: 452 KB)

7 kHz Audiobandbreite, codiert mit 32 Kbps über G.722.1

 speech_32kbps_g722p1.wav (Download-Größe: 452 KB)

Musikdateien

Download

3,5 kHz Audiobandbreite, Qualität eines POTS-Ferngesprächs

 music_3p5kHz_mulaw.wav (Download-Größe: 72 KB)

7 kHz Audiobandbreite, codiert mit 16 Kbps über Siren

 music_16kbps_siren.wav (Download-Größe: 286 KB)

7 kHz Audiobandbreite, codiert mit 24 Kbps über G.722.1

 music_24kbps_g722p1.wav (Download-Größe: 286 KB)

7 kHz Audiobandbreite, codiert mit 32 Kbps über G.722.1

 music_32kbps_g722p1.wav (Download-Größe: 286 KB)

Zurück zum Seitenanfang

Vergleichen Sie Siren™ mit Windows Media Player und MP3

Benutzer, die eine langsame Internetverbindung nutzen, können Siren auch ohne Qualitätsabstriche bei geringen Bitraten verwenden (z. B. wenn der Internetzugang über DFÜ-Modems mit 28,8 bis 56 Kbps erfolgt). Vergleiche anhören:

Siren mit 14 kHz Audiobandbreite bei 22 Kbps im Vergleich zu Windows Media Player (unterstützt nur Raten bis 44 kHz bei 22 Kbps)*.

Bitrate

Download

Download

22 Kbps

 siren_22kbps.wav

 wmplayer_22kbps.asf

*Die Bandbreite des Windows Media Player entspricht immer der höchsten Bitrate, sodass die höhere Rate mit 44 kHz nur mit 20 kHz wiedergegeben werden kann.

Siren mit 14 kHz Audiobandbreite bei 24 Kbps im Vergleich zu MP3 (höchstens 11 kHz Audiobandbreite bei 24 Kbps)

Bitrate

Download

Download

24 Kbps

 siren_24kbps.wav

 mp3_24kbps.asf

Zurück zum Seitenanfang

Kapazitäten sind austauschbar für H.320-, H.323- und H.324-Systeme

Damit Geräte verschiedener Anbieter bei der Verwendung von G.722.1 zusammenarbeiten können, ist es notwendig, den Kapazitätenaustausch und die Modusauswahl für G.722.1 zu standardisieren. Diese technischen Aspekte für H.320, H.323 und H.324 wurden von der ITU-T Study Group 16 festgelegt.

Die Lizenznehmer erhalten alle erforderlichen Informationen für die Verwendung von G.722.1 gemäß ITU-T-Standards sowie für den Kapazitätenaustausch und die Verhandlungsprozeduren für eine anbieterübergreifende, kompatible Verwendung der 16-Kbps-Erweiterung des Standards von Polycom.

Zurück zum Seitenanfang

Was ist die ITU?

Die ITU ist die International Telecommunications Union (Internationale Fernmeldeunion) mit Sitz im Schweizerischen Genf. Die ITU ist die älteste internationale Organisation (1865 gegründet) der Welt und gehört mittlerweile zu den Vereinten Nationen. Sie ist für die Standardisierung der Technologie für internationale Telekommunikation verantwortlich, so auch für Telefon, Radio und Datenkommunikation. Weitere Informationen finden Sie auf der Website der ITU unter http://www.itu.int.

Zurück zum Seitenanfang

Technischer Kontakt

Wenn Sie weitere technische Informationen erhalten möchten, schreiben Sie eine E-Mail an: SirenInfo@polycom.com

Lizenzregistrierung und Lizenzgebühren

Der Lizenzplan und als Beispiel dienende Lizenzvereinbarungen finden Sie unter: Lizenzgebühren und Lizenzbedingungen

www.polycom.de bietet produktspezifische Informationen für Kunden von Telepresence, Voice und Video Conferencing in Deutschland und Schweiz.

Airport Business Center, Am Söldnermoos 17, 85399 Hallbergmoos. Niederlassung in der Schweiz

Tel.: +49 811 9994 100, Hotline: +49 811 9994 222 - kontakt@polycom.com

© Polycom, Inc. Alle Rechte vorbehalten.