Was bedeutet SIP und was ist SIP-Telefonie?

Veröffentlicht am 8.8.2022 von Ines Bahr und Rahul Kumar

SIP ist ein unverzichtbares Protokoll für die Internettelefonie. Aber was bedeutet SIP genau? Wir erklären, was dahintersteckt und wie SIP-Telefonie funktioniert.

Was bedeutet SIP und was ist SIP-Telefonie?

Was bedeutet SIP? Das Session Initiation Protocol (SIP) ist ein beliebtes Protokoll für die Internettelefonie, das die Grundlage für alle Arten von Internet-Kommunikationssitzungen bildet. Es startet Sitzungen, verarbeitet Signale und beendet nach Sitzungsende die Verbindung.

Wenn du eine Antwort auf die Frage was bedeutet SIP willst, interessieren dich vielleicht auch folgende Fragen:

  • Wie werden Sprach- und Videoanrufe über das Internet übertragen?
  • Wie werden Nachrichten über IP-Netzwerke (Internetprotokoll) übertragen?
  • Wie funktionieren Anrufe über LTE- oder VoLTE-Netzwerke (Long Term Evolution bzw. Voice over Long Term Evolution)?

Um genau zu verstehen, wie internetbasierte Telefonsysteme und Netzwerkdienste wie SIP-Trunking funktionieren, musst du zuerst wissen, wie SIP funktioniert. In diesem Artikel wollen wir alle zentralen Fragen zu SIP beantworten und konzentrieren uns dabei auf das Protokoll selbst.

Was ist ein Internetprotokoll?

Das „P“ in SIP steht für „Protokoll“. Doch worum handelt es sich dabei eigentlich genau?

Was ist ein Internetprotokoll?
Ein Protokoll ist eine Reihe von Regeln, die festlegen, wie zwei oder mehr Computergeräte (Laptops, Smartphones, Router, Netzwerkswitches usw.) miteinander kommunizieren.

Der Einfachheit halben konzentrieren wir uns auf Protokolle, die beim Tätigen und Empfangen von Video- und Sprachanrufen über das Internet involviert sind. Dies wird als VoIP-Technologie (Voice over Internet Protocol) bezeichnet. Systeme, die die Übertragung von Sprach- und Videoanrufen über Internetnetzwerke ermöglichen, werden als VoIP- oder Business-Telefonsysteme bezeichnet.

Dabei darf nicht vergessen werden: VoIP selbst ist kein Protokoll. Es handelt sich um einen Oberbegriff für alle Technologien, die bei der Übertragung von Sprach- und Videoinformationen über IPS zum Einsatz kommen.

Die Kommunikation zwischen vernetzten Geräten über das Internet erfordert mehr als nur ein einzelnes Protokoll. Mehrere Protokolle arbeiten zusammen, indem sie in Schichten aufeinander aufbauen, was als „Protokoll-Stack“ bezeichnet wird. Es gibt verschiedene Modelle für die Protokollschichtung. Am häufigsten wird das von der International Organization for Standardization (ISO) entwickelte OSI-Modell (Open Systems Interconnection) verwendet.

OSI-Modell mit Protokollen für die VoIP-Technologie
Das OSI-Modell mit den Standorten der an der VoIP-Technologie beteiligten Protokolle (Quelle)

Was bedeutet SIP?

SIP ist ein Protokoll der Anwendungsschicht und die Grundlage der modernen interaktiven Kommunikation über das Internet (Sprach- und Videoanrufe usw.).

Wofür wird SIP verwendet und was ist SIP-Telefonie?

SIP initiiert und beendet IP-Kommunikationssitzungen, bei denen es sich beispielsweise um Videoanrufe zwischen zwei Personen oder Videokonferenzen in Teams handeln kann. Dazu werden Nachrichten in Form von Datenpaketen zwischen zwei oder mehr identifizierten IP-Endpunkten versendet, die auch als SIP-Adressen bezeichnet werden. Jede SIP-Adresse ist mit einem physischen SIP-Client (z. B. einem IP-Tischtelefon) oder einem Software-Client (z. B. einem Softphone) verbunden.

Das nachstehende Bild zeigt die Details der Initiierung einer SIP-Sitzung. INVITE ist eine SIP-Nachricht, mit der die Teilnahme eines anderen SIP-Clients angefordert wird. Diese Textblöcke ähneln E-Mail-Adressen und sind die SIP-Adressen der Teilnehmer.

Screenshot einer SIP-Einladungsnachricht
Eine SIP-Einladungsnachricht (Quelle)

Während dieser Sitzungen verschlüsselt, entschlüsselt oder transportiert SIP keine Informationen. Deshalb kann es für Videokonferenzen und Instant Messaging ebenso wie für Telefonate über das Internet genutzt werden. Die weiteren Anwendungsfälle von SIP wollen wir an dieser Stelle beiseite lassen und uns darauf konzentrieren, wie das Protokoll bei Sprachanrufen funktioniert.

Wie funktioniert SIP bei einem VoIP-Anruf?

Bei VoIP-Anrufen funktioniert SIP nicht alleine. Mehrere andere Protokolle sorgen gemeinsam mit SIP dafür, dass Sprachdaten ihr Ziel erreichen. Eines davon ist das Session Description Protocol (SDP).

Während SIP mit IP-Endpunkten kommuniziert, um Signaldetails auszutauschen, überträgt SDP sitzungsbezogene Informationen, damit die Teilnehmer Sitzungen beitreten oder Sitzungsdetails empfangen können. Es sendet drei Arten von Informationen: Sitzungsbeschreibung, Zeitbeschreibung und Medienbeschreibung. Dabei transportiert SDP nicht die Informationen selbst. Stattdessen werden die Sitzungsbeschreibungen im Payload der SIP-Nachrichten übertragen.

Vor der Übertragung über das Netzwerk wird die Sprachinformation mit Codecs kodiert, die Audiosignale in binäre Daten umwandeln. Es gibt viele Codecs, die zu diesem Zweck verwendet werden, doch die üblichsten sind folgende:

  • Coded G.711: Wird für unkomprimierte digitale Sprachdaten verwendet. Die Audioqualität ist besser als bei anderen Codecs, doch auch die Bandbreitennutzung ist höher.
  • Coded G.729: Wird für komprimierte digitale Sprachdaten verwendet. Die Audioqualität wird reduziert, um die Menge der übertragenen Daten und die Brandbreitennutzung zu reduzieren.

Kodierte Pakete mit Audiodaten werden vom Real-Time Transport Protocol (RTP) übertragen, einem spezialisierten Protokoll der Anwendungsschicht, das für das Echtzeit-Streaming von Audio- und Videodaten verwendet wird. RTP-Sitzungen sind von SIP unabhängig. Sie laufen parallel zu SIP-Sitzungen, anders als bei SDP, wobei es sich um einen Payload von SIP handelt.

RTP läuft neben dem RTP Control Protocol(RTCP), das mit der Servicequalität zusammenhängende Informationen überträgt, einschließlich der Zahl der ausgetauschten Datenpakete, der Zahl der verlorenen Pakete und der Roundtrip-Verzögerungszeit. Mithilfe von RTCP-Informationen kann die Servicequalität von Sitzungen überwacht werden. RTCP-Informationen werden nicht mit dem RTP-Datenstrom kombiniert und werden über separate, parallel zu den RTP-Streams laufende Sitzungen übertragen.

Das nachstehende Bild zeigt den Austausch von RTP- und RTCP-Datenpaketen in einer VoIP-Sitzung mit drei Teilnehmern.

Schematische Darstellung vom RTP- und RTCP-Datenfluss
RTP- und RTCP-Datenfluss in einer VoIP-Sitzung (Quelle)

RTP-, RTCP- und SIP-Datenpakete (mit dem SDP-Payload) werden über Protokolle der Transportschicht an ihre Ziele transportiert. Die zwei am häufigsten genutzten Protokolle sind die folgenden:

  • Transmission Control Protocol (TCP): Transportiert Pakete in einer festen Reihenfolge. Für jedes gesendete Paket sendet die empfangende Stelle ein Paket zur Bestätigung zurück. Wenn das Bestätigungspaket innerhalb eines bestimmten Zeitraums nicht erhalten wird oder wenn es die Information enthält, dass ein Problem aufgetreten ist, wird das ursprüngliche Paket erneut versendet. TCP ist auf Genauigkeit ausgelegt und stellt sicher, dass Datenpakete in ihrer ursprünglichen Reihenfolge ausgeliefert werden.
  • User Datagram Protocol (UDP): Überträgt Daten, ohne aus der Reihenfolge fallende Pakete zu erkennen oder verlorene Pakete erneut zu senden. Pakete können nicht nur in falscher Reihenfolge zugestellt werden, sondern auch ganz ausgelassen werden. Das Hauptziel von UDP besteht darin, Pakete schnellstmöglich an ihr Ziel zu befördern.

Durch diesen Fokus auf die Datenübertragung in Echtzeit ist UDP für VoIP-Anrufe besser geeignet als TCP. Verlorene oder aus der Reihenfolge fallende Pakete können zwar leichte Probleme mit der Audioqualität hervorrufen, aber meist ist dies für menschliche Ohren nicht wahrnehmbar. Außerdem kann die Verzögerung, die durch die Neuordnung und Neuübertragung von TCP-Paketen entsteht, zu einer schlechten Audioqualität oder sogar zum Abbruch von Anrufen führen.

Rahmen eines VoIP-Anrufs zwischen zwei Endpunkten

Falls an dieser Stelle die Frage auftaucht, warum SIP so wichtig ist, wenn es einfach nur dem Aufbau und der Beendigung von Anrufen dient: Die Telekommunikationsbranche hat SIP genau deshalb als bevorzugtes Protokoll für die VoIP-Kommunikation gewählt, weil es nicht an der Verschlüsselung und Übertragung von Daten beteiligt ist. Es stellt einfach eine Sitzung über das Netzwerk her.

Außerdem waren zur VoIP-Unterstützung geschriebene Protokolle mit der Zeit veraltet und mussten jedes Mal umständlich neu geschrieben werden, wenn etwas ausgebessert werden musste. Diese Herausforderung kann mit SIP überwunden werden. SIP soll als Standardprotokoll dienen, bei dem ein weiterer Standard die zu übertragenden Medien festlegt, sodass das Protokoll nicht noch einmal neu geschrieben werden muss.

Fazit und nächste Schritte

Dieser grobe Überblick über die in VoIP-Anrufe involvierten Protokolle sollte für die meisten im IT-Management tätigen Personen ausreichend sein. Falls du Anwendungen in Telekommunikationsunternehmen entwickelst, musst du die Funktionsweisen aller Protokolle und die Beziehungen zwischen ihnen kennen.

Wenn du nur ein VoIP-Telefonsystem einsetzt und verwaltest, sollten die Informationen aus diesem Artikel mehr als ausreichend sein. Für das IT-Management ist es jedoch oft wichtig, sich mit SIP-Trunking auszukennen, einem Netzwerkdienst, der für das Funktionieren der meisten IP-Telefonsysteme entscheidend ist. 

Dieser Artikel kann auf Produkte, Programme oder Dienstleistungen verweisen, die in deiner Region nicht verfügbar sind oder die durch die Gesetze oder Vorschriften des Landes eingeschränkt sein können. Wir empfehlen, sich direkt an den Softwareanbieter zu wenden, um Informationen über die Produktverfügbarkeit und Rechtskonformität zu erhalten. Gender Hinweis: Aus Gründen der besseren Lesbarkeit wird bei Personenbezeichnungen und personenbezogenen Hauptwörtern auf dieser Website die männliche Form verwendet. Entsprechende Begriffe gelten im Sinne der Gleichbehandlung grundsätzlich für alle Geschlechter. Die verkürzte Sprachform hat nur redaktionelle Gründe und beinhaltet keine Wertung.

Über den Autor oder die Autorin

Senior Content Analyst für Capterra und GetApp. Spezialisiert auf Studien und Digitalisierungs-Tipps für KMU. Masterstudium in Medien und Kommunikation, lebt im sonnigen Barcelona.

Senior Content Analyst für Capterra und GetApp. Spezialisiert auf Studien und Digitalisierungs-Tipps für KMU. Masterstudium in Medien und Kommunikation, lebt im sonnigen Barcelona.