Das Internet
Was ist das Internet?                     Geschichte des Internet 

Was ist das Internet?

In diesem Abschnitt wollen wir uns der Frage widmen: Was ist das Internet?
Wer etwas detailliertere Informationen wünscht, der wird in den folgenden Abschnitten fündig.

Was ist es also, das Internet? Ein globaler Verbund diverser Computernetze, die alle über ein Protokoll miteinander kommunizieren: TCP/IP. Innerhalb des Internets gibt es verschiedene Dienste: Das WWW gehört dazu, genauso wie FTP oder IRC. Es ist ein grundlegender Fehler, das World Wide Web mit dem Internet an sich zu verwechseln.

Das Internet ist also die zugrundeliegende Infrastruktur. Inzwischen hat diese Infrastruktur sich über die ganze Welt ausgebreitet. Internet-Zugänge und -Server gibt es in Europa, Asien und Afrika - selbst in Entwicklungsländern ist heutzutage ein Zugang möglich, wenn auch nur eingeschränkt.
Nach oben

Technische Informationen

Rein technisch funktioniert das Internet folgendermaßen: Kommunikation verläuft, indem Datenpakete ausgetauscht werden. Dabei werden große Dateien oder Datenmengen in viele kleine Dateien aufgeteilt. Übertragen werden diese über die Protokolle TCP und UDP. TCP sorgt dafür, dass Daten grundsätzlich komplett ankommen. UDP dagegen ignoriert Datenverluste, ist daher aber auch schneller. Da TCP die eigentlich entscheidende Rolle spielt - von Ausnahmen wie z.B. Online-Spielen einmal abgesehen - werden wir uns im Folgenden auf dieses Protokoll beschränken.

Jedes Datenpaket enthält gewisse Informationen: entscheidend ist dabei die Angabe, woher es kommt und wohin es weitergeleitet werden soll. Da das Internet ein dezentrales Netzwerk ist, muss ein Datenpaket oft einen verschlungenen Weg durch die Infrastruktur des Netzes nehmen: Pakete werden nicht direkt weitergeleitet, sondern passieren auf ihrem Weg eine Vielzahl anderer Hosts. Vergleichen ließe sich das mit einem Reisenden, der von einer Insel zur anderen reist, um schließlich auf seiner Ziel-Insel anzukommen.

Jeder Internet-Server überprüft also, ob ein ankommendes Datenpaket überhaupt für ihn bestimmt ist. Ist es das nicht, so leitet er es an den nächsten, geeigneten Host weiter. Um hier Umwege möglichst zu vermeiden, verfügen die Hosts über Routing-Tabellen. Dort ist gespeichert, an welchen Host ein Paket am besten weitergeleitet werden sollte.

Problematisch wird es, wenn ein Host z.B. gar nicht existiert - ein Datenpaket würde dann, ohne Ende oder Abschluss, durch das Internet geistern - jeder Server würde feststellen, dass das Paket nicht für ihn bestimmt ist und es daher an den nächsten Host weiterreichen, der sich genauso verhielte.

Man braucht also eine Beschränkung der Weitergaben, also der Sprünge von einem Host zum nächsten. Deshalb ist in jedem Datenpaket eine Zahl gespeichert, die angibt, wie oft das Paket noch weitergereicht werden darf. Bei jeder Weiterleitung eines Pakets wird diese Zahl um 1 reduziert. Ist der Zahl gleich 0, wird das Paket gelöscht.

Eingangs wurde erwähnt, dass TCP keine Datenverluste akzeptiert. Es gibt zwei Aspekte im Protokoll, die das ermöglichen: TCP ist ein verbindungsorientiertes Protokoll, was bedeutet, dass vor jeder Übertragung erst einmal eine Verbindung geöffnet werden muss. Datenpakete enthalten daher auch Daten, die die Verbindung betreffen. Zusätzlich dazu sind die Pakete nummeriert - kommt eines nicht beim Empfänger an, so kann er es erneut anfordern.

Sender um Empfänger sind im Datenpaket als IP-Nummer gespeichert. Auch ein Port gehört dazu. Aber wie schafft der Browser es, die URL http://www.AboutWebDesign.de in eine IP-Nummer samt Port umzuwandeln?
Nach oben

IP-Nummern, URLs, Domain-Namen und DNS

Jeder Internet-Server wird zunächst mit Hilfe einer IP-Nummer eindeutig identifiziert. Im Moment gilt die Version 4 des IP-Standards, was bedeutet, dass die IP-Nummer aus 4 Bytes bzw. Zahlen (also Werte von 0 bis 255) besteht: z.B. 192.67.198.55.

Der verfügbare IP-Adressraum ist dabei in verschiedene Bereiche unterteilt: Die Class A-, B-, C- und D-Netzwerke. Class A-Netzwerke können mehr als 16 Millionen Hosts enthalten, Class B-Netzwerke ca. 65000 und Class D-Netzwerke nur 256. Wieso das? Class A-Netzwerke sind z.B. für sehr große Firmen oder Internet-Provider geeignet. Das heißt, dass eine Firma den gesamten Adressraum reservieren kann, der mit einer 1 beginnt, also 1.x.x.x.

Problematisch daran ist nur, dass es nach diesem Modell nicht unendlich viele IP-Adressen geben kann. Inzwischen ist das ziemlich konkret geworden - extrem viele IP-Adressen sind schon vergeben. Daher wird in den nächsten Jahren ein neuer Standard eingeführt: IPv6. Damit sollten solche Probleme endgültig - und zwar wirklich endgültig - der Vergangenheit angehören.

Was zur Adressierung noch fehlt, ist die Port-Nummer. Die Port-Nummer definiert, welcher Dienst auf einem Server angesprochen wird. Für das WWW (bzw. das zugehörige Protokoll HTTP) steht z.B. die Nummer 80. Alle Pakete mit Portnummer 80 werden also an den HTTP-Server weitergeleitet, der auf genau diesem Port "lauscht". Genauso "lauscht" der Browser des Surfers auf einem bestimmten Port, an den die Antwort vom Server geschickt wird.

Es bleibt die Frage, wie denn nun eine URL (= eindeutige Adresse) in eine IP-Adresse samt Port-Nummer umgewandelt werden kann.

Die URL besteht aus verschiedenen Teilen: Protokoll, Servername und Domain-Name. Erläutern werden wir dies am Beispiel http://www.wosys.de.   http:// ist das Protokoll, bedeutet also "Port 80". www ist der Name des Servers - nahezu alle WWW-Server heißen auch "www". Es folgt ein Punkt, dann der Domain-Name wosys.de. Der Domain-Name selbst wiederum enthält die Top-Level-Domain de.

Viele Menschen haben Probleme mit der Unterscheidung zwischen Server-Name und Domain-Name. Zugegeben, die Terminologie ist durchaus verwirrend: Oft meint man mit Server-Name die ganze URL. Verbildlichen lässt der Unterschied sich folgendermaßen: Der Domain-Name adressiert den Teich, der Server-Name den einzelnen Fisch im Teich. Soll heißen: die Domain steht im Grunde für eine Art Netzwerk, der Server-Name für einen einzelnen Computer innerhalb des Netzwerks.

Soll nun eine URL aufgelöst werden, wird zunächst der Port festgestellt. Danach folgt die Top-Level-Domain: de steht für Deutschland, die Daten stammen also vom deutschen Domain Name Server. Der Domain Name Server ist ein spezieller Computer, der eine Adresse wie www.wosys.de in eine IP auflösen kann.

Das Domain Name System, also der Verbund aller Domain Name Server, kann baumartig visualisiert werden: der Root-Server in den USA verzweigt zu den deutschen Servern, die wiederum zu den einzelnen Name Servern der Provider verzweigen.

Nach der Anfrage ans DNS steht also die IP samt Port-Nummer fest und die Anfrage kann gestartet werden.
Nach oben

Geschichte des Internet

Nach oben

Überblick

1957 schickt die Sowjetunion den ersten Satelliten ins Weltall, den Sputnik. Das ist letztendlich Anlass für den Beginn des Arpa-Projekts: Aus Angst vor Zerstörung der militärischen Nachrichten-Infrastruktur, z.B. während eines Atomkrieges, wird ein dezentrales Netzwerk etabliert: das Arpanet, der Vorläufer des heutigen Internets. Zentrales Konzept: Auch, wenn ein Knoten ausfällt, bleibt das Netzwerk an sich funktionsfähig.

1964 wird ein erstes Konzept veröffentlicht, 1969 gehen die ersten vier Host-Computer des Arpanet online. Zu diesem Zeitpunkt wird auch NCP, ein Vorläufer von IP, erstmals eingesetzt.
1971 wird das FTP-Protokoll im RFC 172 öffentlich gemacht. Unkomplizierter Dateiaustausch wird so möglich.
1972 sind dann bereits 52 Rechner online, erste Software für Email und das Telnet-Protokoll werden veröffentlicht. Gleichzeitig entscheidet sich das Pentagon, die Zugangskontrollen härter zu gestalten: um das auch nach außen hin deutlich zu machen, stellt man ein "D" vor das "Arpa": von nun an heißt das Netz Darpanet.

Zu diesem Zeitpunkt ist längst klar, wofür die Menschen das Netz am meisten verwenden: die Möglichkeit, angeschlossene Computer fernzusteuern, ist, obwohl für Wissenschaftler an verschiedenen Universitäten sicherlich sehr praktisch, bei weitem nicht so attraktiv wie die elektronische Post, die mit Abstand den größten Anteil am Datenverkehr hat. Irgendwann entsteht dann auch eine der ersten größeren Mailing-Liste, die "SF-LOVERS" der Science-Fiction-Fans.

1973 schließlich beginnen die amerikanischen Universitäten, durch die neuen militärischen Zugangsbeschränkungen zum Darpanet in ihren Möglichkeiten stark eingeengt, mit dem parallelen Aufbau des CSNET, wobei jedoch viele Verbindungen zwischen diesen beiden Netzen bestehen. Das Netz insgesamt wird weiterhin "Arpanet" genannt.

1974 werden erste Ergebnisse einer 1972 begonnen Entwicklung eines neues Protokolls vorgelegt: TCP/IP ist geboren. Ab 1977 wird nur noch TCP/IP genutzt, um verschiedene Teilnetze zu verbinden.

Währenddessen schreitet die Entwicklung des Arpanet ständig fort: Immer mehr Rechner klinken sich in das Netzwerk ein. 1979 werden die ersten Shell-Scripts zur uucp-Automation geschrieben: Das bedeutet, dass in diesem Jahr das Usenet seinen Anfang nimmt.

1983 entschließt sich das Pentagon, das Darapanet vom Rest des Netzes abzukoppeln und in "MILNET" umzubenennen. Ebenfalls ins Jahr 1983 fallen zwei weitere Meilensteine: das komplette Arpanet wird - auch intern - auf TCP/IP umgestellt, erste Entwürfe eines Domain Name Systems werden spezifiziert.

1987 gibt es schon 28174 Hosts - ein ungeheures Wachstum. Damit einher geht jedoch auch eine massive Überlastung der Infrastruktur. 1990 muss daher das Arpanet abgeschaltet werden.

Trotzdem geht die rasante Entwicklung weiter: Ein bereits 1986 aufgebautes Netz der National Science Foundation übernimmt die Rolle des Arpanets.

1988 schließlich wird - fast nebenbei - der Internet Relay Chat entwickelt. 1989 ist das wahrscheinlich wichtigste Jahr in der Geschichte des Internets: Tim Berners-Lee vom CERN veröffentlicht erste Entwürfe seiner Vision von der Zukunft des Netzes: HTML entsteht, das WWW nimmt seinen Anfang. 1993 werden erste Browser von der NCSA ausgeliefert: Der Mosaic, Urahn aller graphischen Browser, ist da.

1994 gründen Marc Andressen und Jim Clark ihre Firma "Mosaic Communications", später umbenannt in "Netscape Communications". Die Firma entwickelt den Netscape-Browser, wird Marktführer im Browser-Geschäft und begründet durch ihren fulminanten Börsen-Erfolg den High Tech-Boom. 1994 ist auch das Gründungsjahr des W3C, der standardgebenden Organisation im WWW. Auch VRML 1.0 wird in diesem Jahr spezifiziert - bis heute ist dieser Sprache der große Erfolg vorenthalten geblieben.

1995 kommt eine erste Internet-Telefonie-Software auf den Markt. Im April 1995 wird eine erste Version des Apache-Servers freigegeben, im Mai launcht Sun Java, im Dezember folgen die Apache-Version 1.0 und JavaScript - ein wichtiges Jahr für das WWW.

1996 gibt Microsoft den Internet Explorer 2.0 frei, der seinem Netscape-Kontrahenten aber immer noch weit unterlegen ist. HTML 3.2, ein erster Entwurf von XML und CSS Level 1 werden ebenfalls in diesem Jahr vom W3C freigegeben.

1997 folgt HTML 4.0, 1998 XML 1.0.

1998 ist ein weiterer Meilenstein: Netscape gibt den Mozilla-Code frei. Inzwischen ist aus dem unzureichenden Netscape 4.x-Code ein dem IE in vielen Bereichen überlegener Browser geworden.
Nach oben