Uniform Resource Identifier
Ein Uniform Resource Identifier (Abk. URI; englisch fΞΒΞΒΞΒΞΒΞΒΞΒΞΒΞΒr ΞΒΞΒΞΒΞΒ²ΞΒΞΒΞΒΞΒΞΒΞΒΞΒΞΒeinheitlicher Bezeichner fΞΒΞΒΞΒΞΒΞΒΞΒΞΒΞΒr RessourcenΞΒΞΒΞΒΞΒ²ΞΒΞΒΞΒΞΒΞΒΞΒΞΒΞΒ) ist ein Identifikator und besteht aus einer Zeichenfolge, die zur Identifizierung einer abstrakten oder physischen Ressource dient. URIs werden zur Bezeichnung von Ressourcen (wie Webseiten, sonstigen Dateien, Aufruf von Webservices, aber auch E-Mail-EmpfΞΒΞΒΞΒΞΒΞΒΞΒ²ΞΒΞΒΞΒΞΒ¬ngern) im Internet und dort vor allem im WWW eingesetzt. Der aktuelle Stand 2016 ist als RFCΞΒΞΒΞΒΞΒ 3986[1] publiziert.
UrsprΞΒΞΒΞΒΞΒΞΒΞΒΞΒΞΒnglich fΞΒΞΒΞΒΞΒΞΒΞΒΞΒΞΒhrte Tim Berners-Lee den Begriff 1994 im RFCΞΒΞΒΞΒΞΒ 1630[2] als Universal Resource Identifier ein. Erst spΞΒΞΒΞΒΞΒΞΒΞΒ²ΞΒΞΒΞΒΞΒ¬ter tauchte dann in offiziellen W3C-Dokumenten die AuflΞΒΞΒΞΒΞΒΞΒΞΒΞΒΞΒsung Uniform auf. Aus diesem Grund wird Universal gelegentlich ΞΒΞΒΞΒΞΒ²ΞΒΞΒΞΒΞΒΞΒΞΒΞΒΞΒΞΒΞΒΞΒΞΒ selbst in der FachliteraturΞΒΞΒΞΒΞΒ ΞΒΞΒΞΒΞΒ²ΞΒΞΒΞΒΞΒΞΒΞΒΞΒΞΒ als erster Namensbestandteil genannt.
URIs kΞΒΞΒΞΒΞΒΞΒΞΒΞΒΞΒnnen als Zeichenfolge (kodiert mit einem Zeichensatz) in digitale Dokumente, insbesondere solche im HTML-Format eingebunden oder auch von Hand auf Papier aufgeschrieben werden. Einen Verweis von einer Webseite auf eine andere nennt man Hyperlink oder kurz ΞΒΞΒΞΒΞΒ²ΞΒΞΒΞΒΞΒΞΒΞΒΞΒΞΒLinkΞΒΞΒΞΒΞΒ²ΞΒΞΒΞΒΞΒΞΒΞΒΞΒΞΒ.
Eine Erweiterung der nur aus druckbaren ASCII-Zeichen bestehenden URIs sind die Internationalized Resource Identifiers (IRIs).
Konzeption
Ein URI (oder in der Erweiterung IRI) ist das abstrakte Prinzip, die Syntax, einer Kennzeichnung, bei dem ein Satz an Regeln vorgegeben ist. Dieses Grundkonzept der URI wird dann auf verschiedene konkrete Anwendungsbereiche ΞΒΞΒΞΒΞΒΞΒΞΒΞΒΞΒbertragen, fΞΒΞΒΞΒΞΒΞΒΞΒΞΒΞΒr die dann die entsprechenden Regeln und Begriffe gelten. Zum Beispiel:
- ΞΒΞΒΞΒΞΒ²ΞΒΞΒΞΒΞΒΞΒΞΒΞΒΞΒURI dΞΒΞΒΞΒΞΒΞΒΞΒΞΒΞΒrfen keine Leerzeichen enthalten.ΞΒΞΒΞΒΞΒ²ΞΒΞΒΞΒΞΒΞΒΞΒΞΒΞΒ oder
- ΞΒΞΒΞΒΞΒ²ΞΒΞΒΞΒΞΒΞΒΞΒΞΒΞΒZu Beginn steht der Name eines Schemas in ASCII-Buchstaben und Ziffern, gegebenenfalls gegliedert durch Punkt und Bindestrich, beginnend mit Buchstaben, worauf ein Doppelpunkt folgt.ΞΒΞΒΞΒΞΒ²ΞΒΞΒΞΒΞΒΞΒΞΒΞΒΞΒ
GrundsΞΒΞΒΞΒΞΒΞΒΞΒ²ΞΒΞΒΞΒΞΒ¬tzlich gibt es drei Typen von Anwendungen:
- Name
- Der Inhalt einer Ressource (und damit jede inhaltsgleiche Kopie) erhΞΒΞΒΞΒΞΒΞΒΞΒ²ΞΒΞΒΞΒΞΒ¬lt eine eindeutige Kennung.
- Beispiel: Die ISBN eines Buches. Es gibt unbegrenzt viele Exemplare dieses Buches.
- Locator
- Der Ort einer Ressource ist ΞΒΞΒΞΒΞΒΞΒΞΒΞΒΞΒber ihren Bezeichner definiert. Sie wird also darΞΒΞΒΞΒΞΒΞΒΞΒΞΒΞΒber identifiziert, wo sie zu finden ist; es wird damit jedoch nicht zwangslΞΒΞΒΞΒΞΒΞΒΞΒ²ΞΒΞΒΞΒΞΒ¬ufig ihr Inhalt festgelegt.
- Beispiel: Aktueller Wetterbericht im Internet. Es ist bekannt, an welcher Stelle (URL) dieser zu finden ist; der Inhalt ΞΒΞΒΞΒΞΒΞΒΞΒ²ΞΒΞΒΞΒΞΒ¬ndert sich stΞΒΞΒΞΒΞΒΞΒΞΒ²ΞΒΞΒΞΒΞΒ¬ndig.
- Beispiel: Ein Buch wird dadurch beschrieben, in welcher Bibliothek es steht: dort im zweiten Raum, drittes Regal, viertes Fach von oben, fΞΒΞΒΞΒΞΒΞΒΞΒΞΒΞΒnftes Buch von links. Dort kΞΒΞΒΞΒΞΒΞΒΞΒΞΒΞΒnnten die aktuellen Top-5 der Bestsellerliste stehen ΞΒΞΒΞΒΞΒ²ΞΒΞΒΞΒΞΒΞΒΞΒΞΒΞΒ unabhΞΒΞΒΞΒΞΒΞΒΞΒ²ΞΒΞΒΞΒΞΒ¬ngig von ihrem Inhalt.
- Individuum
- Die Regeln der URI kΞΒΞΒΞΒΞΒΞΒΞΒΞΒΞΒnnen auch angewendet werden, wenn etwas ΞΒΞΒΞΒΞΒΞΒΞΒΞΒΞΒberhaupt keine klassische Ressource ist, trotzdem identifiziert werden soll.
- ZunΞΒΞΒΞΒΞΒΞΒΞΒ²ΞΒΞΒΞΒΞΒ¬chst verstand man unter ΞΒΞΒΞΒΞΒ²ΞΒΞΒΞΒΞΒΞΒΞΒΞΒΞΒRessourceΞΒΞΒΞΒΞΒ²ΞΒΞΒΞΒΞΒΞΒΞΒΞΒΞΒ etwas wie Ressourcen im informationstechnischen Sinn, also im weitesten Sinne elektronische Dateien, die auch im Internet verfΞΒΞΒΞΒΞΒΞΒΞΒΞΒΞΒgbar gemacht werden kΞΒΞΒΞΒΞΒΞΒΞΒΞΒΞΒnnten. Davon gingen 1994 die RFCΞΒΞΒΞΒΞΒ 1630[2] und RFCΞΒΞΒΞΒΞΒ 1738[3] aus. Dieses Konzept wurde jedoch erweitert. So war 1998 in der RFCΞΒΞΒΞΒΞΒ 2396 (AbschnittΞΒΞΒΞΒΞΒ 1.1)[4] festgelegt worden: ΞΒΞΒΞΒΞΒ²ΞΒΞΒΞΒΞΒΞΒΞΒΞΒΞΒA resource can be anything that has identity.ΞΒΞΒΞΒΞΒ²ΞΒΞΒΞΒΞΒΞΒΞΒΞΒΞΒ Auch Personen, Organisationen und gedruckte BΞΒΞΒΞΒΞΒΞΒΞΒΞΒΞΒcher kΞΒΞΒΞΒΞΒΞΒΞΒΞΒΞΒnnten als Ressource betrachtet werden. Diese Betrachtung zielt auf die Kennzeichnung zuordnungsfΞΒΞΒΞΒΞΒΞΒΞΒ²ΞΒΞΒΞΒΞΒ¬higer EntitΞΒΞΒΞΒΞΒΞΒΞΒ²ΞΒΞΒΞΒΞΒ¬ten.
- Beispiele: E-Mail-Adresse, Nummer eines Mobiltelefons, Reisepass sowie die legitime Inhaberin, Sozialversicherungsnummer, Fingerabdruck und der Mensch dazu.
Im Januar 2005 wurde mit RFCΞΒΞΒΞΒΞΒ 3986[1] das Konzept der Ressource im Sinne der URI auch noch um abstrakte Konzepte erweitert:
ΞΒΞΒΞΒΞΒ²ΞΒΞΒΞΒΞΒΞΒΞΒΞΒΞΒA resource is not necessarily accessible via the Internet; e.g., human beings, corporations, and bound books in a library can also be resources. Likewise, abstract concepts can be resources, such as the operators and operands of a mathematical equation, the types of a relationship (e.g., ΞΒΞΒΞΒΞΒ²ΞΒΞΒΞΒΞΒΞΒΞΒΞΒΞΒparentΞΒΞΒΞΒΞΒ²ΞΒΞΒΞΒΞΒΞΒΞΒΞΒΞΒ or ΞΒΞΒΞΒΞΒ²ΞΒΞΒΞΒΞΒΞΒΞΒΞΒΞΒemployeeΞΒΞΒΞΒΞΒ²ΞΒΞΒΞΒΞΒΞΒΞΒΞΒΞΒ), or numeric values (e.g., zero, one, and infinity).ΞΒΞΒΞΒΞΒ²ΞΒΞΒΞΒΞΒΞΒΞΒΞΒΞΒ
ΞΒΞΒΞΒΞΒ²ΞΒΞΒΞΒΞΒΞΒΞΒΞΒΞΒEine Ressource ist nicht notwendigerweise ΞΒΞΒΞΒΞΒΞΒΞΒΞΒΞΒber das Internet erreichbar; beispielsweise kΞΒΞΒΞΒΞΒΞΒΞΒΞΒΞΒnnen Menschen, Firmen und gebundene BΞΒΞΒΞΒΞΒΞΒΞΒΞΒΞΒcher in Bibliotheken ebenfalls eine Ressource darstellen. Ebenso kΞΒΞΒΞΒΞΒΞΒΞΒΞΒΞΒnnen abstrakte Konzepte, wie Operatoren und Operanden einer mathematischen Gleichung, Arten einer Beziehung (z.ΞΒΞΒΞΒΞΒ B. ΞΒΞΒΞΒΞΒ²ΞΒΞΒΞΒΞΒΞΒΞΒΞΒΞΒElterΞΒΞΒΞΒΞΒ²ΞΒΞΒΞΒΞΒΞΒΞΒΞΒΞΒ oder ΞΒΞΒΞΒΞΒ²ΞΒΞΒΞΒΞΒΞΒΞΒΞΒΞΒAngestellterΞΒΞΒΞΒΞΒ²ΞΒΞΒΞΒΞΒΞΒΞΒΞΒΞΒ), oder Zahlen (z.ΞΒΞΒΞΒΞΒ B. Null, Eins und Unendlich) eine Ressource sein.ΞΒΞΒΞΒΞΒ²ΞΒΞΒΞΒΞΒΞΒΞΒΞΒΞΒ
Aufbau
Nach dem aktuellen Standard RFCΞΒΞΒΞΒΞΒ 3986[1] besteht ein URI aus fΞΒΞΒΞΒΞΒΞΒΞΒΞΒΞΒnf Teilen: scheme
(Schema oder Protokoll), authority
(Anbieter oder Server), path
(Pfad), query
(Abfrage) und fragment
(Teil), wovon nur scheme
und path
in jedem URI vorhanden sein mΞΒΞΒΞΒΞΒΞΒΞΒΞΒΞΒssen. Die generische Syntax ist:
URI = scheme ":" hier-part [ "?" query ] [ "#" fragment ]
Dabei steht hier-part
(hierarchischer Teil) fΞΒΞΒΞΒΞΒΞΒΞΒΞΒΞΒr eine optionale authority
und den path
. Ist die Angabe einer authority
erforderlich, um die Ressource letztlich zu verorten, so wird sie durch doppelten SchrΞΒΞΒΞΒΞΒΞΒΞΒ²ΞΒΞΒΞΒΞΒ¬gstrich eingeleitet und die darauf folgende Pfadangabe muss mit einem SchrΞΒΞΒΞΒΞΒΞΒΞΒ²ΞΒΞΒΞΒΞΒ¬gstrich beginnen. Der Standard verdeutlicht diese Komponenten mit zwei Beispielen:
foo://example.com:8042/over/there?name=ferret#nose \_/ \________________/\_________/ \_________/ \__/ | | | | | scheme authority path query fragment | _____________________|__ / \ / \ urn:example:animal:ferret:nose
Schema (Scheme)
Das Schema (der Teil vor dem Doppelpunkt) definiert den Kontext und bezeichnet so den Typ des URIs, was die Interpretation des folgenden Teils festlegt. Bekannte Schemata sind beispielsweise die Protokolle http
und ftp
sowie Notationskonzepte wie urn
und doi
. Mit dem Doppelpunkt endet der erste obligatorische Teil des URI. Gibt es keinen Bezug auf eine die Namensverwaltung organisierende (aktive) AutoritΞΒΞΒΞΒΞΒΞΒΞΒ²ΞΒΞΒΞΒΞΒ¬t, so folgt direkt auf diesen Doppelpunkt der Pfad zur Verortung der Ressource.
Authority (im Sinne von ZustΞΒΞΒΞΒΞΒΞΒΞΒ²ΞΒΞΒΞΒΞΒ¬ndigkeit)
Viele URI-Schemata wie http
oder ftp
haben einen authority
-Teil. Der Begriff authority bezieht sich auf eine Instanz, die die Namen in diesem (vom Schema angegebenen Interpretations-) Raum zentral verwalten kann. Ein Beispiel dafΞΒΞΒΞΒΞΒΞΒΞΒΞΒΞΒr ist das Domain Name System, das von globalen und lokalen Registraren verwaltet wird.
Die authority
besteht aus einer optionalen Benutzerinformation (gefolgt von einem ΞΒΞΒΞΒΞΒ²ΞΒΞΒΞΒΞΒΞΒΞΒΞΒΞΒ@
ΞΒΞΒΞΒΞΒ²ΞΒΞΒΞΒΞΒΞΒΞΒΞΒΞΒ), dem Host und einer optionalen (durch einen Doppelpunkt eingeleiteten) Port-Angabe. Sie folgt auf zwei SchrΞΒΞΒΞΒΞΒΞΒΞΒ²ΞΒΞΒΞΒΞΒ¬gstriche (//
) und wird von einem einfachen SchrΞΒΞΒΞΒΞΒΞΒΞΒ²ΞΒΞΒΞΒΞΒ¬gstrich (/
), einem Fragezeichen (?
), einem Doppelkreuz (#
) oder dem Ende des URIs begrenzt. Der Host-Teil kann aus einer IP-Adresse, einer IPv6-Adresse (in eckigen Klammern ΞΒΞΒΞΒΞΒ²ΞΒΞΒΞΒΞΒΞΒΞΒΞΒΞΒ[ΞΒΞΒΞΒΞΒ²ΞΒΞΒΞΒΞΒΞΒΞΒΞΒΞΒ¦]
ΞΒΞΒΞΒΞΒ²ΞΒΞΒΞΒΞΒΞΒΞΒΞΒΞΒ) oder einem registrierten Namen bestehen. GΞΒΞΒΞΒΞΒΞΒΞΒΞΒΞΒltige Werte sind beispielsweise:
de.wikipedia.org
user@example.com:8080
192.0.2.16:80
[2001:db8::7]
Die mΞΒΞΒΞΒΞΒΞΒΞΒΞΒΞΒgliche Angabe von Benutzername und Kennwort in der Benutzerinformation (user:password@ΞΒΞΒΞΒΞΒ²ΞΒΞΒΞΒΞΒΞΒΞΒΞΒΞΒ¦
) wird in RFCΞΒΞΒΞΒΞΒ 3986 (Abschnitt 3.2.1)[6] als ΞΒΞΒΞΒΞΒΞΒΞΒΞΒΞΒberholt bezeichnet und sollte nicht mehr verwendet werden, da URIs oft im Klartext ΞΒΞΒΞΒΞΒΞΒΞΒΞΒΞΒbertragen und protokolliert werden.
Pfad (Path)
Der Pfad enthΞΒΞΒΞΒΞΒΞΒΞΒ²ΞΒΞΒΞΒΞΒ¬lt ΞΒΞΒΞΒΞΒ²ΞΒΞΒΞΒΞΒΞΒΞΒΞΒΞΒΞΒΞΒΞΒΞΒ oft hierarchisch organisierteΞΒΞΒΞΒΞΒ ΞΒΞΒΞΒΞΒ²ΞΒΞΒΞΒΞΒΞΒΞΒΞΒΞΒ Angaben, die zusammen mit dem Abfrageteil eine Ressource identifizieren. Falls in der URI eine im vorangegangenen Abschnitt beschriebene authority
angegeben wurde, muss der path
mit einem SchrΞΒΞΒΞΒΞΒΞΒΞΒ²ΞΒΞΒΞΒΞΒ¬gstrich (/
) beginnen; gibt es keine authority
, darf der path
nicht mit einem doppelten SchrΞΒΞΒΞΒΞΒΞΒΞΒ²ΞΒΞΒΞΒΞΒ¬gstrich (//
) beginnen. Dadurch ist die eindeutige Interpretation gesichert. Er wird von einem Fragezeichen (?
), einem Doppelkreuz (#
) oder dem Ende des URI begrenzt. GΞΒΞΒΞΒΞΒΞΒΞΒΞΒΞΒltige Pfade sind beispielsweise:
/over/there
example:animal:ferret:nose
Abfrage (Query)
Der Abfrageteil (Query-String) beinhaltet Daten zur Identifizierung von solchen Ressourcen, deren Ort durch die Pfadangabe allein nicht genau angegeben werden kann. Sie mΞΒΞΒΞΒΞΒΞΒΞΒΞΒΞΒssen aus der durch den Pfad bezeichneten Quelle, durch ebendiese Abfrage wie ein Datensatz aus einer Datenbank abgerufen werden. Er wird mit einem Fragezeichen (?
) eingeleitet und von einem Doppelkreuz (#
) oder dem Ende des URI begrenzt. Eine gΞΒΞΒΞΒΞΒΞΒΞΒΞΒΞΒltige Abfrage nach dem ΞΒΞΒΞΒΞΒ²ΞΒΞΒΞΒΞΒΞΒΞΒΞΒΞΒ?
ΞΒΞΒΞΒΞΒ²ΞΒΞΒΞΒΞΒΞΒΞΒΞΒΞΒ ist beispielsweise:
title=Uniform_Resource_Identifier&action=submit
Hier spielen ΞΒΞΒΞΒΞΒ²ΞΒΞΒΞΒΞΒΞΒΞΒΞΒΞΒ&
ΞΒΞΒΞΒΞΒ²ΞΒΞΒΞΒΞΒΞΒΞΒΞΒΞΒ und ΞΒΞΒΞΒΞΒ²ΞΒΞΒΞΒΞΒΞΒΞΒΞΒΞΒ=
ΞΒΞΒΞΒΞΒ²ΞΒΞΒΞΒΞΒΞΒΞΒΞΒΞΒ etwa die gleiche Rolle wie ΞΒΞΒΞΒΞΒ²ΞΒΞΒΞΒΞΒΞΒΞΒΞΒΞΒ.
ΞΒΞΒΞΒΞΒ²ΞΒΞΒΞΒΞΒΞΒΞΒΞΒΞΒ und ΞΒΞΒΞΒΞΒ²ΞΒΞΒΞΒΞΒΞΒΞΒΞΒΞΒ:
ΞΒΞΒΞΒΞΒ²ΞΒΞΒΞΒΞΒΞΒΞΒΞΒΞΒ im Teil fΞΒΞΒΞΒΞΒΞΒΞΒΞΒΞΒr die authority
.
Fragment
fragment
ist der optionale Fragmentbezeichner und referenziert eine Stelle innerhalb einer Ressource. Der Fragmentbezeichner bezieht sich immer nur auf den unmittelbar vorangehenden Teil des URI und wird von einem Doppelkreuz (#
) eingeleitet. Ein Beispiel dafΞΒΞΒΞΒΞΒΞΒΞΒΞΒΞΒr ist der Anker in HTML.
Beispiele
https://de.wikipedia.org/wiki/Uniform_Resource_Identifier
ftp://ftp.is.co.za/rfc/rfc1808.txt
file:///C:/Users/Benutzer/Desktop/Uniform%20Resource%20Identifier.html
file:///etc/fstab
geo:48.33,14.122;u=22.5
ldap://[2001:db8::7]/c=GB?objectClass?one
gopher://gopher.floodgap.com
mailto:John.Doe@example.com
sip:911@pbx.mycompany.com
news:comp.infosystems.www.servers.unix
data:text/plain;charset=iso-8859-7,%be%fa%be
tel:+1-816-555-1212
telnet://192.0.2.16:80/
urn:oasis:names:specification:docbook:dtd:xml:4.1.2
git://github.com/rails/rails.git
crid://broadcaster.com/movies/BestActionMovieEver
Ein Beispiel mit sehr vielen Elementen gleichzeitig in der URI:
http://nobody:password@example.org:8080/cgi-bin/script.php?action=submit&pageid=86392001#section_2
URI-Referenzen
Oft verwenden Anwendungen nicht den vollstΞΒΞΒΞΒΞΒΞΒΞΒ²ΞΒΞΒΞΒΞΒ¬ndigen URI, sondern eine abgekΞΒΞΒΞΒΞΒΞΒΞΒΞΒΞΒrzte Syntax, beispielsweise um Platz zu sparen oder den einfachen Umzug auf andere Server zu ermΞΒΞΒΞΒΞΒΞΒΞΒΞΒΞΒglichen. Manche URI-Schemata begrenzen in ihrer Definition zudem die Syntax auf eine bestimmte Form. Unter dem Begriff der URI-Referenzen werden unterschiedliche Schreibweisen zusammengefasst.
Absolute URIs
Ein absoluter URI identifiziert eine Ressource unabhΞΒΞΒΞΒΞΒΞΒΞΒ²ΞΒΞΒΞΒΞΒ¬ngig vom Kontext der Verwendung des URI.[7]
Er besteht mindestens aus scheme
und hier-part
(also einer authority
und/oder einem path
).
Beispiele sind:
https://de.wikipedia.org
file://localhost/var/spool/dump.bin
Relative Referenz
Im Gegensatz zu einem absoluten URI beschreibt ein relativer URI nur die Abweichung zwischen dem absoluten URI einer Ressource und dem aktuellen Kontext in einem hierarchischen Namensraum.[7][8]
Wenn eine URI-Referenz nicht mit einem scheme
beginnt, wird angenommen, dass es sich um eine relative Referenz handelt. Die AuflΞΒΞΒΞΒΞΒΞΒΞΒΞΒΞΒsung einer relativen Referenz zu einem absoluten URI erfolgt abhΞΒΞΒΞΒΞΒΞΒΞΒ²ΞΒΞΒΞΒΞΒ¬ngig vom Kontext nach standardisierten Regeln. Eine relative Referenz besteht aus einem path
sowie optional aus query
und fragment
. Es werden drei Arten von relativen Referenzen unterschieden:
- Beginnt der Pfad ohne SchrΞΒΞΒΞΒΞΒΞΒΞΒ²ΞΒΞΒΞΒΞΒ¬gstrich, handelt es sich um eine relative Pfad-Referenz, beispielsweise
image.png
,./image.png
und../images/image.png
. - Beginnt der Pfad mit einem einzelnen SchrΞΒΞΒΞΒΞΒΞΒΞΒ²ΞΒΞΒΞΒΞΒ¬gstrich (
/
), handelt es sich um eine absolute Pfad-Referenz. - Beginnt der Pfad mit doppelten SchrΞΒΞΒΞΒΞΒΞΒΞΒ²ΞΒΞΒΞΒΞΒ¬gstrichen (
//
), handelt es sich um eine Netzwerk-Pfad-Referenz.
Referenz innerhalb desselben Dokumentes
URI-Referenzen kΞΒΞΒΞΒΞΒΞΒΞΒΞΒΞΒnnen auf dasselbe Dokument verweisen, dessen Teil sie sind. Die hΞΒΞΒΞΒΞΒΞΒΞΒ²ΞΒΞΒΞΒΞΒ¬ufigste Anwendung ist das Doppelkreuz (#
), gefolgt von einem Fragment-Bezeichner.
Suffix-Referenzen
Weit verbreitet ist die Angabe von URI-Referenzen des Internets ohne Bezeichnung des Protokolls (des Schemas), etwa www.wikipedia.de
. Unter der Annahme, dass sich aus dem Suffix (im Beispiel www
, DNS-Namen werden von rechts nach links aufgebaut) auf das Protokoll (hier http
) schlieΞΒΞΒΞΒΞΒΞΒΞΒΞΒΞΒen lΞΒΞΒΞΒΞΒΞΒΞΒ²ΞΒΞΒΞΒΞΒ¬sst, funktioniert die AuflΞΒΞΒΞΒΞΒΞΒΞΒΞΒΞΒsung solcher Referenzen. Allerdings ist diese AuflΞΒΞΒΞΒΞΒΞΒΞΒΞΒΞΒsung von entsprechenden Annahmen und zudem von der jeweiligen Software abhΞΒΞΒΞΒΞΒΞΒΞΒ²ΞΒΞΒΞΒΞΒ¬ngig. Deshalb sollten Suffix-Referenzen vermieden werden.
Schemata
Unter anderem sind folgende Schemata definiert:
Schema | Beschreibung |
---|---|
crid |
Content Reference Identifier (fΞΒΞΒΞΒΞΒΞΒΞΒΞΒΞΒr Fernsehsendungen) |
data |
Data-URL: direkt eingebettete Daten |
file |
Dateien im lokalen Dateisystem |
ftp |
File Transfer Protocol |
geo |
Geografische Koordinaten |
gopher |
Gopher |
http |
Hypertext Transfer Protocol |
ldap |
Lightweight Directory Access Protocol |
mailto |
E-Mail-Adresse |
news |
Newsgroup oder Newsartikel |
pop |
Mailboxzugriff ΞΒΞΒΞΒΞΒΞΒΞΒΞΒΞΒber POP3 |
rsync |
Synchronisation von Daten mit rsync |
sip |
SIP-gestΞΒΞΒΞΒΞΒΞΒΞΒΞΒΞΒtzter Sitzungsaufbau, z.ΞΒΞΒΞΒΞΒ B. fΞΒΞΒΞΒΞΒΞΒΞΒΞΒΞΒr IP-Telefonie |
tel |
Telefonnummer |
telnet |
Telnet |
urn |
Uniform Resource Names (URNs) |
ws |
WebSocket |
wss
| |
xmpp |
Extensible Messaging and Presence Protocol fΞΒΞΒΞΒΞΒΞΒΞΒΞΒΞΒr Jabber Identifier |
Auf der Website der Internet Assigned Numbers Authority (IANA) befindet sich eine vollstΞΒΞΒΞΒΞΒΞΒΞΒ²ΞΒΞΒΞΒΞΒ¬ndige Liste der offiziellen Schemata.[9]
Daneben haben sich einige inoffizielle, von der IANA auch als ΞΒΞΒΞΒΞΒ²ΞΒΞΒΞΒΞΒΞΒΞΒΞΒΞΒvorlΞΒΞΒΞΒΞΒΞΒΞΒ²ΞΒΞΒΞΒΞΒ¬ufigΞΒΞΒΞΒΞΒ²ΞΒΞΒΞΒΞΒΞΒΞΒΞΒΞΒ bezeichnete, Schemata fΞΒΞΒΞΒΞΒΞΒΞΒΞΒΞΒr einzelne Anwendungen oder gΞΒΞΒΞΒΞΒΞΒΞΒ²ΞΒΞΒΞΒΞΒ¬ngige Protokolle etabliert:
Schema | Beschreibung |
---|---|
about |
browserinterne Informationen[10] |
afp |
Apple Filing Protocol[11] |
apt |
Advanced Packaging Tool |
callto |
Telefonnummern (u.ΞΒΞΒΞΒΞΒ a. Skype und NetMeeting) |
coffee |
Hyper Text Coffee Pot Control Protocol |
daap |
Digital Audio Access Protocol |
doi |
Digital Object Identifier |
ed2k |
ED2k-URI-Schema von eDonkey2000/Kademlia |
feed |
Web-Feeds |
finger |
Finger[12] |
fish |
Files transferred over Shell protocol |
git |
Git |
irc /ircs |
Internet Relay Chat[13] |
itunes |
iTunes |
javascript |
AusfΞΒΞΒΞΒΞΒΞΒΞΒΞΒΞΒhrung von JavaScript-Code[14] |
lastfm |
Last.fm |
magnet |
Magnet-Link |
mms |
Microsoft Media Server |
rtmp |
Real Time Messaging Protocol |
sftp |
SSH File Transfer Protocol[15][16] |
skype |
Telefonnummern (nur Skype) |
smb |
Server Message Block[17] |
ssh |
Secure Shell[18][16] |
svn /svn+ssh |
Apache Subversion |
view-source |
Quelltextanzeige fΞΒΞΒΞΒΞΒΞΒΞΒΞΒΞΒr eine Webseite[19] |
webcal |
iCalendar |
wyciwyg |
What You Cache Is What You Get, Firefox-interne Anzeige fΞΒΞΒΞΒΞΒΞΒΞΒΞΒΞΒr die Darstellung gecachter Inhalte |
ymsgr |
Yahoo Messenger |
Unterarten
Es werden folgende Unterarten von URIs unterschieden:
- Uniform Resource Locator (URL)
- Benennen einer Ressource ΞΒΞΒΞΒΞΒΞΒΞΒΞΒΞΒber ihren primΞΒΞΒΞΒΞΒΞΒΞΒ²ΞΒΞΒΞΒΞΒ¬ren Zugriffsmechanismus wie
http
oderftp
. Danach folgt die Bezeichnung des Ortes (englisch location) der Ressource im Netz ΞΒΞΒΞΒΞΒ²ΞΒΞΒΞΒΞΒΞΒΞΒΞΒΞΒ meistens der Domain-Name. URLs waren ursprΞΒΞΒΞΒΞΒΞΒΞΒΞΒΞΒnglich die einzige Art von URIs, weshalb der Begriff URL oft gleichbedeutend mit URI verwendet wird. - Uniform Resource Name (URN)
- Mit dem URI-Schema
urn
(oder ggf. anderer) eine Ressource identifizieren mittels eines vorhandenen oder frei zu vergebenden Namens, beispielsweiseurn:isbn
oderurn:sha1
.
UrsprΞΒΞΒΞΒΞΒΞΒΞΒΞΒΞΒnglich sollte jeder URI in eine dieser beiden Klassen (oder weitere noch zu definierende) eingeteilt werden. Diese strenge Aufteilung wurde jedoch aufgegeben, da sie unnΞΒΞΒΞΒΞΒΞΒΞΒΞΒΞΒtig ist und einige Schemata (wie data
oder das frΞΒΞΒΞΒΞΒΞΒΞΒΞΒΞΒher den URLs zugeordnete mailto
) in keine der beiden Klassen passen.
Siehe auch
- Digital Object Identifier (DOI)
- Persistent Uniform Resource Locator (PURL)
- Internationalized Resource Identifier (IRI)
Weblinks
- RFC: ΞΒΞΒΞΒΞΒ ΞΒΞΒΞΒΞΒ²ΞΒΞΒΞΒΞΒΞΒΞΒΞΒΞΒ Universal Resource Identifiers in WWW. 1994 (Informational, englisch).
- RFC: ΞΒΞΒΞΒΞΒ ΞΒΞΒΞΒΞΒ²ΞΒΞΒΞΒΞΒΞΒΞΒΞΒΞΒ Uniform Resource Identifier (URI): Generic Syntax. Januar 2005 (Standard, englisch).
- RFC: ΞΒΞΒΞΒΞΒ ΞΒΞΒΞΒΞΒ²ΞΒΞΒΞΒΞΒΞΒΞΒΞΒΞΒ URI Design and Ownership. Juni 2020ΞΒΞΒΞΒΞΒ ΞΒΞΒΞΒΞΒ²ΞΒΞΒΞΒΞΒΞΒΞΒΞΒΞΒ Standard: [BCP] (englisch).
- Web Naming and Addressing. W3C (englisch).
- Uniform Resource Identifier (URI) Schemes. Internet Assigned Numbers Authority (IANA) ΞΒΞΒΞΒΞΒ²ΞΒΞΒΞΒΞΒΞΒΞΒΞΒΞΒ Liste der URI-Schemata (englisch).
- Tim Berners-Lee: Cool URIs DonΞΒΞΒΞΒΞΒ²ΞΒΞΒΞΒΞΒΞΒΞΒΞΒΞΒt Change. W3C (englisch).
Einzelnachweise
- ΞΒΞΒΞΒΞΒ²ΞΒΞΒΞΒΞΒΞΒΞΒΞΒΞΒ a b c RFC: ΞΒΞΒΞΒΞΒ ΞΒΞΒΞΒΞΒ²ΞΒΞΒΞΒΞΒΞΒΞΒΞΒΞΒ Uniform Resource Identifier (URI): Generic Syntax. Januar 2005ΞΒΞΒΞΒΞΒ ΞΒΞΒΞΒΞΒ²ΞΒΞΒΞΒΞΒΞΒΞΒΞΒΞΒ Standard: [STD 66] (Standard, englisch).
- ΞΒΞΒΞΒΞΒ²ΞΒΞΒΞΒΞΒΞΒΞΒΞΒΞΒ a b RFC: ΞΒΞΒΞΒΞΒ ΞΒΞΒΞΒΞΒ²ΞΒΞΒΞΒΞΒΞΒΞΒΞΒΞΒ Universal Resource Identifiers in WWW. 1994 (Informational, englisch).
- ΞΒΞΒΞΒΞΒ²ΞΒΞΒΞΒΞΒΞΒΞΒΞΒΞΒ RFC: ΞΒΞΒΞΒΞΒ ΞΒΞΒΞΒΞΒ²ΞΒΞΒΞΒΞΒΞΒΞΒΞΒΞΒ Uniform Resource Locators (URL). Dezember 1994 (englisch).
- ΞΒΞΒΞΒΞΒ²ΞΒΞΒΞΒΞΒΞΒΞΒΞΒΞΒ RFC: ΞΒΞΒΞΒΞΒ ΞΒΞΒΞΒΞΒ²ΞΒΞΒΞΒΞΒΞΒΞΒΞΒΞΒ Uniform Resource Identifiers (URI): Generic Syntax. April 1998, AbschnittΞΒΞΒΞΒΞΒ 1.1 (englisch).
- ΞΒΞΒΞΒΞΒ²ΞΒΞΒΞΒΞΒΞΒΞΒΞΒΞΒ RFC: ΞΒΞΒΞΒΞΒ ΞΒΞΒΞΒΞΒ²ΞΒΞΒΞΒΞΒΞΒΞΒΞΒΞΒ Uniform Resource Identifier (URI): Generic Syntax. Januar 2005, AbschnittΞΒΞΒΞΒΞΒ 1.1: Overview of URIs. (englisch).
- ΞΒΞΒΞΒΞΒ²ΞΒΞΒΞΒΞΒΞΒΞΒΞΒΞΒ RFC: ΞΒΞΒΞΒΞΒ ΞΒΞΒΞΒΞΒ²ΞΒΞΒΞΒΞΒΞΒΞΒΞΒΞΒ Uniform Resource Identifier (URI): Generic Syntax. Januar 2005, AbschnittΞΒΞΒΞΒΞΒ 3.2.1: User Information. (englisch).
- ΞΒΞΒΞΒΞΒ²ΞΒΞΒΞΒΞΒΞΒΞΒΞΒΞΒ a b RFC: ΞΒΞΒΞΒΞΒ ΞΒΞΒΞΒΞΒ²ΞΒΞΒΞΒΞΒΞΒΞΒΞΒΞΒ Uniform Resource Identifiers (URI): Generic Syntax. April 1998 (englisch).
- ΞΒΞΒΞΒΞΒ²ΞΒΞΒΞΒΞΒΞΒΞΒΞΒΞΒ RFC: (englisch).
- ΞΒΞΒΞΒΞΒ²ΞΒΞΒΞΒΞΒΞΒΞΒΞΒΞΒ Graham Klyne: Uniform Resource Identifier (URI) Schemes. Internet Assigned Numbers Authority (IANA), 20.ΞΒΞΒΞΒΞΒ MΞΒΞΒΞΒΞΒΞΒΞΒ²ΞΒΞΒΞΒΞΒ¬rz 2016, abgerufen am 8.ΞΒΞΒΞΒΞΒ April 2016 (englisch).
- ΞΒΞΒΞΒΞΒ²ΞΒΞΒΞΒΞΒΞΒΞΒΞΒΞΒ tools.ietf.org
- ΞΒΞΒΞΒΞΒ²ΞΒΞΒΞΒΞΒΞΒΞΒΞΒΞΒ tools.ietf.org
- ΞΒΞΒΞΒΞΒ²ΞΒΞΒΞΒΞΒΞΒΞΒΞΒΞΒ tools.ietf.org
- ΞΒΞΒΞΒΞΒ²ΞΒΞΒΞΒΞΒΞΒΞΒΞΒΞΒ tools.ietf.org
- ΞΒΞΒΞΒΞΒ²ΞΒΞΒΞΒΞΒΞΒΞΒΞΒΞΒ tools.ietf.org
- ΞΒΞΒΞΒΞΒ²ΞΒΞΒΞΒΞΒΞΒΞΒΞΒΞΒ iana.org
- ΞΒΞΒΞΒΞΒ²ΞΒΞΒΞΒΞΒΞΒΞΒΞΒΞΒ a b tools.ietf.org
- ΞΒΞΒΞΒΞΒ²ΞΒΞΒΞΒΞΒΞΒΞΒΞΒΞΒ tools.ietf.org
- ΞΒΞΒΞΒΞΒ²ΞΒΞΒΞΒΞΒΞΒΞΒΞΒΞΒ iana.org
- ΞΒΞΒΞΒΞΒ²ΞΒΞΒΞΒΞΒΞΒΞΒΞΒΞΒ msdn.microsoft.com