Une URL (Uniform Resource Locator) est un identifiant unique utilisé pour localiser une ressource sur Internet. Elle est également appelée adresse web. Les URL se composent de plusieurs parties, dont un protocole et un nom de domaine, qui indiquent à un navigateur web comment et où récupérer une ressource.
Les utilisateurs finaux utilisent les URL en les tapant directement dans la barre d’adresse d’un navigateur ou en cliquant sur un lien hypertexte figurant sur une page web, une liste de signets, dans un courriel ou à partir d’une autre application.
Comment une URL est-elle structurée ?
L’URL contient le nom du protocole nécessaire pour accéder à une ressource, ainsi qu’un nom de ressource. La première partie de l’URL identifie le protocole à utiliser comme principal moyen d’accès. La deuxième partie identifie l’adresse IP ou le nom de domaine et éventuellement le sous-domaine où se trouve la ressource.
Les protocoles URL comprennent :
- HTTP (Hypertext Transfer Protocol) et HTTPS (HTTP Secure) pour les ressources web
- Mail to pour les adresses électroniques
- FTP pour les fichiers sur un serveur FTP (File Transfer Protocol)
- Telnet pour une session d’accès à des ordinateurs distants.
La plupart des protocoles URL sont suivis par deux points et deux barres obliques ; « mail to » est suivi uniquement par deux points.
En option, après le domaine, une URL peut également être spécifiée :
- un chemin d’accès à une page ou un fichier spécifique au sein d’un domaine ;
- un port réseau à utiliser pour établir la connexion ;
- un point de référence spécifique dans un fichier, tel qu’une ancre nommée dans un fichier HTML
- une requête ou les paramètres de recherche utilisés – généralement trouvés dans les URL pour les résultats de recherche.
Importance de la structure d’une URL
Les URL ne peuvent être envoyées sur internet qu’en utilisant le jeu de caractères ASCII. Comme les URL contiennent souvent des caractères non ASCII, l’URL doit être convertie dans un format ASCII valide. L’encodage des URL remplace les caractères ASCII dangereux par un « % » suivi de deux chiffres hexadécimaux. Les URL ne peuvent pas contenir d’espaces.
Exemples d’URL :
Lors de la conception des URL, il existe différentes théories sur la façon de rendre la syntaxe la plus utilisable pour les internautes. Par exemple, dans le chemin de l’URL, les dates, les auteurs et les sujets peuvent être inclus dans une section appelée « slug ».
Les différentes parties d’une URL
En utilisant l’URL https://velo.fr/search/query?q=URL comme exemple, les composants d’une URL peuvent inclure :
- Le protocole ou le schéma : Utilisé pour accéder à une ressource sur l’internet. Les protocoles comprennent http, https, ftps, mailto et file. La ressource est accessible par le nom du système de noms de domaine (DNS). Dans cet exemple, le protocole est https.
- Nom d’hôte ou nom de domaine : La référence unique représente une page web. Pour cet exemple, velo.fr
- Nom du port : Habituellement non visible dans les URL, mais nécessaire. Suivant toujours les deux points, le port 80 est le port par défaut pour les serveurs web, mais il existe d’autres options.
- Chemin d’accès : Un chemin d’accès fait référence à un fichier ou à un emplacement sur le serveur web. Pour cet exemple, « search/query »
- Requête : Trouvé dans l’URL des pages dynamiques. La requête est constituée d’un point d’interrogation, suivi de paramètres. Pour cet exemple, ?
- Paramètres : Eléments d’information dans une chaîne de requête d’une URL. Plusieurs paramètres peuvent être séparés par des esperluettes (&). Pour cet exemple, q=URL.
- Ancre : Il s’agit d’une référence interne à la page, qui renvoie à une section de la page web. Elle apparaît à la fin d’une URL et commence par un hashtag (#). Bien que ce ne soit pas le cas dans l’exemple ci-dessus, un exemple pourrait être #histoire dans l’URL https://en.wikipedia.org/wiki/Internet#Histoire
HTTP ou HTTPs
Le HTTP et le HTTPS sont tous deux utilisés pour récupérer des données sur un serveur web afin de visualiser le contenu dans un navigateur. La différence entre les deux est que le HTTPS utilise un certificat SSL (Secure Sockets Layer) pour crypter la connexion entre l’utilisateur final et le serveur.
Le HTTPS est essentiel à la protection des informations sensibles, telles que les mots de passe, les numéros de carte de crédit et les données d’identité, contre les accès non autorisés.
HTTPS utilise le numéro de port TCP/IP 443 par défaut, tandis que HTTP utilise le port 80.
URL ou URI
Une URL est le type le plus courant d’identificateur de ressources uniformes. Les URI sont des chaînes de caractères utilisées pour identifier une ressource sur un réseau. Les URL sont essentiels pour naviguer sur Internet.
Autres définitions