Internet :

Introduction :

Ce chapitre résume tout ce que vous devez savoir sur Internet avant d'aborder le HTML et le CSS. Il débute par une présentation pratique du fonctionnement d'Internet suivie d'une présentation des différents concepts liés à Internet : serveurs web, HTTP, W3C et navigateurs web.

Nous utilisons dans ce cours les termes "Internet", "Web" ou "World Wide Web" de manière équivalente.

Fonctionnement d'Internet :

Lorsqu'un utilisateur désire consulter un site web, il encode l'adresse dans son navigateur (Par exemple : http://ochoquet.be/index.html). Le navigateur (Firefox, Opera, Safari, ...) demande la page web introduite au serveur. Dans notre exemple, la page web demandée est "index.html". Remarquez que l'adresse http://ochoquet.be/index.html est strictement équivalente à l'adresse http://ochoquet.be/ parce que lorsqu'aucune page particulière n'est renseignée dans l'adresse de la ressource demandée, le serveur recherche par défaut la page "index.html".

Avant d'aborder le sujet principal de ce cours, HTML et CSS, nous allons essayer de mieux comprendre notre environnement de travail en définissant les concepts de serveurs web, W3C, navigateurs web et enfin de situer le HTML dans cet environnement.

Le serveur web :

Définition :

Le serveur web qui reçoit la demande répond par l'envoi de la ressource concernée. Dans notre exemple, le serveur web renvoie la page d'accueil (index.html). Lorsque le navigateur de l'utilisateur reçoit la ressource, il l'affiche à l'utilisateur. Le HTML contenu dans la page web indique au navigateur ce qu'il doit savoir pour afficher le contenu de la page.

Le serveur Web est en écoute sur un port, généralement le 80.

Le client et le serveur échangent des donnéessous forme textuelle au travers de requêtes-réponses. Le protocole HTTP est dit non-orienté session (on parle de protocole sans mémoire) dans la mesure où la connexion entre le client et le serveur est coupée après chaque paire prequête-réponse. La notion de sessions devra, si elle est nécessaire, être implémentée au-dessus du protocole HTTP. HTTPS est la version sécurisée du protocole HTTP. Il utilise TLS2 (Transport Layer Security, anciennement SSL) pour le transport.

Un serveur HTTP ou démon HTTP ou HTTPd (HTTP daemon) ou (moins précisément) serveur web, est un logiciel servant des requêtes respectant le protocole de communication client-serveur HTTP, qui a été développé pour le World Wide Web (www).

Le serveur web est un serveur qui attend en permanence les requêtes des navigateurs web. Il doit fonctionner continuellement sinon le site Internet est hors service. Lorsqu'il reçoit une requête, il recherche l'élément demandé (page HTML, image, film, ...) et le renvoie au navigateur.

HTTP :

HTTP est le protocole de communication utilisé entre un client Web (généralement un browser1) et un serveur Web dans une architecture Client/Serveur.

HTTP permet à des PC, des Mac, des smarthphones et à tous les appareils connectés de surfer sur Internet. HTTP (HyperText Transfer Protocol) est un protocole (ensemble de règles permettant d'établir une communication entre deux entités) qui permet de transférer des documents hypertextes sur le Web. Ces documents hypertextes sont des pages HTML, des images, des films ou d'autres types de fichiers liés à une page web. HTTP est un protocole à base de requêtes et de réponses; lorsqu'on introduit une adresse dans le navigateur, celui-ci demande au serveur la ressource correspondante à la demande via HTTP.

Il existe différents types de requêtes : GET et POST seront deux méthodes détaillées dans la partie sur les formulaires). Lorsque le serveur trouve la page web recherchée, il la sert au navigateur et celui-ci l'affiche. Quand la ressource est introuvable, la réponse du serveur est une erreur 404. Il existe d'autres protocoles permettant le transfert de fichiers : HTTPS, FTP, FTPS, SSH, ...

URL :

Une URL (Uniform Ressource Locator) est une chaîne de caractères (256 maximum, c'est-à-dire 2^8 caractères) qui localise une ressource Internet. Il ne faut pas confondre URI (Uniform Ressource Identifier) qui identifie une ressource Web ou encore les confondre avec URN (Uniform Ressource Name) qui identifie une ressource Web à l'intérieur d'un espace de nom. L'URL peut reprendre les notions suivantes :

  • le protocole (les navigateurs) : HTTP, HTTPS, FILE, etc...
  • l'identification du serveur (adresse IP ou nom de domaine)
  • le numéro de port : sur le serveur, plusieurs programmes distincts peuvent être à l'écoute de requêtes. Pour distinguer un de ces programmes des autres, l'URL reprendra explicitement ou implicitement un numéro de port. Par exemple, le port 80 est celui utilisé par défaut par les serveurs web et donc, de manière générale, on écrira http://www.he2b.be, plutôt que http://www.he2b.be:80.
  • un chemin d'accès à la ressource

W3C :

Le World Wide Web Consortium, abrégé W3C, est un consortium fondé en 1994 pour promouvoir la compatibilité des technologies du World Wide Web telles que le HTTP, HTML, XHTML, XML, PNG, SVG, SOAP, ... En d'autres termes, ce consortium travaille à la standardisation et l'harmonisation des technologies web.

Il réunit les plus grands instituts d'informatique du monde entier; par exemple, le Massachusetts Institute of Technology (MIT).

Le W3C met des recommandations (des "normes") à valeur de standards industriels. Un document W3C traverse plusieurs étapes avant de devenir une recommandation :

Les recommandations émises par le W3C sont détaillés sur le site http://w3c.org/ sur lequel vous retrouverez toutes les informations sur le HTTP et le HTML, par exemple. La recommandation sur le HTTP détaille en long et en large le protocole HTTP et définit entre autres tous les codes d'erreur gérés susceptibles d'être renvoyés par un serveur web.

Le serveur retourne sa réponse constituée de la version du protocole, du code de réponse accompagné de son texte explicatif ainsi que, généralement, du document demandé.

Les codes d'erreur (composés de 3 chiffres) sont classés comme suit :

  • les codes de type 1xx pour les messages d'information;
  • les codes de type 2xx pour les messages de réussite;
  • les codes de type 3xx pour les messages de redirection;
  • les codes de type 4xx pour les messages d'erreur de la part du client;
  • les codes de type 5xx pour les messages d'erreur du serveur.

Dans la recommandation, l'erreur 404 est définie par les termes suivants :

                        404 Not Found

The server has not found anything matching the Request-URI. No indication is given of wheter the condition is temporary or permanent. The 410 (Gone) status code SHOULD be used of the server knows, through some internally configurable mechanism, that an old resource is permanently unavailable and has no forwarding address. This status code is commonly used when the server does not wish to reveal exactly why the request has been refused, or when no other response is applicable.

Retour en haut →