Untitled Document
1.Introduction
Ce document est venu de lui-même, par nécessité de mettre un peu d'ordre dans nos idées, dans nos moyens et
dans nos outils de travail. Il s'est donc imposé comme une façon d'organiser notre travail et nos futurs projets.
En le construisant jour après jour, il nous est rapidement apparu comme un outil qui pourrait servir à d'autres.
Le document que vous consultez en ce moment est le résultat d'un travail passionnant qui ouvre la porte vers
des développements clients-serveur accessibles à tous. C'est dans le contexte de l'enseignement assisté par
ordinateur que nous avons exploité le langage HTML.
Ce manuel est conçu pour un usage avec le logiciel Netscape comme navigateur. Nous avons cherché à
documenter, décrire et illustrer les possibilités du langage HTML version 2.0 avec les propositions et
extensions en vue de l'adoption prochaine de la version 3.0. De plus, l'affichage correct des commandes n'est
assuré que dans la version 1.1N de Netscape.
Bienvenue dans le web.
2.Historique
Le langage HTML tire son origine du langage SGML (Standard Generalized Markup Language). Il s'agit d'un
type particulier d'annotations destiné au WWW et qui correspond à une collection de styles reconnaissables par
les navigateurs. Un navigateur (en anglais "browser") est donc un logiciel qui interprète à l'écran les
commandes HTML contenues dans un document accessible sur le WWW.
Le langage HTML est utilisé sur le WWW depuis 1990. La version actuellement en vigueur est HTML 2.0.
Des discussions sont en cours (voir le document de Berners-Lee et Connolly en bibliographie) pour l'adoption
de nouvelles annotations pour une version HTML 3.0 notamment en matière de tableaux et de commandes de
formatage définissant les exposants et indices.
Chapitre suivant
1 2 3 4 5 6 7
8 9 10 11 12 13 14
15 16 17 18 19 20
Retour à la page principale
3. Pages HTML
Il faut d'abord spécifier qu'un document contenant des annotations en HTML n'est rien de plus qu'un fichier
texte. Il peut donc être reconnu sans problèmes de conversion d'un environnement à un autre. Une page peut
donc être lue et interprétée par n'importe quel navigateur sur n'importe quelle plateforme.
Pour créer un document HTML, il faut insérer les commandes suivantes au début du document:
<HTML> "première ligne du document"
<head> "ouverture de la zone d'entête"
<title> "titre de la page suivi de </title>"
</head> "fermeture de la zone d'entête."
<body> "ouverture du corps du document"
"Mettre le texte et les images ici"
</body> "fin du corps du document"
</HTML> "fin du document HTML"
La page ainsi créée pourra servir de maquette et s'affichera ainsi à l'ouverture dans l'éditeur de texte:
Au sujet de la commande <title>, il est possible d'obtenir une animation sympathique (mais inutile) à
l'ouverture du document HTML en insérant plusieurs commandes <title> consécutives. Le navigateur lira
successivement chaque ligne et réaffichera le nouveau titre à chaque raffraichissement. Essayez la commande
avec les lignes suivantes:
<HEAD>
<TITLE>ESSAI D'ANIMATION</TITLE>
<TITLE>E</TITLE>
<TITLE>ES</TITLE>
<TITLE>ESS</TITLE>
<TITLE>ESSA</TITLE>
<TITLE>ESSAI</TITLE>
<TITLE>ESSAI D</TITLE>
<TITLE>ESSAI D'</TITLE>
<TITLE>ESSAI D'A</TITLE>
<TITLE>ESSAI D'AN</TITLE>
<TITLE>ESSAI D'ANI</TITLE>
<TITLE>ESSAI D'ANIM</TITLE>
<TITLE>ESSAI D'ANIMA</TITLE>
<TITLE>ESSAI D'ANIMAT</TITLE>
<TITLE>ESSAI D'ANIMATI</TITLE>
<TITLE>ESSAI D'ANIMATIO</TITLE>
<TITLE>ESSAI D'ANIMATION</TITLE>
</HEAD>
La meilleure façon d'écrire toutes les lignes consiste d'abord à écrire la ligne la plus longue (la dernière), puis
de faire des copier coller à reculons en effaçant une lettre jusqu'à la première ligne.
Il est important de noter toutefois que cette possibilité a été accélérée dans Netscape 2.0 au
point de ne plus être perceptible.
Remarquez que les annotations HTML viennent pour la plupart en paires. Ainsi, on marque un élément avec la
commande <un code> et on la referme avec </un code> comme dans l'exemple ici:
<title>insérer ici l'élément</title>
Chapitre suivant
1 2 3 4 5 6 7
8 9 10 11 12 13 14
15 16 17 18 19 20
Retour à la page principale
4.Formatage du texte
Cette section décrit les différentes options disponibles pour formater le texte dans une page WWW.
4.1 Entêtes (Headers)
Le formatage d'une page commence généralement par le choix et l'usage d'entêtes prédéterminées qui
s'échelonnent de H1 à H6 (niveaux). La commande H1 est la plus grosse disponible et la H6 est la plus petite.
Les commandes Hx comprennent un choix de taille, le caractère gras et un retour de paragraphe.
<H1> suivi de l'entête et de </H1> donne:
Exemple de header de niveau 1
<H2> suivi de l'entête et de </H2> donne:
Exemple de header de niveau 2
<H3> suivi de l'entête et de </H3> donne:
Exemple de header de niveau 3
<H4> suivi de l'entête et de </H4> donne:
Exemple de header de niveau 4
<H5> suivi de l'entête et de </H5> donne:
Exemple de header de niveau 5
<H6> suivi de l'entête et de </H6> donne:
Exemple de header de niveau 6
Il n'y a pas de niveau inférieur à H6
Il n'est pas nécessaire d'ajouter les commandes <P> ou <BR> à la fin des lignes de H1 à H6 puisque celles-ci
sont implicites.
4.2 Autres commandes
<center> suivi de quelquechose de centré suivi de </center> donne:
Quelquechose de centré
<P> donne un changement de paragraphe
<br> donne un simple changement de ligne
Notez ici que les commandes <P> et <BR> n'ont pas à être fermées. Vous pouvez utiliser plusieurs
commandes <BR> ou <P> répétitivement pour augmenter l'espacement.
<b></b>donne un texte en gras: texte en gras
<strong></strong>donne un texte en gras également: texte en gras
<EM></EM> donne un texte en italique: texte en italique
<I></I> donne également un texte en italique: texte en italique
<CITE></CITE>donne aussi un texte en italique: texte en italique
<TT></TT>donne un texte formaté avec une fonte à espacement constant (teletype): texte formaté avec
une police à espacement constant
note: Les majuscules et les minuscules peuvent être utilisées indifféremment pour les annotations.
Texte préformaté
Les annotations <pre></pre> obligent le navigateur à afficher un texte préformaté. Le navigateur respecte alors
les fins de ligne (retours de chariot). Voici un exemple de texte préformaté:
Résultats du vote dans la circonscription
Noms votes obtenus %
________________________________________________
Candidat 1: 670 votes 59
Candidat 2: 341 votes 30
Candidat 3: 123 votes 11
________________________________________________
Total des votes: 1134 votes 100
La commande <CODE></CODE> permet d'afficher du texte provenant de lignes de codes en programmation.
C'est un formatage similaire à la commande TT. Les retours de chariot ne sont pas respectés contrairement à la
commande <PRE>. Voici un exemple:
if dPorifice[i] = b then begin Pt :=2 * dPorifice[i] / Ro / NO[i] Qorifice[i] :=NP[i] *
4 * 0.7 * Ao * XpwrY(Pt, 0,5); end
La commande <VAR></VAR> permet d'attribuer l'annotation variable à une donnée. L'élément annoté
s'affiche en italique comme l'exemple qui suit: variable
Augmentation ou réduction de la taille des caractères
<FONT SIZE="+2"></FONT SIZE="+2"> donne un accroissement de la grosseur affichée du texte de 2
unités:
plus gros de 2 unités
<FONT SIZE="+4"></FONT SIZE="+4"> donne un accroissement de la grosseur affichée du texte de 4
unités:
plus gros de 4 unités
<FONT SIZE="-2"></FONT SIZE="-2"> donne une réduction de la grosseur affichée du texte de 2 unités:
plus petit de 2 unités
Les valeurs autorisées s'échellonnent entre 1 et 7. Prenez note que Netscape reconnaît aussi les commandes
écrites sans guillemets comme <FONT SIZE=+1>. Nous recommandons toutefois que vous respectiez à la
lettre les codes HTML reconnus. Vous pouvez aussi utiliser commande abbréviée </FONT> pour clore la
commande <FONT SIZE>. Il est important de souligner ici que l'usage de cette commande n'influence pas la
taille des H1 à H6. Ainsi, augmenter la taille du texte peut entraîner un dépassement de la taille d'une entête, ce
qui n'est pas souhaitable.
BLOCKQUOTE
La commande <BLOCKQUOTE></BLOCKQUOTE> permet d'emprisonner un paragraphe telle une citation
en alinéa comme dans l'exemple ci-dessous:
Ce texte a été analysé par plusieurs auteurs dont Messieurs DeLaRoche, Dupuis et Dumont.
Ils en sont tous venus à la conclusion que le grand mérite réside dans la traduction parfaite
d'un texte déjà publié par un australien du nom de McIntyre.
La commande <STRIKE></STRIKE> permet de rayer un texte comme dans
l'exemple suivant: TEXTE RAYÉ
La commande <SUB></SUB> permet d'utiliser les indices dans des formules
comme dans l'exemple qui suit: H2O.
La commande <SUP></SUP> permet d'utiliser les exposants dans des formules
comme comme dans l'exemple qui suit: E=mc2.
Une autre commande intéressante permet de faire clignoter du texte afin d'attirer
l'attention de l'usager. La commande est: <BLINK>IMPORTANT</BLINK> et donne: IMPORTANT. Cette
commande ne fonctionne pas sur une image.
Caractères spéciaux dans HTML
Certains caractères ont une signification spécifique dans HTML. Pour les utiliser comme tels dans une page, il
faut utiliser les commandes alternatives pour les afficher correctement à l'écran. Ces commandes sont:
< pour: <
> pour: >
& pour: &
" pour: "
À PROPOS DES ACCENTS...
L'utilisation des caractères accentués sur le WWW pose un certain nombre de problèmes car il y a plusieurs
façons de traiter les caractères diacritiques.
On peut en effet utiliser une des deux méthodes suivantes:
Les caractères référencés (entity references en anglais)
Les caractères ISO Latin-1 (ISO-8859-1)
Les caractères référencés
Avec cette méthode, on utilise seulement le jeu de caractères US-ASCII standard.
Ce dernier ne contient que 127 caractères (non-accentués) et n'utilise que sept bits sur les huit que contient un
octet (l'unité fondamentale permettant de représenter un caractère latin sur les ordinateurs). Cette méthode a
l'avantage d'être passepartout puisque:
1. Certains systèmes informatiques filtrent le huitième bit lorsqu'ils échangent du courrier avec d'autres
systèmes informatiques. Aussi, l'envoi, par courrier électronique, d'un document HTML utilisant un
jeu de caractères 8 bits n'est pas assuré d'être réalisé avec succès. Par contre, la norme HTTP (utilisée
sur le WEB) prescrit des échanges utilisant 8 bits. L'utilisation d'un jeu de caractères contenant 256
entités est donc possible pour les communications sur le WWW.
2. Les jeux de caractères dits "étendus" ou 8-bits ne sont pas les mêmes d'un système informatique à un
autre. Aussi, la seule façon d'assurer l'intégrité d'un document HTML, quelle que soit la plateforme
utilisée, est de se limiter au jeu de caractères US-ASCII (7 bits).
Le désavantage de la méthode des caractères référencés est que la composition et la consultation des sources
HTML de votre document devient beaucoup plus fastidieuse (le document se trouve «enlaidi» d'une série de
codes inintelligibles). Par exemple, le caractère é est encodé avec la séquence de caractères suivante:
é.
Voici un fichier HTML utilisant les caractères référencés.
En d'autres mots, si le travail de composition d'un document HTML doit être effectué sur des plateformes
utilisant des encodages différents, la seule façon d'assurer l'intégrité du document lorsque celui-ci est échangé
consiste à utiliser les caractères référencés.
Cette situation est appelée à évoluer car l'interopérabilité entre les systèmes devient de plus en plus important.
Le jeu de caractères ISO Latin-1 (ISO-8859-1)
Cette méthode est, de bien des façons, plus élégante que la première. Elle suppose cependant l'utilisation, pour
la composition des pages HTML, d'une plateforme informatique qui utilise le jeu de caractères ISO Latin-1.
Le jeu de caractères ISO Latin-1 est constitué de 256 caractères permettant d'accommoder toutes les langues
latines occidentales. Comme son nom l'indique, il est l'objet d'une norme ISO reconnue sur l'Internet pour
l'encodage des caractères diacritiques.
La plupart des systèmes UNIX récents ainsi que les plateformes MS-Windows (3.11, 95, NT) peuvent être
configurés pour utiliser les jeux ISO Latins. Par contre, l'utilisation des plateformes Macintosh, MS-DOS ou
OS/2 peut poser des problèmes. En effet, les manufacturiers de ces systèmes ont adoptés des encodages
différents pour représenter les caractères diacritiques. Ainsi, le é est representé par la valeur numérique 130
dans la page de code multilingue (850) sur DOS et OS/2, par la valeur 142 sur Macintosh et par la valeur 233
en ISO Latin-1.
Il va sans dire que si le logiciel de navigation WWW ne connaît pas le jeu de caractère utilisé, le résultat risque
d'être très décevant sinon illisible. En fait, la norme HTTP qui défini le protocole d'échange de données sur le
WEB prescrit le jeu de caracères ISO Latin-1 et les logiciels de navigation ne doivent pas assumer autre chose.
Autrement dit, si vous décidez d'utilisez le jeu de caractères ISO Latin-1 (8 bits), la consultation du code
source (HTML) de votre document devra toujours se faire avec un éditeur qui utilise lui aussi ce jeu de
caractères.
Exemples des résultats obtenus avec différents encodages
Pour illustrer la différence entre les jeux de caractères et les techniques de représentation des caractères
diacritiques, la liste qui suit contient des références à des fichiers sources en HTML utilisant différents
encodages:
Document HTML utilisant les caractères référencés
Document HTML utilisant les caractères ISO Latin-1
Document HTML utilisant les caractères de la Page de code 850 (MS-DOS, OS/2)
Document HTML utilisant les caractères Macintosh
Si vous demandez à votre navigateur de vous afficher le contenu de ces documents, seuls les deux premiers
apparaîtront "intacts". Par contre, si vous examinez la source de ces documents avec votre navigateur (view
source sur Netscape), alors le premier document et celui qui utilise l'encodage natif de votre système
d'exploitation apparaîtront "intacts". Essayez le!
En résumé
En tant que francophones, nous devrions encourager et promouvoir l'utilisation d'une norme et d'une
technologie qui permet d'exprimer toutes les subtilités de l'orthographe français sans recourir à des artifices
lourds, complexes et inesthétiques.
De ce point de vue, l'utilisation de caractères encodés en US-ASCII nous apparaît comme un pis-aller tout à
fait insatisfaisant.
Le jeu de caractères ISO Latin est déjà reconnu sur l'Internet et dans la communauté informatique
internationale. De plus, il n'est pas rattaché à un manufacturier d'ordinateurs ou de logiciels et il permet
l'expression de toutes les langues latines occidentales.
Nous encourageons tous les utilisateurs et concepteurs francophones à utiliser cette norme lorsque c'est
possible. Il faut également encourager les fabricants de logiciels d'exploitation, de traitement de textes, de mise
en page, d'édition et de traitement de courrier électronique à faire de même.
La tâche de décodage et de conversion doit être laissée aux ordinateurs, les humains ont des choses plus
intéressantes à faire.