equilibre.glossaire

index du glossaire

Documents : Formats structurés d'information

Langage XML : Extensible Mark-up Language (langage de balisage extensible) (« .xml »)
Un sous-ensemble réduit et simple du langage SGML conçu (en 1996) pour faciliter la mise en oeuvre et interfonctionnement avec les langages complets SGML et HTML.
Il s'agit en ce moment de l'élaboration d'un profil d'application métalangue, il est plus simple à utiliser que le langage SGML (il réduit un document de référence de 500 pages à 26).
Contrairement au langage HTML, le langage XML supporte (de façon facultative) les étiquettes et les attributs définis par l'utilisateur, permet l'emboîtement dans les documents à n'importe quel degré de complexité, et peut contenir une description facultative de sa grammaire pour être utilisée par les applications qui ont besoin d'exécuter une validation structurelle.
Chaque document en langage XML valide sera un document conforme en langage SGML. Aucune rétrocompatibilité avec les documents en langage HTML, bien que ceux qui se conforment au langage HTML 3.2 peuvent être facilement convertis. Ne vise pas à supplanter le langage HTML mais à le compléter. Le jeu de caractères du langage XML est Unicode. Ce langage fait présentement l'objet de discussions importantes et les lancements futurs des navigateurs MS Internet Explorer et Netscape peuvent être validés XML.

Langage HTML : Hypertext Mark-up Language (langage de balisage hypertexte) («.htm», «.html»)
Version réduite d'un jeu d'étiquettes du langage SGML DTD qui fournit un ensemble de styles de plates-formes indépendantes (définies par les étiquettes) utilisés pour définir les composantes d'un document Web.
Le langage HTML 2.0 est une norme du Groupe IETF; la version 3.0 était une ébauche du Groupe IETF (qui a eu duré six mois); le langage HTML 3.2 a été annoncé en mai 1996 afin de supplanter la version 2.0 comme le plus petit dénominateur commun. La version 3.2 comprend toute la version 2.0 et les caractéristiques populaires de 3.0 comme les tableaux, mais ne comprend pas de cadres. La version 4.0 a été lancée comme ébauche en juillet 1997.
Alors que les étiquettes HTML sont principalement liées à la structure, il existe de plus en plus d'étiquettes acceptées pour préciser la présentation et la disposition.

Langage DHTML : Dynamic HTML (langage HTML dynamique)
Dénote les développements récents réalisés par Netscape et Microsoft et qui utilisent un ensemble de feuilles de style en cascade (voir plus loin) et un langage de script en code machine comme Visual Basic script et Javascript afin de fusionner le document HTML avec la feuille de style. Permet un plus grand contrôle créateur sur la présentation visuelle d'une page HTML et permet à la page de réagir de façon dynamique, sans un appel au serveur, pour les événements produits par les utilisateurs.

Cascading Style Sheets (Feuilles de style en cascade) («.css»)
Une nouvelle approche afin d'augmenter le contrôle sur le formatage visuel des documents HTML (p. ex., espacement, couleurs, fonds, choix de polices, ombrage, organisation en couches, positionnement relatif ou absolu, visibilité des options marche/arrêt, choix des médias tels que imprimé, affichage, braille, compréhension). Les étiquettes CSS sont dans un document séparé ou font partie du document (au lieu d'être enchâssés dans le texte comme avec le langage HTML traditionnel), de sorte qu'ils peuvent être modifiés, mis à jour dans divers documents rapidement. Les feuilles de style en cascade peuvent être mises en antémémoire localement et réutilisés, de sorte que leur déploiement peut entraîner des gains au niveau de la largeur de bande ou du temps de réponse.

Recherche et organisation de l'information

La gestion des connaissances (def. CEA)
Elle vise à :
  • rassembler le savoir et le savoir-faire sur des supports facilement accessibles ;
  • faciliter leur transmission en temps réel ou dans l'avenir ;
  • garder la trace de certaines activités ou actions importantes pour l'avenir.
La démarche de gestion des connaissances consiste à proposer aux spécialistes un ensemble cohérent d'actions à mener de manière à :
  • obtenir une vision globale et partagée de la diversité des connaissances, de leur localisation au coeur des métiers, de leur rôle et de leur origine pour aboutir à une véritable cartographie des connaissances;
  • pérenniser les connaissances "stratégiques", que ce soit celles détenues par les hommes, celles contenues dans l'ensemble de la documentation ou encore celles associées aux systèmes d'informations technologiques ;
  • distribuer, diffuser, valoriser les connaissances afin de créer les conditions d'une meilleure efficacité de l'organisation.

L'ingénierie documentaire (def. CEA)
Elle consiste à structurer l'information pour en optimiser l'exploitation. Elle permet d'exploiter le contenu même des textes pour rechercher une information précise, transmettre une information au destinataire intéressé, aider à la cohérence des textes rédigés (en particulier dans le domaine réglementaire et administratif), faire apparaître les concepts propres à un domaine et les organiser sous forme de graphes. Elle s'appuie sur les méthodes de l'ingénierie linguistique automatique qui permet l'extraction et l'interprétation du contenu du document.

Moteurs de recherche Web
Aucune norme ne régit les moteurs de recherche Web. La plupart consistent en bases de données de mots clés indexés à partir de ressources Web et offrent des possibilités de recherche booléenne, de recherche de phrases ou de mots, et un classement + ou - pertinent. Bon nombre fournissent un accès navigable aux répertoires (structurés) en plus de l'indexation de mots clés.

Thésaurus
Ensemble de mots ou de termes (dits descripteurs) constituant un vocabulaire défini (dit aussi vocabulaire contrôlé de termes), ayant entre eux des relations d'ordre sémantique (par exemple, une relation hiérarchique orientée du générique vers le spécifique) ou pragmatique, et qui s'appliquent à un ou plusieurs domaines de la connaissance. Du point de vue de sa fonction, un thésaurus est à la fois un instrument de contrôle et de référence du vocabulaire utilisé pour décrire et organiser des informations ou des concepts informatifs dans un domaine donné.

base de données textuelles
C'est un ensemble de textes rassemblés et structurés à des fins de consultation et d'exploitation par des utilisateurs ou par des programmes informatiques. La base de données textuelles sert de sources de références et d'exemples pour divers types d'analyses.

Métadonnées Ce terme signifie « des données sur des données » ou, plus particulièrement dans le contexte Web, des renseignements compris par une machine afin d'identifier, de localiser ou de décrire les ressources Web. Les normes traditionnelles de bibliothèques équivalentes comprennent l'ISBN et l'ISSN (identification), le numéro de rayon/cote (emplacement), l'ISBD et les RCAA2 (description bibliographique), le numéro de contrôle LC et la CDD (classification par matière), les LCSH (vedette-matière) et le MARC (format de communication lisible par machine).

RDF : Resource Description Framework (cadre de définition des ressources)
Cadre technique qui est en voie d'élaboration par le W3C pour appuyer l'interfonctionnement des métadonnées décrivant tout article qui peut avoir un URI (voir plus loin). Les codes comme PICS et Dublin Core (voir plus loin) sont des vocabulaires normalisés prédéfinis dans le cadre. XML est la syntaxe d'encodage.

sources

Contactez-nous contact@equilibre.thesaurus.free.fr