Fructifions nos données sur le Web

Openweb.eu.org > Articles  > Fructifions nos données sur le Web

Abstract

Un simple site vous offre la possibilité d’avoir une visibilité sur le Web. Exposer la structure des données offre la possibilité de créer un verger riche en interactions avec la communauté Web. Une fois partagées, vos données participent à un écosystème. Quelles sont les étapes pour réaliser cette transition ?

Article

Une entreprise, une organisation, une personne individuelle ont un domaine de compétence qui peut être exprimé sous forme structurée. Un passionné de cuisine peut s’être spécialisé dans les recettes à base de coriandre. Une organisation gouvernementale peut avoir la liste de tous les aérodromes de son pays. Une société commerciale peut être spécialiste de la pâte à papier et des essences d’arbres. Toutes ces entités ont en commun la connaissance d’un domaine particulier.

Les pages de votre site Web sont extrêmement riches en termes de données. Le langage HTML offre un certain nombre d’éléments permettant d’en exprimer la richesse. À votre disposition pour décrire des extraits de textes provenant d’une autre source sur le Web ou d’un livre, il existe les éléments q, cite et blockquote. Afin de mettre en valeur des données tabulaires, comme les températures d’une ville au cours de plusieurs années, il existe les éléments table, tr, td, etc.

Quelques liens

L’autre élément de richesse du Web est l’hypertextualité, c’est-à-dire que chaque document sur le Web possède une adresse Web unique (une étiquette). Chacun de ces documents pouvant être mis en relation sans accords préalables. Une personne a réalisé un voyage au Japon et a visité un temple à Kamakura. Elle donne quelques informations mais connaît une page contenant de nombreux détails. Elle crée un hyperlien vers la page contenant l’information détaillée.

Le langage HTML est un langage simple. Il possède quelques briques essentielles, quelques archaïsmes du contexte dans lequel il a été développé, mais il est loin de pouvoir couvrir tous les types de description. Il est parfois nécessaire de pouvoir enrichir les données de la page Web en plaçant des étiquettes sur ces données. Plusieurs techniques sont à votre disposition mais deux de ces techniques, microformats et RDFa, ont obtenu le support des moteurs de recherche tels que Yahoo ! (leader) et très récemment Google. Les microformats ont été développés par un groupe de développeurs avec pour objectif de créer des vocabulaires contraints et spécifiques pour des applications déterminées (carnet d’adresse, calendrier). RDFa a été créé pour permettre l’expression de vocabulaires riches et variés sans contraintes de domaine d’application.

Vos données bourgeonnent avec RDFa

Les articles contenus sur le site OpenWeb ont une licence CreativeCommons Attribution-ShareAlike. Nous pouvons utiliser RDFa pour exprimer cette licence. Voici le code en question et son rendu dans un navigateur :

CodeRendu
Ce document est distribué sous une
<a xmlns:cc="http://creativecommons.org/ns#"
rel="cc:license"
href="http://creativecommons.org/licenses/by-sa/3.0/">
licence Creative Commons BY-SA</a>.
Ce document est distribué sous une licence Creative Commons BY-SA.

Simple ? non… Détaillons quand même les différents éléments du code précédent. :)

La brique de base, c’est la phrase suivante :

CodeRendu
Ce document est distribué sous une licence Creative
Commons BY-SA
Ce document est distribué sous une licence Creative Commons BY-SA

Cette phrase, apparemment tout ce qu’il y a de plus simple, véhicule une information potentiellement passionnante pour les machines, mais celles-ci ne sont pas forcément capables de l’interpréter. Le code précédent est donc satisfaisant mais peut-être pas suffisant. Pour commencer, le lecteur de la page peut vouloir savoir ce que veut dire Creative Commons BY-SA. Donnons un lien vers la licence :

CodeRendu
Ce document est distribué sous une
<a href="http://creativecommons.org/licenses/by-sa/3.0/">
licence Creative Commons BY-SA
</a>.
Ce document est distribué sous une licence Creative Commons BY-SA.

C’est déjà beaucoup mieux, mais nous pouvons améliorer en qualifiant le lien HTML par une information de licence :

CodeRendu
Ce document est distribué sous une
<a
rel="license"
href="http://creativecommons.org/licenses/by-sa/3.0/">
licence Creative Commons BY-SA
</a>.
Ce document est distribué sous une <a rel="license" href="http://creativecommons.org/licenses/by-sa/3.0/"> licence Creative Commons BY-SA.

Oui mais quel type de licence ? L’humain a pu le lire alors qu’une machine restera aveugle à ce contenu. L’organisation CreativeCommons a créé un vocabulaire pour décrire ses licences. Nous devons donc ajouter l’information permettant de retrouver le vocabulaire :

CodeRendu
Ce document est distribué sous une
<a xmlns:cc="http://creativecommons.org/ns#"
rel="cc:license"
href="http://creativecommons.org/licenses/by-sa/3.0/">
licence Creative Commons BY-SA
</a>.
Ce document est distribué sous une licence Creative Commons BY-SA.

Votre document est prêt pour une recherche dans un moteur de recherche avec une information plus spécifique.

Dans un prochain article, nous allons poursuivre et voir comment enrichir différentes parties de vos documents. D’ores et déjà, vous pouvez le faire pour une information de licence. Choisissez-la bien.

À propos de cet article

  • Openweb.eu.org
  • Profil : Débutant, Expert
  • Technologie : (X)HTML
  • Thème : Structure
  • Auteur :
  • Publié le :
  • Mise à jour : 4 mars 2014
  • 3 commentaires

Vos commentaires

  • ddpetit Le 21 septembre 2010 à 17:44

    Je suis totalement pour la diffusion de contenu sous licence. Le seul problème c’est que généralement les gens ne s’occupent pas des termes (complexes) de ces licences. Et ils s’en occupent encore moins quand le texte est en copyright.

    Damien Petitjean

  • Le 21 février 2012 à 16:42

    Bien d’accord avec ta remarque. Il y aura toujours des personnes pour ne pas s’occuper des licences, mais c’est à l’auteur de se charger de faire respecter ses droits....

    Ludovic Evrard

  • Recette de cuisine Le 14 août 2012 à 23:52

    Le seul problème c’est que généralement les gens ne s’occupent pas des termes (complexes) de ces licences.

Vos commentaires

modération a priori

Attention, votre message n’apparaîtra qu’après avoir été relu et approuvé.

Qui êtes-vous ?
Ajoutez votre commentaire ici

Ce champ accepte les raccourcis SPIP {{gras}} {italique} -*liste [texte->url] <quote> <code> et le code HTML <q> <del> <ins>. Pour créer des paragraphes, laissez simplement des lignes vides.

Suivre les commentaires : RSS 2.0 | Atom