La structuration des documents

La structuration de données

  • Avant le web : Classification de Dewey, classification décimale (bibliographie), ISBN, ISSN
  • Le NIR (N° d'Inscription au Registre, ou n° INSEE) : X XX XX XX XXX XXX XX → schéma XML
  • Des exemples sur le web : EXIF → Flickr, ISBN → Amazon, Zotero
  • 3 modèles (paradigmes) : l'arbre (XML), la table (SQL), le graphe (RDF).
  • 1 exemple de tables : Facebook (la table user) → dictionnaire de donnée + masque de saisie (le formulaire)
Modèle conceptuel de la base de données de facebook (version obsolète : 2007)

Modèle conceptuel de la base de données de Facebook (version obsolète : 2007)

Mapa Conceptual de la Acampadasol

Mapa Conceptual de la Acampadasol

Les agents logiciels

L'humain a des capacités cognitives telles qu'il peut comprendre les données collectées et faire avec des inférences (raisonnement par déduction/induction/abduction). Un ordinateur ne dispose pas encore de cette capacité : la structuration des documents et l'addition de métadonnées peut permettre à une machine de faire des inférences. Quels sont ces agents logiciels capables de parcourir des documents, de traiter les données et de faire des (micro) inférences ?

  • Pour l'instant, ceux qui parcourent et rajoutent des données:
    • les robots d'indexation (crawler, spider, googlebot)
    • les formulaires de saisie pour base de données
    • les générateurs de flux RSS et les lecteurs de flux
    • les API permettant la circulation des données (format JSON ou XML) à partir d'un silo de données
    • les applications web ou smartphones (push/pull)

Problématique

  • le web sémantique ne concerne-t-il que les machines (comme le web social ne concernerait que les humains) ? Web social et web sémantique peuvent-ils se compléter ? S'annuler ? Se rejoindre
  • 1er niveau de réponse : tension entre la représentation de la réalité côté concepteur et côté utilisateur. Les finalités des premiers ne correspondent pas forcément aux attentes des seconds (cf. sondage). Comment faire correspondre le modèle sémantique appliqué back-office (côté serveurs) aux usages front-office (côté client) ?

L'évolution de la sémantique du web

 
web social web sémantique
CONVERSATION
espace conversationnel
DOCUMENT
espace documentaire
WEB 2.0 → WEB² ← WEB 3.0