Pierre Geneves Pierre Genevès

Accès à l'information: du web des données au web sémantique (ENSIMAG ISI 3A)

Objectifs

L'objectif de ce cours est de présenter les concepts, méthodes et algorithmes pour interroger et traiter les structures de données du web. Ce cours vise à introduire les fondements des langages et des techniques de programmation adaptés à un modèle de données très largement répandu sur le web (et central en informatique): les arbres. Dans la mesure où les technologies web font intervenir de nombreux langages et syntaxes (XML, JSON, RDF, etc.), dans un premier temps nous nous concentrerons sur les arbres étiquetés et ordonnés qui forment la base du web tels que les données XML et les pages web. Deux particularités de ces structures: ordre et hiérarchie, les distinguent de manière fondamentale des structures relationnelles plus classiques comme les tables. Dans un second temps, nous présenterons les fondements rendant possible la création de langages de requêtes et de langages de programmation adaptés à ces données. Nous introduirons des outils théoriques et algorithmiques (automates d'arbres, logique) au coeur de l'informatique théorique. Nous verrons comment ces concepts s'appliquent directement pour exploiter ces données de manière correcte et efficace, répondre à des requêtes expressives, et vérifier la cohérence des données.

Contenu

Le cours abordera les thématiques suivantes, une thématique pouvant s'étendre sur plusieurs séances :
  1. Introduction
  2. Standards et données du web
  3. Arbres et types
  4. Requêtes d'arbres
  5. Programmation statiquement typée avec les arbres
  6. Fondements :
    • automates d'arbres
    • logiques d'arbres
  7. Raisonnement logique sur les arbres
  8. Applications au typage et à l'analyse statique

Prérequis

Connaissances de base en algèbre, langages, bases de données, algorithmique et complexité.

Modalités d'évaluation

Examen écrit.