Module 5

Projet d’application à la gestion des connaissances

Étape 1. Définition du projet

Au cours des modules 2, 3 et 4, vous avez réalisé une série d’activités pratiques qui servent à introduire, à développer et à évaluer vos compétences relatives aux technologies sémantiques. Dans la plupart de ces activités, nous avons utilisé l’exemple de la TÉLUQ en construisant des graphes RDF mettant en jeu une partie de son personnel, de ses unités administratives, de ses produits (cours et projets de recherche) et des sujets ou des connaissances qui y sont traitées. Puisque la TÉLUQ est une organisation qui doit, comme toute organisation, gérer ses connaissances, nous pouvons nous en servir pour illustrer les principales composantes d’un projet de gestion des connaissances pour une autre organisation, soit les objectifs, la thématique, les vocabulaires et l’échéancier de votre projet.

Les objectifs

Il faut d’abord déterminer à quoi vont servir la base de connaissances et les vocabulaires que vous allez construire à travers les étapes de votre projet, ainsi que les requêtes ou les inférences que vous allez faire pour en extraire des informations utiles? Quelles informations recherchez-vous?

Choisissez d’abord une organisation, celle où vous travaillez de préférence ou une autre qui vous intéresse particulièrement. Par exemple, si vous travaillez (ou avez travaillé) pour une entreprise d’alimentation ou une firme de logiciels, choisissez-là. Ou encore si vous vous intéressez au cinéma ou à la musique, choisissez une entreprise qui produit des films ou des œuvres musicales.

Dans l’exemple de la TÉLUQ, l’objectif était relativement simple. Il consistait à décrire le mieux possible une partie de la réalité de l’organisation. Ce travail est analogue à la construction d’une base de données, mais en utilisant les principes du web de données liées. On peut imaginer qu’une telle base de connaissances sur la TÉLUQ pourrait être utilisée par un préposé au renseignement qui l’utiliserait pour répondre au téléphone ou par courriel aux questions du public sur l’offre de cours de la TÉLUQ. Elle pourrait aussi servir de base à la construction du site web de l’organisation; certaines informations étant affichées de façon standard en utilisant les URI représentant les concepts, les personnes ou d’autres entités, alors que d’autres seraient obtenues grâce à une interface de requête mise à la disposition des utilisateurs du site leur permettant d’afficher des informations qui les intéresse particulièrement. Ces informations seraient extraites de la base de connaissances RDF au moyen de requêtes ou d’inférences. Enfin, une autre utilisation possible consisterait à modéliser un processus de travail, par exemple les différentes étapes de conception, de médiatisation et de diffusion d’un cours (produit principal de la TÉLUQ), en mettant à la disposition de ses acteurs des informations nécessaires à leur travail, extraites du web de données.

Nous vous proposons de faire un choix entre deux types de projet.

  • Une base de connaissances alimentant un site web d’information sur votre organisation.
  • Une base de connaissances soutenant un processus de travail au sein de votre organisation.

Option A – Maquette du portail d’une organisation utilisant le web de données

En utilisant un éditeur web tel que WordPress, Drupal, Joomla, DotNetNuke ou SPIP (ou même Powerpoint si vous ne connaissez aucun éditeur web), il s’agit de créer une maquette du portail web donnant accès à l’information de votre base de connaissances organisationnelle. Certains éléments d’interface de votre site devront être liés à des résultats de requêtes SPARQL ou des inférences permettant d’afficher de l’information extraite de votre future base de connaissances RDF.

Pour l’organisation que vous avez choisie, faites un premier inventaire des informations que vous aimeriez afficher et qui pourraient intéresser un utilisateur du site web : ses acteurs, ses départements, leurs produits, de l’information sur les produits en les décrivant à l’aide de classes et de propriétés (relations). Prévoyez aussi d’intégrer l’information sur les licences des produits et sur les lieux géographiques où les produits sont distribués. Faites un premier schéma de la maquette en y disposant ces informations.

Option B – Processus de travail instrumenté par le web de données

Pour l’organisation que vous avez choisie, choisissez l’un de ses processus de travail. Pour une entreprise manufacturière, ce pourrait être certaines étapes de production, d’acquisition et d’entreposage des matières premières jusqu’à la fabrication d’un produit et sa distribution. Pour un distributeur de musique, ce pourrait être le processus de sélection des artistes ou des auteurs et la préparation des contrats, jusqu’aux ententes de distribution avec les détaillants en magasin et (ou) les sites de distribution sur le web.

Au cours de votre projet, il s’agira de construire un modèle de scénario pour ce processus de travail, en utilisant par exemple le logiciel G-MOT (option « modèle de connaissances »), en faisant apparaitre l’enchainement des tâches, les acteurs, les intrants et les produits de chaque tâche. Ensuite, il s’agira d’associer aux entités de ce scénario diverses URI et (ou) des résultats d’une requête SPARQL donnant accès à de l’information qui s’affichera en regard de chaque tâche.

La thématique

Il s’agit maintenant pour vous de préciser la thématique de votre projet.  Pour l’organisation que vous avez choisie, repérez les principales productions, les propriétés qui permettent de les décrire, les tâches et les processus de production, les personnes et (ou) les départements de l’organisation impliquées dans ces tâches ou ces processus, les connaissances et les compétences de ces personnes requises par leurs tâches dans l’organisation.

Votre projet va consister d’abord à représenter ces différentes entités et les liens entre elles.  Le tableau suivant présente l’exemple d’une organisation comme la TÉLUQ ou une autre université.

Production Tâche Acteur Sujet/Connaissance Relation
Cours
Projets de recherche
……
Rédaction d’un ouvrage
Préparation des activités d’un cours
Médiatisation d’un cours
Diffusion des cours
…..
Professeurs
Professionnels pédagogiques
Assistants de recherche
Médiatiseurs
Gestionnaires de la diffusion
…..
Informatique
Gestion
Éducation
…..
Cours vs acteurs
Cours vs tâches
Acteurs vs tâches
Cours vs sujet
Acteurs vs département
…..

Il s’agit pour vous de choisir les entités et les relations en fonction de votre objectif. Selon le type de projet que vous avez choisi (A ou B), pour alimenter les plages d’information de la maquette du portail (A) ou pour fournir de l’information utile à la réalisation des tâches du processus de travail (B).

Les vocabulaires

Une fois choisies le type de projet, l’organisation et la thématique, il vous faut identifier les concepts, c’est-à-dire les concepts ou les vocabulaires qui vous permettront de décrire adéquatement les propriétés des entités impliquées dans votre projet. Certains de ces concepts peuvent être choisis dans un ou plusieurs vocabulaires standards comme FOAF ou DBpedia. Vous aurez besoin aussi de définir un vocabulaire spécifique à votre organisation et à son domaine d’opérations dont certains éléments seront pris dans certains des vocabulaires suivants :

Note : De nombreux vocabulaires se trouvent ici : https://lov.okfn.org/dataset/lov/

À titre d’exemple, dans le cas de la TÉLUQ, nous avons choisi le vocabulaire FOAF pour décrire les acteurs, leurs projets et leurs départements d’appartenance, le vocabulaire DCterms pour les organisations et les types de ressources et de groupes d’acteurs, et le vocabulaire DBpedia pour les sujets traités dans les cours. Nous avons aussi construit un vocabulaire particulier (« local ») à la TÉLUQ pour désigner les entités et les relations spécifiques à la TÉLUQ. Vous aurez à faire de même en fonction de l’organisation que vous avez choisie et des objectifs de votre projet d’application.

Le choix des termes de certains de ces vocabulaires dépend des objectifs de votre projet qui se préciseront au fur et à mesure de votre progression. Aussi, au début, les choix des concepts, et donc des termes des vocabulaires, ne peuvent être que préliminaires. Dès le début, vous aurez sans doute besoin de FOAF pour représenter les personnes de votre organisation et leurs relations, de DCterms pour décrire des propriétés des ressources et de DBpedia pour décrire les connaissances en jeu. Plus tard, vous utiliserez SKOS lorsque vous aurez besoin de construire un nouveau thésaurus spécifique. Si votre projet vous conduit à intégrer les réseaux sociaux, ou si les droits de propriété intellectuelle, le e-commerce ou la localisation géographique sont importants, vous intégrerez des termes d’autres vocabulaires.

L’échéancier de réalisation

Pour terminer la définition de votre projet, rédigez un plan de travail préliminaire répartissant dans les quatre dernières semaines du cours les travaux à faire pour réaliser le projet. Pour ce faire, consultez les consignes des différentes étapes qui suivent. Il va de soi que ce plan de travail sera révisé au fur et à mesure de l’avancement de votre projet. Il vous sera utile pour rédiger le rapport de projet. Voici en résumé quelques étapes clefs :

    • Cueillette de la documentation et des informations sur l’organisation selon le type de projet;
    • Base de connaissances RDF sous forme de graphe G-MOT, sérialisation en langage Turtle ou RDF/XML;
    • Interrogations SPARQL de la base RDF et complétion des informations nommées ou inférées dans Protégé qui seront affichées dans la maquette ou le scénario;
    • Plan du portail OU du modèle du scénario qui regroupera les informations;
    • Création d’un vocabulaire RDFS et OWL et, éventuellement, d’un thésaurus SKOS;
    • Interrogations SPARQL et inférences dans Protégé;
    • Réalisation de la maquette du portail OU du modèle de scénario;
    • Rédaction du rapport de projet.

License

Le contenu du site du cours INF 6070 de la TÉLUQ est diffusé sous licence Creative Commons Attribution - Pas d’Utilisation Commerciale - Partage dans les Mêmes Conditions 3.0.

Les autorisations au-delà du champ de cette licence peuvent être obtenues auprès de Gilbert Paquette.