Aller au contenu principal

Définir le thésaurus et son utilité

Quelques définitions

Thésaurus

Répertoire alphabétique de termes normalisés pour l'analyse de contenu et le classement des documents d'information. (Le Grand Robert de la langue française, 2014)

Terme normalisé

Terme dont le fond et la forme est fixé par des indexeurs d’un outil documentaire afin de représenter une réalité abstraite.

Indexer

Attribuer à (un document) une marque distinctive renseignant sur le contenu et permettant de le retrouver, en fonction d'un plan de classement choisi. (Le Grand Robert de la langue française, 2014)

Avantages et inconvénients d'un thésaurus

Principaux avantages

  • Rend la recherche beaucoup moins complexe sans sacrifier l’efficacité.
  • Vous assure des mots à utiliser.

Principaux inconvénients

  • Son existence dépend de l’outil que vous utilisez.
  • Les thésaurus ne sont pas homogènes.
  • Parfois un peu trop précis.

Indexation: Google VS Bases de données

Pour comprendre l'existence d'un thésaurus et son utilité significative en recherche, il faut d'abord présenter comment fonctionne l'indexation dans une base de données.

L'indexation dans Google

  1. Des robots parcourent le web et scannent toutes les pages disponibles à l’indexation.
  2. Les pages scannées sont versées dans l’index de Google.
  3. L’internaute effectue une requête dans la boîte de recherche de Google.
  4. Chacune des pages web qui contiendront les critères de recherche indiqués dans l’interface de recherche vont être affichés dans les résultats.
  5. L’ordre d’apparition des résultats est géré par l’algorithme de recherche de Google. C’est celui-là qui a contribué au succès monstre du moteur de recherche. Il prend en considération un certain nombre de variables afin de s’assurer le plus possible que les premiers résultats sont ceux qui répondent le mieux au besoin initial de recherche.

L'indexation dans une base de données

  1. Une base de données est créée en versant le contenu de documents dans une base de données.
  2. Chacun des documents passe devant un indexeur (humain généralement) qui prend connaissance des différentes sections essentielle du document :
    • Auteur
    • Titre
    • Édition
    • Sujets abordés
    • Etc.
  3. L’indexeur colle à chacune des informations pertinentes d’un document une catégorie, dans lequel tout chercheur pourra chercher par la suite.
  4. L’ordre d’apparition des résultats est aussi déterminé par des algorithmes de recherche performants.

Exemple des champs disponibles à la recherche dans Academic Search Complete

Le thésaurus concerne précisément l'indexation des sujets. Il ne suffit pas uniquement de coller un sujet à un article, encore faut-il fixer le terme qui représentera le concept. D'où la pertinence de rendre disponible cet outil aux chercheurs.

Le thésaurus sert donc à fixer la forme d'un concept. Pour référer à X on utilise le terme Y. Ceci étant dit, il ne se limite pas qu'à cela.

Thésaurus - Fonctionnement

Un thésaurus est divisé en différentes sections:

  • La formulation choisie/acceptée;
  • La définition du concept derrière la formulation;
  • Les concepts hiérarchiquement plus généraux;
  • Les concepts hiérarchiquement plus spécifiques;
  • Les concepts présentant des liens significatifs avec le concept en question;
  • Les concepts qui sont compris dans la formule acceptée.

Exemple - Thésaurus de la base de données Academic Search Complete

Thésaurus - Utilisation

1. Chercher les termes à l'intérieur du thésaurus

2. Ajouter les termes sélectionnés à la boite de recherche et les combiner à l'aide des opérateurs booléens.

3. Lancer la recherche.