Copyright 2015 INIST-CNRS CC BY 4.0 Sauf mention contraire ci-dessus, le contenu de cette notice bibliographique peut être utilisé dans le cadre d’une licence CC BY 4.0 Inist-CNRS / Unless otherwise stated above, the content of this bibliographic record may be used under a CC BY 4.0 licence by Inist-CNRS / A menos que se haya señalado antes, el contenido de este registro bibliográfico puede ser utilizado al amparo de una licencia CC BY 4.0 Inist-CNRS
Notes:
Sciences of information and communication. Documentation
FRANCIS
Accession Number:
edscal.23770806
Database:
PASCAL Archive
Weitere Informationen
Cet article traite de l'application des ontologies au domaine de la recherche d'information. L'objectif de l'approche est de représenter le contenu sémantique de documents. L'approche consiste à projeter les documents sur une ontologie linguistique générale, telle que WordNet. Il s'agit d'identifier pour chaque document les représentants de concepts de l'ontologie. Ces derniers peuvent être des mots simples ou des groupes de mots. Un critère de cooccurrence (CF.IDF) est utilisé pour extraire les concepts importants. Un deuxième critère qui est la similarité sémantique entre concepts, permet de les désambiguïser via le réseau sémantique de l'ontologie. Le résultat de ce matching entre le document et l'ontologie est un ensemble de concepts désambiguïsés (appelés aussi concepts-sens ou noeuds) avec des liens pondérés entre eux, formant ce que nous appelons le noyau sémantique de document qui représente au mieux le contenu sémantique du document. L'approche proposée peut être considérée comme une première étape vers l'objectif à long terme qui est l'indexation intelligente et la recherche sémantique.