Treffer: Une approche pour la Représentation Sémantique de Documents

Title:
Une approche pour la Représentation Sémantique de Documents
Source:
Veille stratégique, scientifique et technologique (Tome 2 : salle B : Systèmes d'information elaborée, bibliométrie, linguistique intelligence economique). :43-54
Publisher Information:
[Toulouse]: [Université Paul Sabatier], 2005.
Publication Year:
2005
Physical Description:
print, 22 ref
Original Material:
INIST-CNRS
Document Type:
Konferenz Conference Paper
File Description:
text
Language:
French
Author Affiliations:
IRIT Campus Univ. Toulouse III 118 Route de Narbonne, 31062 Toulouse, France
Rights:
Copyright 2015 INIST-CNRS
CC BY 4.0
Sauf mention contraire ci-dessus, le contenu de cette notice bibliographique peut être utilisé dans le cadre d’une licence CC BY 4.0 Inist-CNRS / Unless otherwise stated above, the content of this bibliographic record may be used under a CC BY 4.0 licence by Inist-CNRS / A menos que se haya señalado antes, el contenido de este registro bibliográfico puede ser utilizado al amparo de una licencia CC BY 4.0 Inist-CNRS
Notes:
Sciences of information and communication. Documentation

FRANCIS
Accession Number:
edscal.23770806
Database:
PASCAL Archive

Weitere Informationen

Cet article traite de l'application des ontologies au domaine de la recherche d'information. L'objectif de l'approche est de représenter le contenu sémantique de documents. L'approche consiste à projeter les documents sur une ontologie linguistique générale, telle que WordNet. Il s'agit d'identifier pour chaque document les représentants de concepts de l'ontologie. Ces derniers peuvent être des mots simples ou des groupes de mots. Un critère de cooccurrence (CF.IDF) est utilisé pour extraire les concepts importants. Un deuxième critère qui est la similarité sémantique entre concepts, permet de les désambiguïser via le réseau sémantique de l'ontologie. Le résultat de ce matching entre le document et l'ontologie est un ensemble de concepts désambiguïsés (appelés aussi concepts-sens ou noeuds) avec des liens pondérés entre eux, formant ce que nous appelons le noyau sémantique de document qui représente au mieux le contenu sémantique du document. L'approche proposée peut être considérée comme une première étape vers l'objectif à long terme qui est l'indexation intelligente et la recherche sémantique.