L'objectif principal de ce projet est le développement d'un système de recherche multilingue (CLIR) pour la consultation de collections de textes multilingues, destiné à un scénario web. Nous testerons et mettrons en place divers modèles de représentation de documents et d'algorithmes de ranking.
Nous testerons également et mettrons en place des techniques de normalisation de la représentation de la question dans toutes les langues. Les traductions seront réalisées par des techniques basées sur les dictionnaires. Nous testerons et mettrons en place différentes techniques pour résoudre les problèmes détectés dans ce type de processus de traduction, comme l'ambiguïté et la couverture du dictionnaire. Nous analyserons et mettrons en place la manière de fusionner correctement les différents rankings obtenus à partir de différentes collections.
Dans un système de récupération d'informations multilingues, nous pouvons consulter de grandes collections de documents multilingues en formulant la question d'entrée dans une seule langue. Dans tous les cas, la structure de la question d'entrée et la représentation du résultat peuvent être très variées. La question d'entrée par exemple peut être diverse : composée d'un ensemble de termes de recherche ou une question écrite en langage naturel.
D'autre part, le format de présentation du résultat est à rapprocher du type d'algorithme utilisé pour obtenir les résultats, c'est à dire de la manière de sélectionner et d'ordonner les résultats. Dans ce projet nous proposons de développer un moteur de recherche de contenus scientifiques qui offre la possibilité de faire des recherches basées sur un ensemble de termes de recherche et d'algorithmes de ranking basés sur des modèles statistiques.
Copyright © 2007 Elhuyar Fundazioa | Avis juridique | Plan du site | Erabiltzaile-kopurua: 856789
Diseinua: Blanco