El objetivo principal de este proyecto es el desarrollo de un sistema de búsqueda translingüe (CLIR) para la consulta de colecciones de textos multilingües, orientado a un escenario web. Se probarán e implementarán diferentes modelos de representación de documentos y algoritmos de ranking.
Además, se probarán e implementarán también técnicas para normalizar la representación de la pregunta en todas las lenguas. Las traducciones se llevarán a cabo mediante técnicas basadas en diccionarios. Se probarán e implementarán diferentes técnicas para solucionar los problemas que surgen en este tipo de proceso de traducción tales como la ambigüedad y la cobertura del diccionario. También se investigará e implementará el modo de fusionar correctamente los diferentes ranking obtenidos de diferentes colecciones .
En un sistema de recuperación de información translingüe se pueden consultar grandes colecciones de documentos plurilingües formulando la consulta de entrada en una única lengua. En cualquier caso, tanto la estructura de la consulta de entrada tanto la representación del resultado pueden ser muy variados. La consulta de entrada por ejemplo, puede ser desde un conjunto de términos de búsqueda hasta una pregunta escrita en lenguaje natural.
Por otro lado, el formato de presentación del resultado está relacionado con la clase de algoritmo que se utiliza para obtener los resultados, es decir, con el modo de seleccionar y ordenar los resultados. En este proyecto se propone desarrollar un buscador de contenido científico que ofrece hacer consultas basadas en conjuntos de términos de búsqueda y algoritmos de ranking basados en modelos estadísticos.
Copyright © 2007 Elhuyar Fundazioa | Aviso legal | Mapa web | Erabiltzaile-kopurua: 856789
Diseinua: Blanco