Elhuyar Fundazioaren logoa

Elhuyar Fundazioa - Servicios Lingüísticos 

Volver al inicio de la página

Unidad de I+D

Recuperación y extracción de información (IR-IE)

EusBila 

Objetivos y descripción general

Dos son los principales problemas con los que se encuentran los buscadores de internet al trabajar con el euskera: por una parte, solo pueden buscar una forma determinada, y no todas las formas de una palabra o lema a la vez —por ejemplo, si pedimos que busquen 'lur', nos interesa que aparezcan también 'lurra', 'lurrarekin', 'lurrean'...—; por otra, puede darse el caso (se da, de hecho) de que los buscadores nos localicen términos que no están en euskera, si existe otro idéntico en otra lengua.

Es lo que sucede con algunos términos técnicos ('software', 'anorexia', 'sulfuroso'...), nombre propios (Egipto, Newton...), y palabras cortas ('katu', 'esne'...). Técnicamente, es posible crear un buscador integral de internet que solucione dichos problemas, pero exigiría una gran infraestructura. En lugar de los citados buscadores, se utilizan los API o interfaces que ofrecen los buscadores de Internet en el proyecto EusBila. La utilización de diversas técnicas de procesamiento del lenguaje natural hace que los resultados mejoren notablemente.

Para mostrar una forma determinada y todas las opciones posibles que se derivan de su lema, se utiliza la herramienta de generación morfológica creada por el Grupo IXA (Universidad del País Vasco). De esta manera, mediante el operador OR, se piden todas las formas posibles al API. Si el usuario pregunta, por ejemplo, por la palabra 'etxe', el buscador mostrará lo siguiente: etxe OR etxea OR etxeak OR etxeari OR... Obviamente, los buscadores no admiten todas las opciones que se deseen, y, por tanto, no muestran todas las declicaciones, aunque sí las suficientes para obtener resultados significativos. Para obtener resultados solo en euskera, se utilizan palabras filtro. Las palabras que más se utilizan en euskera son las que se emplean como filtro, conectadas mediante un AND.

En el proyecto EusBila se ha hecho, además, un tratamiento de variantes y estandares, utilizando para ello la base datos lexical EDBL, del Grupo IXA. Si se detecta que la palabra solicitada presenta variantes, además de realizar la búsqueda se proponen variantes al usuario, o, si la palabra solicitada es una variante, la forma estándar. Se utiliza el mismo procedimiento con los sufijos de declinación. Además, en el caso de palabras que no se conocen, se comprueba si se puede llegar a una palabra estándar utilizando reglas fonológicas. En caso afirmativo, se propone también dicha palabra.

Difusión:
Volver al inicio de la página

Servicios

Volver al inicio de la página
Euskal hiztegi modernoa
36,10€Comprar
Elhuyar hiztegia. Euskara/Gaztelania - Castellano/Vasco
Elhuyar hiztegia. Euskara/Gaztelania - Castellano/Vasco
43,70€Comprar
Volver al inicio de la página Volver al inicio de la página

Copyright © 2007 Elhuyar Fundazioa | Aviso legal | Mapa web | Erabiltzaile-kopurua: 856789

webmaster@elhuyar.com

Diseinua: Blanco

Volver al inicio de la página