Elhuyar Fundazioaren logoa

Elhuyar Fundazioa - Hizkuntza Zerbitzuak 

Itzuli orriaren hasierara

I+G unitatea

Lexiko- eta terminologia-erauzketa

AzerHitz 

Helburuak eta azalpen orokorra

Lexiko elebiduna erauzteko orain arte garatu diren teknikak lexikoa corpus paralelo edo itzulpen-memorietatik erauztera bideratuak izan dira gehien bat. Estrategia horrek ahuleziak ditu, ordea. Alde batetik, erauzketen iturburua aurrez eskuz itzulitako esaldiek osatzen dute, eta beraz, lortutako baliokidetzak itzulpen-prozesu baten ondorio dira.

Horrek hein bateko naturaltasunik eza ekar lezake. Bestalde, corpus paraleloak oso baliabide urriak dira, are urriagoa eremu urriko hizkuntzen kasuan. Horiek guztiak horrela eta, azkenaldian interes handia sortu da corpus konparagarrietan eta horiek ustiatzeko tekniketan.

Corpus konparagarri eleaniztunak gutxienez bi hizkuntzatan idatzitako testuez osatutako bildumak dira, eta, corpus paraleloetan ez bezala, direlako testuak ez dira elkarren itzulpenak, baina ezaugarri komun batzuk dituzte, hala nola, gaiak, argitaratze-datak, testu-generoa edo erregistroa, eta abar. Ezaugarri komun horien izaeraren arabera, era bateko edo besteko informazioa atera liteke corpus horietatik. Esaterako, testuak gai berekoak badira (esaterako, Medikuntza), arloko terminologia eleaniztuna atera liteke.

AzerHitz-en helburu nagusia da corpus konparagarrietatik lexiko elebidunak era erdiautomatikoan erauzteko teknikak ikertu eta garatzea. Erauzterm eta ELexBI proiektuetan egindako lana hartu da abiapuntutzat. Proiektu honen lehengaia eta lehengai hori ustiatzeko teknikak oso bestelakoak badira ere, badaude alderdi batzuk bi erauzketa-motetan berdinak direnak.

AzerHitz-en oinarrian dagoen ideia honakoa da: ”Hitz jakin baten inguruan agertzen diren hitzak antzekoak dira bi hizkuntzatan.” Hau da, hitz baten testuingurua antzekoa da bi hizkuntzatan. Antzekotasun honetaz baliatuz, hitzen itzulpenak bilatzen ditu AzerHitz-ek.

Proiektu honen bigarren helburua da corpus konparagarrien konparagarritasun-maila zehazteko neurriak diseinatzea. Beraz, hizkuntza bateko eta besteko dokumentuen bildumek zenbaterainoko antza duten neurtu badezakegu, erauzketak burutzeko egokiagoak diren corpus konparagarriak lortzeko gai izango gara.

Finantziazioa

Eusko Jaurlaritzako Industria, Turismo eta Merkataritza sailak Saiotek 2007 deialdian diruz lagundu du proiektua.

 

 

Itzuli orriaren hasierara

Zerbitzuak

Itzuli orriaren hasierara
Elhuyar Sinonimoen Kutxa. Sinonimo eta antonimoen hiztegia (3. edizioa)
18,50€Erosi
Energiaren hiztegi entziklopedikoa
Energiaren hiztegi entziklopedikoa
17,10€Erosi
Itzuli orriaren hasierara Itzuli orriaren hasierara

Copyright © 2007 Elhuyar Fundazioa | Lege-oharra | Web-mapa | Erabiltzaile-kopurua: 856789

webmaster@elhuyar.com

Diseinua: Blanco

Itzuli orriaren hasierara