2009
|
|
Tamainak axola du: testu bilduma erraldoiak,
|
hizkuntzaren
prozesamenduan beharrezkoak
|
|
Hizkuntzaren prozesamendua ia ia ordenagailuen sorreratik existitzen da. Joan den mendeko 40ko hamarkadan sortutako lehen makina elektroniko programagarriak, Bigarren Mundu Gerra medio, batez ere mezuak deszifratu eta kodeak apurtzeko erabili ziren, baina, gerra amaitu ondoren,
|
hizkuntzaren
prozesamendua asko lantzen hasi zen, batez ere itzulpen automatikoaren arloan.
|
|
Hala, taldeetan hizkuntzalariak sartzen joan ziren, eta Saussure eta Chomskyren teoriak aplikatzen. Geroztik, eta hamarkada askotan zehar,
|
hizkuntzaren
prozesamenduko alor guztietan (morfologian, ortografia zuzenketan, sintaxian, adieren desanbiguazioan...) hurbiltze bat izan da nagusi: hizkuntzalarien intuizioan oinarritutako ezagutza ordenagailuek tratatu ahal izateko moduko egitura sinpleetara egokitzea (erregelak, zuhaitzak, grafoak, programazio lengoaiak...).
|
|
Azken bi hamarkadetan, baina, hurbiltze enpirikoago bat ari da nagusitzen
|
hizkuntzaren
prozesamenduan, testu bilduma handien ustiaketan eta metodo estatistikoetan oinarritua. Ezagutza intuitiboan oinarritu beharrean, hizkuntza lagin erreal handiak, hau da, corpusak, erabiltzen dira hizkuntzaren ahalik eta kasu gehien kontuan hartzeko.
|
|
Horregatik, metodo estatistikoak hobetzeko azken aldiko joera da teknika linguistikoekin konbinatzea, eta metodo hibridoak sortzea. Eta etorkizunean ere hori izango da bidea
|
hizkuntzaren
prozesamenduan aurrera egiteko. Makinek laster hizkuntza ulertu eta egoki trata dezaten nahi badugu, eta makinek hitz egitea nahi badugu, beharrezko izango da matematikariak, informatikariak eta hizkuntzalariak eskutik joatea.
|
|
Ildo horretan lan egiteko balio duen Sketch Engine (www.sketchengine.co.uk) tresnaren sortzailetako bat da. EHUko IXA taldeak antolatutako
|
hizkuntzaren
prozesamenduari buruzko SEPLN 2009 kongresuan izan zen, Donostian.
|
|
Behar beharrezkoa da adimen artifiziala erabiltzea
|
hizkuntzaren
prozesamenduan?
|
|
Ikasketa automatikoari esker, adibidez, patroiak bila daitezke, eta ezagutza eraiki ordenagailu bidez. Beraz,
|
hizkuntzaren
prozesamenduaren arazo nagusietako bati aurre egiteko modu bat da, alegia, hitz bakar batek esanahi bat baino gehiago dituen kasua ebazteko bide bat. Hori egin dezakegu corpus handiak erabiltzen baditugu.
|
|
EHUko IXA taldeko Kepa Sarasola, I aki Alegria eta Eneko Agirre informatikariekin izan gara. Hain zuzen ere, IXA taldeak aurtengo
|
hizkuntzaren
prozesamenduari buruzko SEPLN kongresua antolatu du Donostian, eta gai horretako aditu asko bildu ditu.
|
|
Zein dira, gaur egun,
|
hizkuntzaren
prozesamenduaren erronka nagusiak?
|
|
Proiektuaren atzean dagoen lana ezagutzen duenak, aldiz, oso balorazio ona egiten du. Asko dago egiteko
|
hizkuntzaren
prozesamenduaren arloan; ez dago zalantzarik. Baina eginda dagoena lan ikaragarria da, horren zalantzarik ere ez dago.
|
2012
|
|
Sirik hainbat teknologia erabiltzen ditu egiten duena egiteko: ahotsaren ezagutza,
|
hizkuntzaren
prozesamendua, ontologiak... Horien guztien konbinazioak ematen dio ahalmena agindu ezberdinak ulertzeko, baina, aldi berean, sentiberago egiten du akatsekiko.
|
2014
|
|
Informatika irakaslea naiz, eta Ixa Taldeko ikertzailea ere banaiz,
|
hizkuntzaren
prozesamenduan. Horretan nabil eta horretan eraman nahi dut denbora gehiena.
|
2018
|
|
Eta, mendian edo errepidean galtzean egiten dugun bezalaxe, makinek ere mapak erabiltzen dituzte hizkuntzen labirintoan aurrera egiteko. Embedding esaten zaie mapa horiei, eta, haien bidez, pentsaezinak ziruditen lurretan barneratu da
|
hizkuntzaren
prozesamendua. Goazen gu ere, pausoz pauso, bidaia hori egitera.
|
|
Gainera, bilatzaile horiek
|
hizkuntzaren
prozesamenduko teknologia erabiltzen dute. Aspaldian, gutxik ematen zioten garrantzia guk Ixa Taldean garatzen dugun teknologiari.
|