2001
|
|
Gure herri hiru eleko honek itzulpengintzan garatuz doan iraultza horretatik at irautea barkaezina da zerikusidun guztiak gogoan: euskara normalizatu eta estandarizatu nahi dutenak, tresna bikaina dutelako corpusa koherenteago bihurtzeko; administrazio publikoak, herritarrei zor dietelako normalizazio araudi guztiek agintzen
|
duten
corpus elebidun kalitatezkoa; eta, zertan esanik ez, itzultzaileak eurak, iraultza lagungarria izan dakien, inor lanik gabe ez geratzeaz gain, areago ekoiztu eta irabazteko bidea dutelako automatizazioa. Eta jakina, herritarra bera ahaztu barik, hizkuntz kalitateari ez ezik, diruari ere begiratzen diolako:
|
2008
|
|
iturriak azaldu, testu idatziak eta ahozko transkripzioak. Bost irizpideotan oinarritzen dira fidagarri eta erakusgarri izan nahi
|
duten
corpusak, eta azken urteotan gorakada handia izan da, eskanerrak eta euskarri elektronikoan eskuratzeko erraztasunak lagunduta. Horrez gain, baliabide informatikoek lematizazioan eta etiketatzean laguntza handiak eskaintzen dituzte.
|
2012
|
|
Beste hainbat autorek (Laurin 1989, Blanche Benveniste 1990, Baque Millet,) berriz, enuntziatu parentetikoek aztergai duten hizkuntza jakinean zein toki hartzen duten aztertu eta sailkatu dituzte. Sailkapenak, oro har, autoreen, hizkuntza jakinaren, aztergai izan
|
duten
corpusaren nahiz egitura mota hau ezaugarritzeko erabili dituzten mugatze irizpideen araberakoak izango dira.
|
2013
|
|
Mende batzuetan behintzat, ez da horren zaila izango, delako, sistema de normas literarias, en sarrera zedarritzea. Arau horien hedapena, dibertsifikatzea, askotarikotzea arakatzeak, berriz, ez du joko gehiegirik eragingo idazlan profanoek osatzen
|
duten
corpus laburrarengatik; izan ere, dagoeneko adierazi den moduan, sortutako euskal produkzio literarioa bizirik iraun duena baino zabalagoa izanagatik, eskura geratu den dokumentazioa bakarrik da erreala, eta horren argitan, Lazarragak edo Etxeparek indarrean jarritako arau sistemek ez zuten ez hedapen, ez dibertsifikatze handirik izan. Ezta Oihenartenak ere.
|
2014
|
|
BASYQUE aplikazioaren garapenaz haratago, proiektu honen helburunagusia hizkeren (eta batez ere Iparraldeko hizkeren) azterketa eta prozesamenduabideratzeko azpiegiturak prestatzea, irizpideak finkatzea eta baliabideak sortzeada, Iparraldeko hizkeren ezaugarriak eta berezitasunak jasotzen dituen datu basesendo bat osatzeko eta, ondoren, informazio hori oinarri hartuta, aldaki dialektalentratamendu automatikoa bideratu ahal izateko. Izan ere, hizkuntza bariazioarenalorrak piztu duen interesa ikusita eta teknologia berrien garapenak HizkuntzarenAzterketa eta Prozesamenduaren (HAP) alorrean eskaintzen dizkigun abantailak etabitartekoak baliatuz, izaera dialektala
|
duten
corpusak (testu bildumak) aztertu etaautomatikoki tratatzeko tresnak garatzea gure hizkuntza komunitaterako ekarpeninteresgarria dela iruditzen zaigu. Beraz, artikulu honetan BASYQUE aplikazioarenezaugarriak eta aplikazioak eskaintzen dituen aukerak erakustera mugatuko garenarren, aplikazio hori helburu zabalagoak dituen proiektu handiago baten barruankokatzen dela esan beharra dugu.
|
2017
|
|
Izan ere, gaur egun, oraindik, tradiziozko mintzaira ugari dira gure herrian eta hizkera horiek ia aztertu gabe daude sintaxiaren ikuspuntutik. Ondorioz, Hizkuntzaren Azterketa eta Prozesamenduaren alorrean garatzen ditugun tresnek eskaintzen dizkiguten abantailak eta bitartekoak baliatuz, izaera dialektala
|
duten
corpusak maila sintaktikoan aztertu eta automatikoki tratatzeko baliabideak garatu nahi ditugu, baliabide horiek gure hizkuntza komunitaterako ekarpen interesgarriak egin ditzaketela uste dugulako.
|
|
Hala, gure xede nagusia HAPren alorrean garatutako tresnek eskaintzen dizkiguten abantailak eta bitartekoak baliatuz, izaera dialektala
|
duten
corpusak maila sintaktikoan aztertu eta automatikoki tratatzeko baliabideak garatzea da, gure hizkuntza komunitaterako ekarpen interesgarria dela aurreikusten baitugu, eta adierazpen hori baieztatzen duten bi baliabide aurkezten ditugu artikulu honetan: BASYQUE aplikazioa18 eta euskarazko corpus historikoaren arakatzaile sintaktikoa.
|
|
Nahiz eta buletina itzultzearen lana gero eta errutinatsuago egin, makina olioztaturik daukate –lege espainiarrari bereziki darion idazmolde korapilatsu eta nasai hori itzultzeko sortu dute, eta urre gorria bailitzan ordenagailuan gordetzen
|
duten
korpus hori–, hainbeste, astero itzuli behar dituzten buletinak goiz erdirako eginik, norberak bere gauzetarako erabiltzen ditu arratsaldeko hirurak arteko lau orduak. Berak, azken boladan, Andrew Motionen amaren heriotzari buruzko poemak itzultzeko, Muñoz Eugik Elgacenan argitaratzeko aginduak eta Miren Akerretaren Dolutan filmaren prentsarako aurkezpen fitxa.
|
2019
|
|
Euskararen eremura etorrita, esan du Euskaltzaindiak arauak zabaldu dituela, baina horien eraginaz ezer gutxi dakitela aitortu du. Sagarnaren ustez,, tresna bada, hiztegiek osatzen
|
duten
corpusa da tresna hori?. Aldaketak nondik nora joan diren ulertuz gero,, ondorioak errazago atera ahal izango dira?.
|
|
Irakasleei bidalitako zundatze baten bidez, haiek eraiki
|
duten
corpusaren itxuratze bat marraztu da.Ipar Euskal Herriko klaseetan lantzen diren autoreak, nagusiki maskulinoak eta hegoaldekoak direlaagertzen da. Bi faktore horiek eragina ukanen dute ikaslearen formakuntzan estereotipoak etaulermen arazoak sortuko eta bermatuko dituelako.
|
|
Denbora informazioa automatikoki tratatzeko sistemek informazio linguistikoa etiketatuta
|
duten
corpusak hartzendituzte oinarritzat. Hain zuzen ere, mota horretako corpusen bitartez tresna horiek entrenatu eta ebaluatu egitendira.
|
2020
|
|
Azterketa egiteko euskarazko ikus entzunezko hiru kazetaritza saio aukeratu dira; hauetako bi ETB1 telebista kateko Azpimarra eta Herri People programak dira, hirugarrena Gaztea irratiko irratsaioa dugu. Azken saio hau osatzen
|
duten
corpuseko lau transkripzioak Gabirondoren (2020) lanetik hartu dira egilearen baimenarekin.
|
2021
|
|
Eduki corpus kultural hori hainbat gaik edo diziplinek osatu dezakete, baina oinarri gisa har daitekeen iturrietako bat euskal literaturako obrek eskaintzen
|
duten
corpusa da MIR1 en aburuz. Hau da, euskal literaturak corpus linguistikoa, eta ez hizkuntza literarioari dagokionez, eskaintzen duen modura, liburuek osagai eta erreferentzia kultural ugari eskaintzen dituzte, bai nazioartekoak, bai euskal kulturari dagozkionak.
|
|
Atal honetan ikerketako parte hartzaileekin izandako solasaldietan adierazitakoek osatzen
|
duten
corpusa modu kualitatiboan aztertzeari ekingo diogu. Ezer baino lehen, atal honen hasieran gogora ekarri behar da corpusa lau metodologia kualitatibo desberdinen bidez focus groupak, sakoneko elkarrizketak, eztabaida taldeak eta inkestak norbanako desberdinek adierazitakoek osatzen dutela.
|