2010
|
|
Aztertzeko zer erlazio dagoen
|
hitz
konbinazioaren (zeinetan neurtzen den haurrek zenbatean konbinatzen dituzten hitzak hiru aukeraren arabera: oraindik ez, batzuetan edo sarritan) eta generoaren artean, kontingentzia taulak erabili ziren, eta erlazioa esanguratsua izan zen, bai bertsio luzean(? 2= 6,14, a.g.= 2, p< 0,05) baita laburrean ere(? 2= 7,18, a.g.= 2, p< 0,05); kasu bietan neskatoek joera azaltzen dute hitzak gehiago konbinatzeko (ikusi 8 taula).
|
2013
|
|
Ikus dezakegunez, E. M. Azkuek ez du erabiltzen dontsutuaditza, are gutxiago errijac dontsutu
|
hitz
konbinazioa, ziur asko gaztelaniazko, hacer felices a los pueblos, klixearen kalkoa (Ilustrazioaren arabera, hori zen politikaren helburua).
|
2015
|
|
Hitz gakoak: Hizkuntzaren Prozesamendua, euskarazko
|
hitz
konbinazioak, gaztelaniazko hitzkonbinazioak, fraseologia, itzulpengintza
|
|
Gure ikerketa lanaren helburu nagusia
|
hitz
konbinazioak aztertu eta haien prozesamendu konputazionalerako oinarri linguistikoak jartzea da, hizkuntza aplikazio aurreratuetan arazo handiak sortzenbaitituzte. Horixe gertatzen da, adibidez, itzulpen automatikoan; izan ere, horrelako egiturak ondoitzultzea zaila bada hiztunontzat, are gehiago ordenagailu batentzat, hitzei ohiko ordainak ematenbaitizkie defektuz eta, hortaz, tratamendu berezirik egin ezean, itzulpen literal traketsak sortzen baititu.Hona, esaterako, Matxin2 itzultzaile automatikoaren bi emaitza:
|
|
Horrez gain, testuinguruak ere eragina izan dezake konbinaziobatzuen erabileran, testu alor batetik bestera duten agerpen maiztasuna aldakorra izaten baita. Hortaz, hitz segida bat
|
hitz
konbinaziotzat hartzen da, baldin eta konbinazioko osagaien informazioa ez badanahikoa konbinazio osoaren ezaugarri sintaktiko, distribuzional edo semantikoak jakiteko (Silberztein, 1990).
|
|
Sailkapenei dagokienez, berriz, irizpide bat baino gehiago erabili izan da konbinazioak multzokatzeko.Batzuek idiomatikotasuna hartu izan dute ardatz (Howarth, 1998); beste batzuek finkapen sintaktikoarieman diote garrantzia (Corpas Pastor, 2001); eta beste batzuek, berriz, konposizionaltasunaren araberamailakatu dituzte
|
hitz
konbinazioak (Sag et al., 2002).
|
|
Azken urteotan, euskaraz ere argitaratu da
|
hitz
konbinazioen tratamendu konputazionalaz diharduenlanik, eta, horien artean, aipagarriak dira bi doktoretza tesi: Urizarrena (2012) batetik, eta Gurrutxagarena (2014) bestetik.
|
|
Gure azterketakbi oinarri izan ditu orain arte: batetik, Elhuyar hiztegi elebidunetako
|
hitz
konbinazioak landu ditugu, eta, bestetik, konbinazio horiek corpus paralelo batean bilatu ditugu, testu errealetan zenbat eta nolaerabiltzen diren ikusteko.
|
|
Lan honetatik eratorritako emaitza guztiak eskuragarri daude sarean, eta edozein erabiltzailek duaukera aztertu ditugun
|
hitz
konbinazioen gainean bilaketak egiteko. Izan ere, hitz konbinazioak hainfenomeno linguistiko konplexua izanik, sortu dugun baliabidea erabilgarria izango delakoan gaude, Hizkuntzaren Prozesamenduan dabiltzanentzat ez ezik, baita bestelako hainbat erabiltzailerentzat ere, hizkuntzalariak, itzultzaileak eta euskara ikasleak tarteko.
|
|
Lan honetatik eratorritako emaitza guztiak eskuragarri daude sarean, eta edozein erabiltzailek duaukera aztertu ditugun hitz konbinazioen gainean bilaketak egiteko. Izan ere,
|
hitz
konbinazioak hainfenomeno linguistiko konplexua izanik, sortu dugun baliabidea erabilgarria izango delakoan gaude, Hizkuntzaren Prozesamenduan dabiltzanentzat ez ezik, baita bestelako hainbat erabiltzailerentzat ere, hizkuntzalariak, itzultzaileak eta euskara ikasleak tarteko.
|
|
Hiztegietatik lor daiteke
|
hitz
konbinazioek hizkuntza batetik bestera duten aldakortasunaren ingurukoikuspegi orokor bat, baina konbinazio horien erabilera erreala aztertu nahi bada, testu corpusetara jobeharra dago. Beraz, gure bigarren azterketan, lehen lehenik, hiztegitik erauzitako konbinazioak corpusparalelo batekin alderatu nahi izan ditugu.
|
|
Logikoena testu interferentziada, zeina sorburu testuko UFa hitzez hitz itzultzearen ondorioz gertatzen den. Beste kasu batzuetan, berriz, xede testuko
|
hitz
konbinazioa ez da ustezko sorburu testuaren eraginez sortu, beste hizkuntza edotestu bateko (oro har, gaztelania edo gaztelaniazko testua) UFaren eraginez baizik; hau da, alemanezko testutik itzuli arren, gertatzen da euskal xede testuetan aurkitutako hitz konbinazioak gaztelaniazkoUFen kopia zuzenak izatea. Kasu horiek interferentzia kognitibo gisa identifikatu ditugu.
|
|
Logikoena testu interferentziada, zeina sorburu testuko UFa hitzez hitz itzultzearen ondorioz gertatzen den. Beste kasu batzuetan, berriz, xede testuko hitz konbinazioa ez da ustezko sorburu testuaren eraginez sortu, beste hizkuntza edotestu bateko (oro har, gaztelania edo gaztelaniazko testua) UFaren eraginez baizik; hau da, alemanezko testutik itzuli arren, gertatzen da euskal xede testuetan aurkitutako
|
hitz
konbinazioak gaztelaniazkoUFen kopia zuzenak izatea. Kasu horiek interferentzia kognitibo gisa identifikatu ditugu.
|
|
Neurri handiago edo txikiagoan, idiomatikoak1 diren
|
hitz
konbinazioek osatzen dute hizkuntza batenunibertso fraseologikoa hala nola zur eta lur, lepoa egin, bostekoa luzatu, eta, euskararen kasuan, kalkofraseologikoen presentzia medio, kanpoko hizkuntzen interferentzia neurtzeko unitate interesgarriak izandaitezke.
|
2016
|
|
Hain zuzen ere, badaude
|
hitz
konbinazio batzuk hizkuntzen arau orokorretatik kanpo geratzen direnak, eta horien artean daude Unitate Fraseologikoak (Gurrutxaga, 2016). Corpasek (1997) eta Urizarrek (2011), besteak beste, hiru multzotan sailkatu dituzte:
|
|
batetik, gaztelaniazko edo ingelesezko UFak ezagutzea, eta, bestetik, euskarara ekartzea. Gaur egun, beti segidan eta ordena berean dauden
|
hitz
konbinazioak bakarrik detektatzen dira ondo; beraz, konbinazioko hitzak bereizten baditugu edo ordena aldatzen badiegu, hitz solteak balira bezala tratatzen dira, eta ez UF baten parte balira bezala (4 adibidea). Era berean, euskarazko esaldiak sortzeko ere informazioa falta da askotan, sarrera bakoitzari ordain bakarra ematen baitzaio Matxinen hiztegian.
|
|
Konbitzul datu base publikoa da, eta azterketa linguistiko batetik lortutako informazioa jasotzen du. Izenez eta aditzez osatutako
|
hitz
konbinazioen eta haien ordainen ezaugarriei buruzko datuak gordetzen ditu, oraingoz gaztelania euskara hizkuntza bikotean. Hiru iturritatik bildu dira azterketa horretako izen+ aditz konbinazioak:
|
|
Hiru adibideotan ageri den UFa despertar inters ez dago Matxinen hiztegian oraindik; beraz, gaur egun, ez du
|
hitz
konbinazio hori UFtzat tratatzen (4 irudia). Baina, Matxinen hiztegian egongo balitz ere, orain arte erabili izan duen metodoaren bidez, 6 adibidean bakarrik ezagutuko luke, esaldi horretan bakarrik agertzen baitira bi hitzak ordena berean eta tartean beste elementurik gabe.
|
2017
|
|
Horixe gertatzen da hizkuntzek bere bereak dituzten
|
hitz
konbinazio batzuekin, Unitate Fraseologikoekin (UF). Hiztunok inongo arazorik gabe erabiltzen ditugu ondo ezagutzen ditugun hizkuntzetan, baina osaera aldetik badituzte berezitasunak:
|
|
Hiztunok inongo arazorik gabe erabiltzen ditugu ondo ezagutzen ditugun hizkuntzetan, baina osaera aldetik badituzte berezitasunak: batzuetan, esanahia ez da barruko hitzen esanahien batura izaten (hanka sartu); beste batzuetan, ez dituzte
|
hitz
konbinazio arrunten ezaugarri morfosintaktikoberberak (lo egin, eta ez* loa egin); eta, beste askotan, hitz batekin beste hitz jakin batzuk bakarrikerabiltzen ditugu, nahiz eta esanahi bera adieraz lezaketen beste hainbat ezagutu (ondorioak atera, etaez ondorioak egin/ erauzi...).
|
|
UFak fenomeno arazotsua dira Hizkuntzaren Prozesamendurako; hitz batez baino gehiagoz osatuta daude, baina ez dira beti konposizionalak esanahiari dagokionez eta, hortaz,
|
hitz
konbinazio osoa hartu behar dakontuan hizkuntza tresna aurreratuek ondo prozesa ditzaten (Sag et al., 2002). Halako hitz konbinazioaktestuetan identifikatze hutsa nahiko lan nekeza izaten da, askotan ezaugarri morfosintaktiko malguakizaten dituztelako eta, ondorioz, ez delako nahikoa hiztegietan begiratu eta hitz batez baino gehiagozosatutako sarrerak testuetan hitz segida finkoak balira bezala bilatzea.
|
|
Hala ere, zabalegi jokatzea ere ez da komenigarria, posible baita UF ez diren
|
hitz
konbinazio askoUFtzat hartzea. Adibidez, esaldian UFko izena eta aditza agertzen ote diren bakarrik begiratuta, sistemakez luke bereiziko 8 adibideko bi esaldien arteko aldea.
|
2018
|
|
2 irudia. Embeddingen ikasketa, zenbaketa bidez. Testu luze bat hartuta,
|
hitz
konbinazio bakoitza batera zenbat esalditan agertzen den kontatzen da taula batean. Errenkada bakoitzeko zenbaki zerrendak dagokion hitzaren koordenatuak ematen ditu.
|
2019
|
|
UF baten lemak corpusean elkarrekin agertzen direnean, corpuseko
|
hitz
konbinazio hori agerpen idiomatikotzat (AI) jotzen da, baldin eta (1) lemen arteko erlazio sintaktikoa bat badator jatorrizko UFaren egitura sintaktikoarekin6, eta (2) esanahi idiomatikoa badu. Esate baterako, adarra jo hitz konbinazioa aintzat hartuta etajatorrizko UFan adar izena jo aditzaren objektu zuzena dela jakinik, 11 adibideko agerpena idiomatikoa litzateke:
|
|
UF baten lemak corpusean elkarrekin agertzen direnean, corpuseko hitz konbinazio hori agerpen idiomatikotzat (AI) jotzen da, baldin eta (1) lemen arteko erlazio sintaktikoa bat badator jatorrizko UFaren egitura sintaktikoarekin6, eta (2) esanahi idiomatikoa badu. Esate baterako, adarra jo
|
hitz
konbinazioa aintzat hartuta etajatorrizko UFan adar izena jo aditzaren objektu zuzena dela jakinik, 11 adibideko agerpena idiomatikoa litzateke:
|
|
Aldiz, corpuseko
|
hitz
konbinazio bat UF baten agerpen literaltzat (AL) jotzen dugu lemen arteko erlazioa batbadator jatorrizko UFko lemen artekoarekin baina agerpenaren esanahia idiomatikoa ez bada. Aurreko adibideberberarekin jarraituz, honako hauek adarra jo UFaren agerpen literalak lirateke:
|
|
Azkenik,
|
hitz
konbinazio bati kointzidentziazko agerpen (KA) deritzogu, baldin eta lemen arteko erlaziosintaktikoa desberdina bada jatorrizko UFaren egitura sintaktikoaren aldean. Adibidez, irudiko (b) eta (d) esaldiekarrastoa utzi UFaren kointzidentziazko agerpen bana biltzen dute, eta beste honek, berriz, adarra jo UFaren bat:
|
|
Hori gertatzen da, esate baterako, ondorengo adibideetan. Aurre egin UFa kontuan hartuta, aurre eta egin lemak bilatu dira, eta hautagaitzat erauzidira 16 eta 17 adibideetako
|
hitz
konbinazioak.
|
|
Agerpen idiomatikoen eta literalen arteko bereizketak sekulakogarrantzia du HPn, bereizketa horren araberakoa baita tresna automatiko askoren kalitatea. Euskaraz ere egin dalanik fraseologia konputazionalaren arloan, dela corpusetatik UFak erauzi eta hiztegietan sartzeari begira (Gurrutxaga et al., 2014), dela analisi sintaktikoetan halako
|
hitz
konbinazioak nola tratatu erabakitzeko (Urizar, 2012). Bigarren ataza horretan bereziki, UFak beren agerpen literaletatik bereiztean datza gakoa, bai eta itzulpengintzaautomatikoan ere, hala erabakitzen baita hitz konbinazio jakin bati ordain idiomatikoa ala literala eman (Inurrietaetal., 2017).
|
|
Agerpen idiomatikoen eta literalen arteko bereizketak sekulakogarrantzia du HPn, bereizketa horren araberakoa baita tresna automatiko askoren kalitatea. ...skaraz ere egin dalanik fraseologia konputazionalaren arloan, dela corpusetatik UFak erauzi eta hiztegietan sartzeari begira (Gurrutxaga et al., 2014), dela analisi sintaktikoetan halako hitz konbinazioak nola tratatu erabakitzeko (Urizar, 2012). Bigarren ataza horretan bereziki, UFak beren agerpen literaletatik bereiztean datza gakoa, bai eta itzulpengintzaautomatikoan ere, hala erabakitzen baita
|
hitz
konbinazio jakin bati ordain idiomatikoa ala literala eman (Inurrietaetal., 2017).
|
|
Lehen biadibideetan (7) aditza da buru sintaktikoa, eta azkenekoan, ordea, ez. Hala ere, kontuan hartu behar da UFenforma kanonikoan pentsatu behar dela
|
hitz
konbinazio jakin bat UFa den ala ez erabakitzeko, zenbaitetan posiblebaita UFetako osagaien erlazio sintaktikoa aldagarria izatea erlatibozko perpausetan (9 adibidea) eta halakoetan. Hau diote forma kanonikoei buruz PARSEMEren gidalerroetan: –Aditz UF baten forma kanonikoa aditz sintagmabat da, zeina boz aktiboan baitago, buru sintaktikotzat aditza baitu eta gainerako osagai lexikalizatuak aditzarenmende edo beste osagai lexikalizaturen baten mende baitaude.?
|
|
Hori aintzat harturik, 9 adibideko konbinazioa forma kanonikora ekarrita, pausoak eman zituen litzateke, etabeteko luke burutzat aditza izateko baldintza. Ez da gauza bera gertatzen, ordea, 4.eko hitz elkartuarekin, adibidehorretan
|
hitz
konbinazioa forma kanonikoan baitago dagoeneko, izena buru duelarik: ez da izen eman, baizik etaizen emate.
|
|
Heuristiko horien atzean dagoen ideia zera da: UF batenbarruko lemak corpusean elkarrekin agertu badira baina ez badira UFtzat etiketatu, baliteke
|
hitz
konbinazio jakinhori jatorrizko UFaren agerpen literal bat izatea.
|
|
Unitate Fraseologiko (UF) deritze nolabait idiomatikoak diren
|
hitz
konbinazioei, hau da, hitz batez baino gehiagozosaturik egon arren erabat konposizionalak ez direnei (Baldwin eta Kim, 2010). Halako hitz konbinazioak idiomatikoki nahiz literalki uler daitezke askotan, eta testuinguruaren arabera argitu ohi da esanahi batez ala besteazari garen.
|
|
Unitate Fraseologiko (UF) deritze nolabait idiomatikoak diren hitz konbinazioei, hau da, hitz batez baino gehiagozosaturik egon arren erabat konposizionalak ez direnei (Baldwin eta Kim, 2010). Halako
|
hitz
konbinazioak idiomatikoki nahiz literalki uler daitezke askotan, eta testuinguruaren arabera argitu ohi da esanahi batez ala besteazari garen. Esate baterako, ziri eta sartu hitzak idiomatikoki erabilita daude 1 adibidean, baina literalki 2.ean1.
|
2020
|
|
Egoera berrira egokitutakoa. Auskalo zenbatetan erabiliko dugun
|
hitz
konbinazio hori. Egoera berrira egokitutako aurkezpena, agerraldia, zine saioa...
|
2022
|
|
—Zilegi al da horrelako
|
hitz
konbinazioak sistematikoki egitea?
|