Emaitzak: 5
2015 | ||
Estrategia egokiena litzateke anotatutako corpus bat hartuta adibide positiboa eta negatiboak banatzea. Tamalez, ez dago euskaraz horrelako anotaziorik duen corpusik, eta erdibideko hurbilpen batera jobehar izan dugu, testu sub jektiboak eta objektiboak bereizita | dituen corpus bat baliatuz. Horrelako corpus bat eraikitzeko estrategia merke bat hartu dugu Berriako artiku bilduma batetik CBerria abiatuta: Iritzi artikuluak subjetibotzat hartu dira, eta gainerakoak objektibotzat (CBerria) (Saralegi et al., 2013). 2 Taulak corpus horren neurriak eta erauzketaren datuak azaltzen ditu. | |
Corpus ikerketan honetan sei hizkuntzetan oinarritu da eta hitz ordenaren arabera bi taldetan banatu dira: VO hizkuntzak (gaztelania, katalana, galegoa, ingelesa eta portugera) eta OV hizkuntzak (euskara, japoniera, koreera, turkiera eta armeniera). Polinskyren ikerketan euskara, gaztelania eta japoniera erabili arren, hizkuntza hauek erabiltzea erabaki da berak erabiltzen | dituen corpusak txikiak eta desorekatuak daudelako.Hemen erabilitakoan, ia hizkuntza guztietarako tamaina berako corpusa erabili izan da, 300.000 hitzezkoaalegia (1 taula). Corpus guztiek prentsako artikuluez osatuta daude eta kategoria lexikoen (Parts of Speech PoS) arabera etiketatuak. | |
– Denbora egiturak etiketatuta izango | dituen corpusaren osaketa | |
Artikulu honek alemanetik euskaratutako unitate fraseologikoen itzulpena izango du aztergai. Horiegin ahal izateko, 3,5 milioi hitz inguru | dituen corpus digitalizatu, lerrokatu eta eleanitza sortudugu, AleuskaPhraseo corpusa, alegia. Itzulpen moduak hau da, sorburu eta xede testuaren artekoharremanak berebiziko garrantzia dauka gure kasuan, itzulpen asko batez ere haur eta gazte literaturan (HGL) zeharka, zubi bertsio batetik abiatuta, egin izan direlako, eta egiten direlako. | |
2019 | ||
Euskarazko Iritzi Corpusa sortzeko erreferentziatzat SFU Review Corpus (Taboada, 2008) corpusa erabili dugu.Corpus hark dituen antzeko ezaugarriak | dituen corpusa eratu nahi izan dugu. Horrela, 240 iritzi testuko corpusbat sortu dugu eta iritziak sei gaien ingurukoak dira: |
Emaitza gehiago eskuratzen...
Loading...
Aldaerak
Lehen forma
dituen | 5 (0,03) |
Argitaratzailea
UEU | 5 (0,03) |
Konbinazioak (2 lema)
ukan corpus | 3 (0,02) |
Konbinazioak (3 lema)
ukan corpus bat | 1 (0,01) |
ukan corpus digitalizatu | 1 (0,01) |
ukan corpus eratu | 1 (0,01) |
Urtea
Bilaketarako laguntza: adibideak
Oinarrizko galderak | |
---|---|
katu | "katu" lema duten agerpen guztiak bilatu |
!katuaren | "katuaren" formaren agerpenak bilatu |
katu* | "katu" hasiera duten lema guztiak bilatzen ditu |
!katu* | "katu" hasiera duten forma guztiak bilatzen ditu |
*ganatu | "ganatu" bukaera duten lema guztiak bilatzen ditu |
!*ganatu | "ganatu" bukaera duten forma guztiak bilatzen ditu |
katu + handi | "katu" eta "handi" lemak jarraian bilatu |
katu + !handia | "katu" lema eta "handia" forma jarraian bilatu |
Distantziak | |
katu +3 handi | "katu" eta "handi" lemak 3 elementuetako distantzian bilatu |
katu +2 !handia | "katu" lema eta "handia" forma 2 elementuetako distantzian bilatu |
katu +2 !handi* | "katu" lema eta "handi"z hasten diren formak 2 elementuetako distantzian bilatu |
Formen konbinazioa desberdinak | |
bero + handi | asko | "bero" lema eta jarraian "handi" edo "asko" lemak bilatu |
bero +2 !handi* | !asko* | "bero" lema eta jarraian "handi"z edo "asko"z hasten diren formak |
!bero + handi|asko|gutxi|txiki | "bero" forma eta jarraian "handi", "asko", "gutxi", "txiki" lemak |
Ezaugarri morfologikoekin | |
proba + m:adj | "proba" lema eta jarraian adjketibo bat |
proba +2 m:adj | "proba" lema eta bi hitzetako distantziak adjektibo bat adjketibo bat |
bero + handi|asko + m:adi | "bero" lema jarraian "handi" edo "asko" eta jarraian aditz bat |
proba + m:izearr-erg | "proba" lema eta ergatibo kasuan dagoen izen arrunta |
Ezaugarri morfologikoak
KATEGORIA
adb | adberbioa |
---|---|
adi | aditza |
adilok | aditz-lokuzioa |
adj | adjektiboa |
det | determinatzailea |
ior | izenordaina |
izearr | izen arrunta |
izepib | pertsona-izena |
izelib | leku-izena |
izeizb | erakunde-izena |
lbt | laburtzapena |
lotjnt | juntagailua |
lotlok | lokailua |
esr | esaera |
esk | esklamazioa |
prt | partikula |
ono | onomatopeia |
tit | titulua |
KASUA
abs | absolutiboa |
---|---|
abl | ablatiboa |
ala | adlatiboa |
ban | banatzailea |
dat | datiboa |
des | destinatiboa |
erg | ergatiboa |
abz | hurbiltze-adlatiboa |
ine | inesiboa |
ins | instrumentala |
gel | leku-genitiboa |
mot | motibatiboa |
abu | muga-adlatiboa |
par | partitiboa |
psp | postposizioa |
pro | prolatiboa |
soz | soziatiboa |
MUGATASUNA/NUMEROA
mg | mugagabea |
---|---|
ms | mugatu singularra |
mp | mugatu plurala |
mph | mugatu plural hurbila |
ADITZ MOTA
da | da |
---|---|
du | du |
dio | dio |
zaio | zaio |
da-du | da-du |
du-zaio | du-zaio |
dio-zaio | dio-zaio |
da-zaio | da-zaio |
du-dio | du-dio |
da-zaio-du | da-zaio-du |
da-zaio-du-dio | da-zaio-du-dio |