Emaitzak: 7
2014 | ||
Ahotsak proiektuaren helburua bilketa eta katalogazioa da, eta hasieratik ikusidugu gure gaitasunetik gora | dagoela Corpus erraldoi hori behar bezala landu etalematizatzea. Corpusaren jatorria ezagututa (ahozko ekoizpena, estandarretik urruti, hiztun nagusien ahotan, ahozkoaren aje guztiekin...), jakin bagenekien horrelakolan batek zailtasun tekniko handiak izango zituela, gaur egun ez baitago ia ia lanautomatikorik egiterik horrelako materialarekin. | |
Ikerketa lan hau1 2 Hizkuntzaren Prozesamenduaren alorrean kokatzen da (hemendikaurrera HP), Euskal Herriko Unibertsitateko Informatika Fakultateko IXA Taldearen3jardunaren barruan eta zehazki, baliabideak sortzeko atalean. Azkenaldian hainmodan | dagoen corpus based edo corpus driven linguistic delakoaren barnean sartzenda bete betean eta zehatzago, corpusetan oinarritutako lexikografian (Hanks, 2012). | |
2017 | ||
Euskal TimeBank da gaur egun euskararako denbora informazioarekin anotatuta | dagoen corpus bakarraeta horregatik erabili dugu bEVENT garatzeko. Euskal TimeBank eraikitzeko MEANTIME corpusaren (Minard et al., 2016) euskarazko bertsiotik hartutako 30 dokumentu ISO TimeML gidalerroen egokitzapenaren arabera anotatu ziren. | |
2019 | ||
Demagun arrastoa utzi UFa etiketatuta dagoela corpusean, eta arrasto izena utzi aditzaren objektutzat agertzendela etiketa horretan. Demagun, era berean, 1 irudiko lau esaldiak ere | badaudela corpusean, baina arrasto eta utzilemak ez daudela UFtzat etiketatuta. Heuristikoek esaldiz esaldi begiratuko lukete ea lema horiek baldintza jakinbatzuk betetzen dituzten, eta hala erabakiko lukete hautagaiak erauzi ala ez. | |
Aintzat harturik PARSEMEren irizpideekin bat datozen agerpen idiomatikoak etiketatuta | daudela corpusean, heuristikoek erauzitako hautagaiak kointzidentziazkoak ala literalak ziren esan dute etiketatzaileek7 Horrez gain, agerpen literalak hiru azpimultzotan sailkatu dituzte, agerpen idiomatikoetatik bereizteko kontuan hartu beharrekoinformazioaren arabera. | |
Demagun arrastoa utzi UFa etiketatuta | dagoela corpusean, eta arrasto izena utzi aditzaren objektutzat agertzendela etiketa horretan. Demagun, era berean, 1 irudiko lau esaldiak ere badaudela corpusean, baina arrasto eta utzilemak ez daudela UFtzat etiketatuta. | |
Ondoren, bi sareen parametroak doitzeko erabilitako algoritmo iteratiboa aurkeztuko dugu. Jarraitzeko, euskaraz | dagoen corpusa nola aurreprozesatudugun deskribatuko dugu. Azkenik, burututako saiakuntzak eta lortutako emaitzak erakutsi eta aztertuko ditugu. |
Emaitza gehiago eskuratzen...
Loading...
Aldaerak
egon | 7 (0,05) |
Lehen forma
Argitaratzailea
UEU | 7 (0,05) |
Konbinazioak (2 lema)
egon corpus | 6 (0,04) |
egon Corpus | 1 (0,01) |
Konbinazioak (3 lema)
egon Corpus erraldoi | 1 (0,01) |
egon corpus nola | 1 (0,01) |
Urtea
Bilaketarako laguntza: adibideak
Oinarrizko galderak | |
---|---|
katu | "katu" lema duten agerpen guztiak bilatu |
!katuaren | "katuaren" formaren agerpenak bilatu |
katu* | "katu" hasiera duten lema guztiak bilatzen ditu |
!katu* | "katu" hasiera duten forma guztiak bilatzen ditu |
*ganatu | "ganatu" bukaera duten lema guztiak bilatzen ditu |
!*ganatu | "ganatu" bukaera duten forma guztiak bilatzen ditu |
katu + handi | "katu" eta "handi" lemak jarraian bilatu |
katu + !handia | "katu" lema eta "handia" forma jarraian bilatu |
Distantziak | |
katu +3 handi | "katu" eta "handi" lemak 3 elementuetako distantzian bilatu |
katu +2 !handia | "katu" lema eta "handia" forma 2 elementuetako distantzian bilatu |
katu +2 !handi* | "katu" lema eta "handi"z hasten diren formak 2 elementuetako distantzian bilatu |
Formen konbinazioa desberdinak | |
bero + handi | asko | "bero" lema eta jarraian "handi" edo "asko" lemak bilatu |
bero +2 !handi* | !asko* | "bero" lema eta jarraian "handi"z edo "asko"z hasten diren formak |
!bero + handi|asko|gutxi|txiki | "bero" forma eta jarraian "handi", "asko", "gutxi", "txiki" lemak |
Ezaugarri morfologikoekin | |
proba + m:adj | "proba" lema eta jarraian adjketibo bat |
proba +2 m:adj | "proba" lema eta bi hitzetako distantziak adjektibo bat adjketibo bat |
bero + handi|asko + m:adi | "bero" lema jarraian "handi" edo "asko" eta jarraian aditz bat |
proba + m:izearr-erg | "proba" lema eta ergatibo kasuan dagoen izen arrunta |
Ezaugarri morfologikoak
KATEGORIA
adb | adberbioa |
---|---|
adi | aditza |
adilok | aditz-lokuzioa |
adj | adjektiboa |
det | determinatzailea |
ior | izenordaina |
izearr | izen arrunta |
izepib | pertsona-izena |
izelib | leku-izena |
izeizb | erakunde-izena |
lbt | laburtzapena |
lotjnt | juntagailua |
lotlok | lokailua |
esr | esaera |
esk | esklamazioa |
prt | partikula |
ono | onomatopeia |
tit | titulua |
KASUA
abs | absolutiboa |
---|---|
abl | ablatiboa |
ala | adlatiboa |
ban | banatzailea |
dat | datiboa |
des | destinatiboa |
erg | ergatiboa |
abz | hurbiltze-adlatiboa |
ine | inesiboa |
ins | instrumentala |
gel | leku-genitiboa |
mot | motibatiboa |
abu | muga-adlatiboa |
par | partitiboa |
psp | postposizioa |
pro | prolatiboa |
soz | soziatiboa |
MUGATASUNA/NUMEROA
mg | mugagabea |
---|---|
ms | mugatu singularra |
mp | mugatu plurala |
mph | mugatu plural hurbila |
ADITZ MOTA
da | da |
---|---|
du | du |
dio | dio |
zaio | zaio |
da-du | da-du |
du-zaio | du-zaio |
dio-zaio | dio-zaio |
da-zaio | da-zaio |
du-dio | du-dio |
da-zaio-du | da-zaio-du |
da-zaio-du-dio | da-zaio-du-dio |