Emaitzak: 2
2015 | ||
Honegatik guztiagatik, ondoriozta dezakegu gure hasierako hipotesia egiaztatu dela, hau da, Web as Corpus planteamenduak euskararen corpusen egoeran aldaketa ekar zezakeela, etaaldaketa hori | etorri etorri dela hemen deskribatzen den lanarekin. Beste hizkuntza handiagoenegoerarekin ezin dezakegu konparatu euskararena, baina metodologia eta tresna batzuk garatuditugu dagoena biltzeko eta asko bildu da, euskarazko corpusen kantitatea eta tamaina moduesanguratsuan handituz. | |
2019 | ||
Hitzen errepresentazio distribuzionalak, hitzen esanahia gordetzen duten zenbakiz osatutako bektoreak dira, eta generoa, numeroa, eta beste hainbat ezaugarri biltzen dituzte. 2 irudian ikus dezakegunez, antzeko hitzak espazio bereanmultzokatzen dira, eta animalia eta hauen hotsen arteko erlazioak (txakur zaunka, asto arrantza), eta aditz formaezberdinenak( | etorri etortzen, ikasi ikasten) biltzeko gai dira. Horiek, 160 miloi hitzeko corpuseko (Wikipedia+ Elhuyar Web Corpus) hitzen testuinguruan agertzen diren hitzetatik ikasi dira, eta 50 dimentsiotako zenbakizkobektoreetan kodetu, word2vec1 tresnarekin. |
Emaitza gehiago eskuratzen...
Loading...
Aldaerak
etorri | 2 (0,01) |
Lehen forma
etorri | 2 (0,01) |
Argitaratzailea
UEU | 2 (0,01) |
Konbinazioak (2 lema)
etorri etorri | 2 (0,01) |
Konbinazioak (3 lema)
Urtea
Bilaketarako laguntza: adibideak
Oinarrizko galderak | |
---|---|
katu | "katu" lema duten agerpen guztiak bilatu |
!katuaren | "katuaren" formaren agerpenak bilatu |
katu* | "katu" hasiera duten lema guztiak bilatzen ditu |
!katu* | "katu" hasiera duten forma guztiak bilatzen ditu |
*ganatu | "ganatu" bukaera duten lema guztiak bilatzen ditu |
!*ganatu | "ganatu" bukaera duten forma guztiak bilatzen ditu |
katu + handi | "katu" eta "handi" lemak jarraian bilatu |
katu + !handia | "katu" lema eta "handia" forma jarraian bilatu |
Distantziak | |
katu +3 handi | "katu" eta "handi" lemak 3 elementuetako distantzian bilatu |
katu +2 !handia | "katu" lema eta "handia" forma 2 elementuetako distantzian bilatu |
katu +2 !handi* | "katu" lema eta "handi"z hasten diren formak 2 elementuetako distantzian bilatu |
Formen konbinazioa desberdinak | |
bero + handi | asko | "bero" lema eta jarraian "handi" edo "asko" lemak bilatu |
bero +2 !handi* | !asko* | "bero" lema eta jarraian "handi"z edo "asko"z hasten diren formak |
!bero + handi|asko|gutxi|txiki | "bero" forma eta jarraian "handi", "asko", "gutxi", "txiki" lemak |
Ezaugarri morfologikoekin | |
proba + m:adj | "proba" lema eta jarraian adjketibo bat |
proba +2 m:adj | "proba" lema eta bi hitzetako distantziak adjektibo bat adjketibo bat |
bero + handi|asko + m:adi | "bero" lema jarraian "handi" edo "asko" eta jarraian aditz bat |
proba + m:izearr-erg | "proba" lema eta ergatibo kasuan dagoen izen arrunta |
Ezaugarri morfologikoak
KATEGORIA
adb | adberbioa |
---|---|
adi | aditza |
adilok | aditz-lokuzioa |
adj | adjektiboa |
det | determinatzailea |
ior | izenordaina |
izearr | izen arrunta |
izepib | pertsona-izena |
izelib | leku-izena |
izeizb | erakunde-izena |
lbt | laburtzapena |
lotjnt | juntagailua |
lotlok | lokailua |
esr | esaera |
esk | esklamazioa |
prt | partikula |
ono | onomatopeia |
tit | titulua |
KASUA
abs | absolutiboa |
---|---|
abl | ablatiboa |
ala | adlatiboa |
ban | banatzailea |
dat | datiboa |
des | destinatiboa |
erg | ergatiboa |
abz | hurbiltze-adlatiboa |
ine | inesiboa |
ins | instrumentala |
gel | leku-genitiboa |
mot | motibatiboa |
abu | muga-adlatiboa |
par | partitiboa |
psp | postposizioa |
pro | prolatiboa |
soz | soziatiboa |
MUGATASUNA/NUMEROA
mg | mugagabea |
---|---|
ms | mugatu singularra |
mp | mugatu plurala |
mph | mugatu plural hurbila |
ADITZ MOTA
da | da |
---|---|
du | du |
dio | dio |
zaio | zaio |
da-du | da-du |
du-zaio | du-zaio |
dio-zaio | dio-zaio |
da-zaio | da-zaio |
du-dio | du-dio |
da-zaio-du | da-zaio-du |
da-zaio-du-dio | da-zaio-du-dio |