Emaitzak: 3
2008 | ||
Euskarazko testuetan hitz osoak bilatzea ez da bide oso zehatza, sarritan hitzetan atzizkiak azaltzen baitira; eta hitz hasierak bakarrik bilatzen baditugu, horrelaxe hasten diren beste hitz luzeagoei dagozkien emaitzak ere azalduko zaizkigu, emaitzen kalitatea zapuztuz. Adibidez, ero hitza duten dokumentuak bilatu nahi baditugu, eroari, eroekin, eroengana | hitzak dituzten dokumentuak ere detektatu nahi ditugu; konponketa bat litzateke" ero" letrekin hasten diren hitz guztiak detektatzea (ero* bilatzea), baina horrelakoetan erosotasun, erosi, erosten, eroale... hitzen aipamenak dituzten dokumentuak ere jasoko ditugu, eta horrelakorik ez dugu nahi, azken horien erreferentziak agertzen badira, benetan bilatzen ditugunekin nahastatuta agertuko direl... Beraz, ahal dela, lematizazioan oinarritutako bilaketak egin ditugu euskarazko dokumentuak atzitzeko. | |
2010 | ||
Weba sortu zenean bilatzaileak oso sinpleak ziren. Emandako hitza edo | hitzak zituzten dokumentuak bilatzen zituzten; gero irizpide orokor batzuen arabera ordenatu, eta kito. Baina arazo ugari zituzten: | |
Hainbat kasutan, galdera baten erantzun zehatzaren bila jotzen dugu Internetera. Bilatzaile arrunt bati galdera eginez gero, galderako | hitzak dituzten dokumentuen zerrenda itzuliko digu; baina badaude galderei erantzuteko gai diren sistemak ere. Batzuek testuak eta informazio bilaketako eta hizkuntza teknologietako teknikak darabiltzate, hala nola MIT eko START sistemak (http://start.csail.mit.edu/) edo IXA Taldeak garatutako Ihardetsi, euskarazko galderei erantzuten diena. |
Emaitza gehiago eskuratzen...
Loading...
Aldaerak
hitz | 3 (0,02) |
Lehen forma
hitzak | 3 (0,02) |
Argitaratzailea
Elhuyar Zientzia eta Teknologia | 2 (0,01) |
Bat Soziolinguistika Aldizkaria | 1 (0,01) |
Konbinazioak (2 lema)
hitz ukan | 3 (0,02) |
Konbinazioak (3 lema)
hitz ukan dokumentu | 3 (0,02) |
Urtea
Bilaketarako laguntza: adibideak
Oinarrizko galderak | |
---|---|
katu | "katu" lema duten agerpen guztiak bilatu |
!katuaren | "katuaren" formaren agerpenak bilatu |
katu* | "katu" hasiera duten lema guztiak bilatzen ditu |
!katu* | "katu" hasiera duten forma guztiak bilatzen ditu |
*ganatu | "ganatu" bukaera duten lema guztiak bilatzen ditu |
!*ganatu | "ganatu" bukaera duten forma guztiak bilatzen ditu |
katu + handi | "katu" eta "handi" lemak jarraian bilatu |
katu + !handia | "katu" lema eta "handia" forma jarraian bilatu |
Distantziak | |
katu +3 handi | "katu" eta "handi" lemak 3 elementuetako distantzian bilatu |
katu +2 !handia | "katu" lema eta "handia" forma 2 elementuetako distantzian bilatu |
katu +2 !handi* | "katu" lema eta "handi"z hasten diren formak 2 elementuetako distantzian bilatu |
Formen konbinazioa desberdinak | |
bero + handi | asko | "bero" lema eta jarraian "handi" edo "asko" lemak bilatu |
bero +2 !handi* | !asko* | "bero" lema eta jarraian "handi"z edo "asko"z hasten diren formak |
!bero + handi|asko|gutxi|txiki | "bero" forma eta jarraian "handi", "asko", "gutxi", "txiki" lemak |
Ezaugarri morfologikoekin | |
proba + m:adj | "proba" lema eta jarraian adjketibo bat |
proba +2 m:adj | "proba" lema eta bi hitzetako distantziak adjektibo bat adjketibo bat |
bero + handi|asko + m:adi | "bero" lema jarraian "handi" edo "asko" eta jarraian aditz bat |
proba + m:izearr-erg | "proba" lema eta ergatibo kasuan dagoen izen arrunta |
Ezaugarri morfologikoak
KATEGORIA
adb | adberbioa |
---|---|
adi | aditza |
adilok | aditz-lokuzioa |
adj | adjektiboa |
det | determinatzailea |
ior | izenordaina |
izearr | izen arrunta |
izepib | pertsona-izena |
izelib | leku-izena |
izeizb | erakunde-izena |
lbt | laburtzapena |
lotjnt | juntagailua |
lotlok | lokailua |
esr | esaera |
esk | esklamazioa |
prt | partikula |
ono | onomatopeia |
tit | titulua |
KASUA
abs | absolutiboa |
---|---|
abl | ablatiboa |
ala | adlatiboa |
ban | banatzailea |
dat | datiboa |
des | destinatiboa |
erg | ergatiboa |
abz | hurbiltze-adlatiboa |
ine | inesiboa |
ins | instrumentala |
gel | leku-genitiboa |
mot | motibatiboa |
abu | muga-adlatiboa |
par | partitiboa |
psp | postposizioa |
pro | prolatiboa |
soz | soziatiboa |
MUGATASUNA/NUMEROA
mg | mugagabea |
---|---|
ms | mugatu singularra |
mp | mugatu plurala |
mph | mugatu plural hurbila |
ADITZ MOTA
da | da |
---|---|
du | du |
dio | dio |
zaio | zaio |
da-du | da-du |
du-zaio | du-zaio |
dio-zaio | dio-zaio |
da-zaio | da-zaio |
du-dio | du-dio |
da-zaio-du | da-zaio-du |
da-zaio-du-dio | da-zaio-du-dio |