Bilaketa
dist.
non
lema/forma
nola
bilaketa
kategoria
Iragazkiak

Emaitzak: 23

2005
‎Euskarak amaraunean duen corpusik handienaren zuzendari ere bada Ibon Sarasola: Ereduzko Prosa Gaur
2007
‎Era berean, arkitektura juridiko egoki eta dinamikoa behar dela azaldu du. " Gaur egun administrazioaren euskalduntzea arautzen duen corpus juridikoak hutsune nabarmenak ditu funtsezkoak diren gaietan".
2008
‎Corpus tipologiari begiratzen badiogu, esan daiteke euskarazko produkzioak, bere txikian, gutxieneko aniztasuna agertzen duela. Erreferentziacorpus diakronikotzat har litezkeen bi corpus dauzkagu, egungoak ez diren arren (OEHTC eta XXMECE), corpus berezi bat (ZTC; Alegria et al. 2005b, 2006b; Areta et al. 2007), literaturaeta prentsa corpus handi bat (EPG, hein batean ere ‘berezi’ dena), euskal literatura klasikoen eta aldizkarien bilduma (KG), etiketatze sintaktikoa eta semantikoa duen corpus aurreratu bat (EPEC)... Nazioartean, corpus ‘nagusi’ gehienak orokorrak dira.
‎EEBS, berriz, XX. mendeko euskara jasotzen duen corpus estatistiko irekia da, oraingoz behintzat: 1998 arteko 6.047 obra zatitatik jasotako 4.237.000 testu hitz ditu (euskal argitalpenen inbentarioan oinarrituz, unibertso osoa proportzionalki ordezkatzen du zozketa bidez aukeratutako laginak), SGML8 formatu estandarrean kodetuak, lematizatuak (98.800 lema desberdin), sailkapenaren arabera erakusgarria da (epea, euskalkia, testu mota eta obraren tamaina) eta urtero eguneratzen da oraingoz, irizpideen oreka mantenduz.
‎Azken batean hauxe esan nahi dut: aurrerapauso erraldoia izan da Orotariko> Euskal> egia ren corpusa eskura izatea; baina etengabeko eguneratzea eskatzen duen corpusa da.
2009
‎Bego hori dioena. Nago, ostera, ez ote dugun herri literaturaren altxorra ere barneratu behar euskarak aspalditik premiazko duen corpus esanguratsu horretan. Teknika berriak, bestalde, teknika hitzak egoki adierazten duenez, horixe dira, hain juxtu ere:
‎Bego hori dioena. Nago, ostera, ez ote dugun herri literaturaren altxorra ere barneratu behar euskarak aspalditik premiazko duen corpus esanguratsu horretan. Teknika berriak, bestalde, teknika hitzak egoki adierazten duenez, horixe dira, hain juxtu ere:
‎• Corpusa XX. mendeko euskararen corpus estatistikoa (Euskaltzaindia) (www.euskaracorpusa.net/XXmendea/in dex.html). UZEI elkarteak egin duen XX. mendeko euskara jasotzen duen corpus estatistikoa da, 4.658.036 testu hitzez osatua. Erabili izan den eta erabiltzen den euskararen lekuko eta erakusgarri izatea du egiteko nagusi eta ia bakarra, eta ez ereduzko hizkuntza proposatzea.
2010
‎Horretarako, Euskaltzaindiak Lexikoaren Behatokia izeneko egitasmoa jarri du abian. Komunikabideek argitaratzen duten edo aireratzeko idazten duten materialarekin corpus monitore bat eraikitzea da helburua, hau da, hizkuntzaren erabilera hurbiletik jarraitzea ahalbidetuko duen corpus bat elikatzen eta automatikoki lematizatzen eta etiketatzen joatea.
2014
‎Bertan, 634 material euskaratuta daude eskura, eta material berria ere laster jarriko da, elkarteak sortzen duen heinean. Horrek guztiak sortzen duen corpusa glosario batean dago garatuta, hemen. Glosario horretan 8.894 kontzeptu, 18.041 termino eta 191.230 testu jasotzen dira.
2015
‎Corpusetan oinarritutako metodoek, nolabaiteko polaritate anotazioa behar dute lexikoak erauzteko.Bi hurbilpen nagusi daude multzo honetan: lehena, polaritate ezaguna duten hitz batzuetatik abiatuta, corpusetan hitz horien semantikoki antzekoak diren hitzak aurkitzean datza (Turney eta Littman, 2003). Bigarrena, polaritatea markatuta duen corpus batean oinarrituz, positiboenak zein negatiboenak direnhitzen zerrendak lortzea (Saralegi eta San Vicente, 2012)
‎Estrategia egokiena litzateke anotatutako corpus bat hartuta adibide positiboa eta negatiboak banatzea. Tamalez, ez dago euskaraz horrelako anotaziorik duen corpusik, eta erdibideko hurbilpen batera jobehar izan dugu, testu sub jektiboak eta objektiboak bereizita dituen corpus bat baliatuz. Horrelako corpus bat eraikitzeko estrategia merke bat hartu dugu Berriako artiku bilduma batetik CBerria abiatuta: Iritzi artikuluak subjetibotzat hartu dira, eta gainerakoak objektibotzat (CBerria) (Saralegi et al., 2013). 2 Taulak corpus horren neurriak eta erauzketaren datuak azaltzen ditu.
‎IXAikerketa taldearen1 baitan egiten ari garen ikerketa da. Lanak helburu izango ditu euskarazko denboraegituren analisia, denbora informazioa batuko duen corpus baten sorrera eta denbora informazio horiprozesatuko duten tresnen garapena. Horretarako, nazioarteko NewsReader2 proiektuan egin dugunlana euskararako oinarritzat hartuko da eta bai IXA ikerketa taldean bai Italiako Fondazione BrunoKesslerren3 existitzen diren tresnak euskarazko denbora informazioa prozesatzeko egokituko dira edoberriak sortuko dira.
2016
‎Euskara edo zuzenketa zerbitzuek batez beste fakturatzen duten prezioaren arabera kalkulatu da bi komunikabide horiek euskal gizarteari ematen dioten balioa. Bestetik, gehitu behar da BERRIAk Euskaltzaindiaren esku uzten duen corpus a. Corpus hori doan uzten badio ere, berez balio bat badauka, eta beste hizkuntzetako akademiek edo unibertsitateek ordaindu behar izaten dute halako corpus baterako.
‎Adibidez: BERRIAk Euskaltzaindiaren eskura uzten duen corpus a nola baloratzen da. Zein balio dauka, dirutan, corpus horrek?
‎Zer esango dut ba, besterik. Datozela nobela beltzari buruzko beste ikuspegi partzial eta interesatuak, alde horretatik nirea bezalakoak, baina ezberdinak, eta osa dezagun horrela inork horren erraz botako ez duen corpus teoriko moduko bat, denon irizpidea findu dadin. Orain arteko “nobela beltza da” soil eta lakonikoari gehitu ahal diezaiogun atzetik beste zer edo zer.
2017
‎–Normalean hizkuntzaren modernizazioa eta estandarizazioa komunikazioan hiztunek egiten duten erabileraren ondoriozko emaitza da? 210 Horra Zimmermann-ek nola ikusten duen corpusaren alorrean burutu behar den iraultza txiki handia. Gure artean errazegi hitz egiten du hainbatek euskara batuaren arloan buruturiko, iraultzaz?, inondik ere.
‎Balioen aldakortasunari dagokionez, Uxue Alberdiren kasuan argi esan liteke hitz lauz ekoitzitakobokalen balioak aldakorragoak direla bertsoetakoak baino (hasierako hipotesia berretsiz), baina ezMaialen Lujanbioren kasuan. Bertsolarien arteko desberdintasunak (gorago aipatutakoak ere) zerkeragindakoak diren zehaztea ez da erraza, bi bertsolari soilik aztertu direnez, eta bost minutukoiraupena duen corpusa, ezin baita seguru esan bokalismoan aurkitutako aldeak informatzailebakoitzaren ezaugarri pertsonalek, hizkerak edo lan honetan kontuan hartu ez den beste alderdirenbatek eragindakoak ote diren. Edonola ere, kontuan hartzekoa litzateke Maialen Lujanbioren hitzlauko ekoizpena paperean idatzitakoaren errezitaletik hurbil dagoela, eta Uxue Alberdirena, berriz, bat batean ekoitzitako hizketa formala dela.
‎testu corpusak sortu behar dira. Euskarazko denbora informazioa kodetzeko, EusTimeML etiketatzelengoaia (Altuna et al., 2016) sortu dugu TimeML lengoaian (Pustejovsky et al., 2003) oinarrituta etadenbora informazioa duen corpusa osatzen ari gara. 2 irudian ikus dezakegu EusTimeMLren bidez kodetuta 1 irudiko esaldiko denbora informazioa.
‎Etiketatzea gainbegiratu ostean, ezeztapena etiketatuta duen corpusa izango dugu. Tamainaz txikiada eta 33 ezeztapen baino ez dira aurkitu.
2018
‎Areago, euskal esparruan aplikaturiko zentsuraren azterketa sistematiko eta xehe bakarra dugu oraindik. Aurreko lerroetan xeheki deskribatu ditugun doktorego tesi honen ekarpen eta edukiek bistaratu dutenez, eskerga da, zinez, zentsura aztertzeko Torrealdaik erabili duen corpusa. Eta corpusa diogunean, batez ere, Administrazio Zibilaren Artxibo Orokorrean aztertutako fitxa kopuruari egiten diogu erreferentzia, artxiboa bera ezagutzen duen zernahi ikerlarik ongi baino hobeki baitaki bertan lan egiteko mugek (ordutegi murriztua, txosten eskaera murriztua eguneko...) ikerlana nola moteltzen duten.
2019
‎erdiestea duela helburu behinena. . Amets hori hezur-mamitu artean?, Lexikoaren Behatokia, hizkuntza nola aldatzen ari den erakusten duen corpusa, 2000tik aurrerako testuz etengabe elikatzen dena, du bide horretan ardatz.
2020
‎Lanaren muina osatzen duen corpusa ikus entzunezko euskarazko komunikabideen artetik jasota dago. Hala ere, kontuan izan behar da, kazetaritzako generoek azken hamarkadetan garapen eta eraldaketa sakonak izan dituztela eta publikoki elkar ekiteko moduetan ere aldaketak etorri direla.
Emaitza gehiago eskuratzen...
Loading...

Bilaketarako laguntza: adibideak

Oinarrizko galderak
katu "katu" lema duten agerpen guztiak bilatu
!katuaren "katuaren" formaren agerpenak bilatu
katu* "katu" hasiera duten lema guztiak bilatzen ditu
!katu* "katu" hasiera duten forma guztiak bilatzen ditu
*ganatu "ganatu" bukaera duten lema guztiak bilatzen ditu
!*ganatu "ganatu" bukaera duten forma guztiak bilatzen ditu
katu + handi "katu" eta "handi" lemak jarraian bilatu
katu + !handia "katu" lema eta "handia" forma jarraian bilatu
Distantziak
katu +3 handi "katu" eta "handi" lemak 3 elementuetako distantzian bilatu
katu +2 !handia "katu" lema eta "handia" forma 2 elementuetako distantzian bilatu
katu +2 !handi* "katu" lema eta "handi"z hasten diren formak 2 elementuetako distantzian bilatu
Formen konbinazioa desberdinak
bero + handi | asko "bero" lema eta jarraian "handi" edo "asko" lemak bilatu
bero +2 !handi* | !asko* "bero" lema eta jarraian "handi"z edo "asko"z hasten diren formak
!bero + handi|asko|gutxi|txiki "bero" forma eta jarraian "handi", "asko", "gutxi", "txiki" lemak
Ezaugarri morfologikoekin
proba + m:adj "proba" lema eta jarraian adjketibo bat
proba +2 m:adj "proba" lema eta bi hitzetako distantziak adjektibo bat adjketibo bat
bero + handi|asko + m:adi "bero" lema jarraian "handi" edo "asko" eta jarraian aditz bat
proba + m:izearr-erg "proba" lema eta ergatibo kasuan dagoen izen arrunta

Ezaugarri morfologikoak

KATEGORIA
adb adberbioa
adi aditza
adilok aditz-lokuzioa
adj adjektiboa
det determinatzailea
ior izenordaina
izearr izen arrunta
izepib pertsona-izena
izelib leku-izena
izeizb erakunde-izena
lbt laburtzapena
lotjnt juntagailua
lotlok lokailua
esr esaera
esk esklamazioa
prt partikula
ono onomatopeia
tit titulua
KASUA
abs absolutiboa
abl ablatiboa
ala adlatiboa
ban banatzailea
dat datiboa
des destinatiboa
erg ergatiboa
abz hurbiltze-adlatiboa
ine inesiboa
ins instrumentala
gel leku-genitiboa
mot motibatiboa
abu muga-adlatiboa
par partitiboa
psp postposizioa
pro prolatiboa
soz soziatiboa
MUGATASUNA/NUMEROA
mg mugagabea
ms mugatu singularra
mp mugatu plurala
mph mugatu plural hurbila
ADITZ MOTA
da da
du du
dio dio
zaio zaio
da-du da-du
du-zaio du-zaio
dio-zaio dio-zaio
da-zaio da-zaio
du-dio du-dio
da-zaio-du da-zaio-du
da-zaio-du-dio da-zaio-du-dio

Euskararen Erreferentzia Corpusa Euskararen Erreferentzia Corpusa (EEC)
© 2025 Euskaltzaindia