Testuinguruan

Bilaketa

dist.

non

lema/forma

nola

bilaketa

kategoria

Iragazkiak

Mota/Gaia

Euskalkia

Itzulpena

Erregistroa

Ordena

Formularioa garbitu

Emaitzak: 28

2014
	‎Euskarazko egitura konplexuen azterketa egiteko, corpusetan oinarritzen gara.Orain arte erabili ditugun corpusak Euskararen Prozesamendurako ErreferentziaCorpusa (EPEC) (Aduriz et al., 2006a), Consumer corpusa (Alcazar, 2005) etaEuskal Wikipedia9 dira. Azken hori corpusa ez den arren, testu multzo handia daeta	hizkuntzaren prozesamenduko hainbat atazatan erabilia izan da. Corpus horietanagertzen ez diren egituren azterketa egiteko EGLU gramatikak erabili ditugu.
	‎	hizkuntzaren prozesamendu automatikoan ikertzen diren hainbat atazatan, hala nolasintaxi mailako desanbiguazioa edo hizkuntzaren ulermena, eta era berean, aplikazioaurreratuen (itzulpen automatikoa, galderak sortzeko sistemak, etab.) emaitzakhobetzeko erabil daitezke. Hizkuntzalaritza teorikoan, aldiz, fenomeno linguistikoenazterketarako balia daitezke horrelako baliabideak baita hizkuntzen arteko aldeakaztertzeko ere (Estarrona et al., 2013).
2015
	‎Testu bat prozesatzen, normalean, testua hainbat programak exekutatzen dute, batak bestearen atzetik. Programa horiei	hizkuntzaren prozesamendurako modulu (HP modulu) deitzen diegu. Normalean, HP moduluek kate bat osatzen dute, modulu bakoitzaren irteera hurrengoaren sarrera izanik.
	‎Hitz gakoak: Big data,	hizkuntzaren prozesamendua, sistema banatuak
	‎Hitz anitzeko unitateek edo unitate fraseologikoek (UFek) egiteko giltzarria dute, hiztegigintzan eta hizkuntzen irakaskuntzan ez ezik,	hizkuntzaren prozesamendu automatikoan ere (Sag et al., 2010). Gauregun aski onartua dago hizkuntzaren funtzionamendua ezin dela osagai bakunen konbinazio libreaz soilikazaldu, hiztunek erabiltzen dituzten elementu batzuk nolabaiteko unitate aurrez eratuak baitira (Fillmo re, 1979, 92).
	‎Ikerketa honen ekarpenak baliagarriak dira etorkizuneko hiztegigintzak automatizaziorantz izangoduen bilakabidean, eta	hizkuntzaren prozesamenduko arloko zenbait atazatan, hala nola datu base lexikalen elikatzean, corpusen etiketatzean eta, testuinguru eleaniztunean aplikatuta, itzulpen automatikoan.
	‎Hitz gakoak: aipamen detekzioa, korreferentzia ebazpena,	hizkuntzaren prozesamendua
	‎CliniTermServer egokitzeko hizkuntza bakoitzerako tokenizatzailea eta lematizatzailea txertatu beharizan ditugu: gaztelaniaren kasuan	hizkuntzaren prozesamendurako Freeling kode irekiko liburutegiaren3.1 (Padro eta Stanilovsky, 2012) bertsioa erabili dugu eta euskararako IXA taldeak garaturiko Eustagger etiketatzaile/ lematizatzailea (Ezeiza et al., 1998). Informatikaren alorrean liburutegi bat programenkodea idazteko eskuragarri dauden prozedura edo programen multzoa da, eta hori kode irekikoa izanik, libreki erabiltzeko edota aldatzeko aukera ematen du, kostu ekonomikorik gabe, betiere jatorriarierreferentzia eginik.
	‎Argi dago hizkuntzaren sorkuntza automatikoak berebiziko garrantzia duela	hizkuntzaren prozesamenduan, eta horren adibide dira atal honetan aurkezten ditugun lanak edo baliabideak.
	‎Hitz gakoak: Denbora informazioa,	hizkuntzaren prozesamendua, corpusa, markaketa lengoaia
	‎Azken urteetan denbora informazioaren analisia ikerketa ildo nabarmena bilakatu da	hizkuntzaren prozesamenduaren (HP) esparruan; esaterako, TempEval lehiaketen( (Verhagen et al. 2007, 2010) eta (UzZaman et al., 2012)) helburua informazio hori prozesatzeko sistemak sortzea izan da, denbora egiturak edoerlazioak erauzteko sistemak, adibidez. Denbora informazioa erauzteko, testuko gertaerak identifikatubehar dira, hala nola denborako uneak eta tarteak adierazten dituzten egiturak eta horiek erlazionatukodituzten erlazio egiturak.
	‎Kronologiako unea, gertaera eta horien arteko erlazioa identifikatzeko prozesu hori automatikoki eginahal izateko,	hizkuntzaren prozesamendua egin behar da. Denbora informazioaren analisi eta prozesamendua egiteko hainbat baliabide nagusi garatu behar dira:
	‎Hizkuntzaren Teoria Motorraren arabera,	hizkuntzaren prozesamenduak prozesamendu motorreandu bere jatorria. Teoria hau frogatu nahian, mugimenduen prozesamenduari lotutako hainbat ezaugarrihizkuntzaren prozesamenduan ere ari dira aurkitzen.
	‎Hizkuntzaren Teoria Motorra aurkeztu zenetik (Liberman eta Mattingly, 1985) hizkuntzarenprozesamenduaren ikerketan prozesamendu motorrean ikertzen diren hainbat ezaugarri ikertzenhasi dira, horien artean, mu uhinak. Teoria honek	hizkuntzaren prozesamendua etaprozesamendu motorra hainbat mailatan erlazionatzen ditu: maila fonetikoan, semantikoan, etab.
	‎EEG (elektroentzefalografia) esperimentu honetan	hizkuntzaren prozesamendua aztertzen dafuntzio motorrei dagozkien garun eremuetan. Honetarako, garunak sortzen dituen mu uhinendesinkronizazioa aztertzen dugu perpausak prozesatzean.
	‎Epe luzera, hizkuntza eta sistema motorraren elkarreraginak sakonago aztertzera bultzatzengaitu. Ikerketa bide honek,	hizkuntzaren prozesamendua ulertzen laguntzeaz gain, burmuinarenfuntzionamendua osoki hobeto ulertzen lagun diezaguke. Etorkizunera, burmuina ulertzea dugugaixotasun neurologoikoei aurre egiteko modu bakarra, eta ikerketa alor honek sistema motornahiz hizkuntzazkoan eragiten duten gaixotasunak aztertzen beren eraginak samurtu ahalizateko.
2017
	‎Bi balio bakarrik har ditzaketen atributuentzat, identifikaziorako bezala, sailkatzaile bitarrak erabili dira. Gainerakoentzat, berriz, multiclass motakoak.Sailkatzaileen eraikuntzarako baliatutako algoritmoa Support Vector Machines SVM (Cortes eta Vapnik, 1995) izan da,	hizkuntzaren prozesamenduko ataza askori algoritmo hau ongi egokitzen zaiela jakinadelako. Sailkatzaileak garatzeko jarraian aurkezten diren ezaugarri linguistikoak erabiltzen dira.
	‎Zerrendatutako teorietatik,	hizkuntzaren prozesamenduak, historian zehar, Davidsonek proposatutakoa jarraitu izan du (2). Izan ere, semantika konputazionalean perpausak adierazteko teoria honetanoinarritzen den semantika neo davidsondarra (Parsons, 1990) erabili ohi da.
	‎Izan ere, semantika konputazionalean perpausak adierazteko teoria honetanoinarritzen den semantika neo davidsondarra (Parsons, 1990) erabili ohi da. Hortaz,	hizkuntzaren prozesamenduan, eta ondorioz guretzat, gertaeraren definizioa teoria honek proposatzen duena izango da: denboran eta espazioan kokatua dagoen eta kausa jakin baten ondorioz eragin jakin bat sortzen duenjazoera.
	‎Predikatu kontzeptuaren bi definizio ezberdin hauen arteko bereizketa egiteko, azken aldian, egungoteoria gramatikalak predikatuari predikatzailea deitzen hasi zaizkio. Dena den, eta gure predikatuarenulermena egungo teorietatik badator ere, ez diogu predikatuari predikatzaile deituko, predikatu baizik,	hizkuntzaren prozesamenduan horrela deitu izan zaiolako.
	‎Argumentuek eta adjuntuek gertaeren hainbat propietateren berri ematen dute; besteak beste, gertaerak denboran kokatzen laguntzen dute. Jakina denez,	hizkuntzaren prozesamenduan rol semantikoen etiketatze automatikoaz arduratzen den atazak, SRL deitutakoak, argumentuak eta adjuntuak, eta ondorioz propietate hauek, detektatzeko gaitasuna dauka.Esan beharra dago, hala ere, SRLk ematen duen gertaeren inguruko informazio tenporala mugatua dela, eta interesgarria dela, gure ustez behintzat, informazio erauzketa sistemetarako adibidez, gertaereninguruko informaz... Hori erdiestekoISO TimeML (Pustejovsky et al., 2010) estandarrean oinarritutako bEVENT etiketatzailea garatu dugu.ISO TimeML testuetako denbora informazioa etiketatzeko sortutako anotazio eskema eta hizkuntza da.Anotazio eskemak hizkuntza naturaleko informazio linguistikoa nola markatu edo bildu behar den ezartzen duten formalismoak dira.
	‎Lan honetan poesiaren eskantsioa, hau da, poemetako egitura erritmikoaren erauztea, burutzen duguautomatikoki. Horretarako	hizkuntzaren prozesamenduko ohiko teknikak eta sare neuronaletan oinarritutakoak erabili ditugu. Esperimentazioa bi hizkuntzarekin egin dugu, ingelesarekin eta gaztelerarekin.Emaitzen arabera, sare neuronalekin lortu ditugu emaitza onenak, bi hizkuntzetan.
	‎Uneko hizkuntzari buruzko informaziorik izan gabe egitura prosodiko hau erauzteko, tradizio poetikoezberdinen azterketa tipologiko bat egitea beharrezkoa dela uste dugu. Bide horretan lehen pausuak emateko ikerlan hau aurkezten dugu, non poesiaren egitura prosodikoa automatikoki aztertzen dugun	hizkuntzaren prozesamenduko oinarrizko algoritmo batzuk erabilita. Metodo hauek ingelesezko eta gaztelerazkopoemetan aplikatu ditugu emaitza onak lortuaz, eta gure egungo erronka lanok euskarara aplikatzea da.
2019
	‎Bestalde, ikerlerro honek ikuspegi berritu bat ekarriko lukeKAren eta elebitasunaren azterketa orokorrera, bi hizkuntzen fonologiak aldi berean nola erabiltzendiren ikertzeko datu adierazgarriak eskainiko lituzke eta. Hau ikusita, iruditzen zaigu azpimarratzekoadela KAren azterketak fenomeno linguistiko orokorragoei buruz datu berriak emateko duen gaitasuna.Horretarako, baina, beharrezkoa litzateke KAren azterketa beste arlo batzuetako ikerlanarekinuztartzea, hala nola fonologian, hizkuntzaren jabekuntzan eta	hizkuntzaren prozesamenduan egitenden lanarekin.
	‎Azkenik, euskarazko corpusa handitzeaz eta arkitektura aldatzeaz gain, hizkuntza arteko sistema bat eraiki daiteke (Kundu et al., 2018; Cruz et al., 2018); baliabide askoko hizkuntza batean (ingelesean adibidez) korreferentzia ebazpenerako sistema bat entrenatuz, eta ondoren sistema hau euskarako korreferentziaebazpenerako baliatuz. Hizkuntza batetik ikasitako ezagutza bigarren hizkuntza bati aplikatuta emaitza onak lortubaitira	hizkuntzaren prozesamenduko ataza ezberdinetan.
	‎Hizkuntzaren prozesamendua (NLP Natural Language Processing) informatika, adimen artifiziala eta hizkuntzalaritza diziplinen arteko arloa da. Hizkuntzaren ulermena behar duten	hizkuntzaren prozesamenduko atazetankorreferentzia ebazpena oinarrizko urratsa da.
	‎Korreferentzia ebazpen automatikoa garrantzitsutzat jotzen da, oro har, testu ulermen sakona dakarren	hizkuntzaren prozesamenduko ataza oro burutzeko (Clark, 2015). Besteak beste, informazio erauzketan, testuenlaburpenean, galdera erantzun sistemetan, sentimenduen analisian eta itzulpen automatikoan aplikatzen da.
	‎Azken urteetan	hizkuntzaren prozesamenduan neurona sareek arrakasta handia izan dute, eta korreferentziaebazpenean ere, artearen egoeran emaitzarik onenak lortzen dituzten sistemek, teknologia hori darabilte. Neuronasareetan oinarritutako sistema gehienek ikasketa automatikoko sistemen antzera funtzionatzen dute, ikasteko etasailkatzeko atalak neurona sareekin ordezkatuz.

Emaitza gehiago eskuratzen...

Aldaerak

Lehen forma

Argitaratzailea

Konbinazioak (2 lema)

Konbinazioak (3 lema)

Urtea

Bilaketarako laguntza: adibideak

Oinarrizko galderak
katu	"katu" lema duten agerpen guztiak bilatu
!katuaren	"katuaren" formaren agerpenak bilatu
katu*	"katu" hasiera duten lema guztiak bilatzen ditu
!katu*	"katu" hasiera duten forma guztiak bilatzen ditu
*ganatu	"ganatu" bukaera duten lema guztiak bilatzen ditu
!*ganatu	"ganatu" bukaera duten forma guztiak bilatzen ditu
katu + handi	"katu" eta "handi" lemak jarraian bilatu
katu + !handia	"katu" lema eta "handia" forma jarraian bilatu
Distantziak
katu +3 handi	"katu" eta "handi" lemak 3 elementuetako distantzian bilatu
katu +2 !handia	"katu" lema eta "handia" forma 2 elementuetako distantzian bilatu
katu +2 !handi*	"katu" lema eta "handi"z hasten diren formak 2 elementuetako distantzian bilatu
Formen konbinazioa desberdinak
bero + handi \| asko	"bero" lema eta jarraian "handi" edo "asko" lemak bilatu
bero +2 !handi* \| !asko*	"bero" lema eta jarraian "handi"z edo "asko"z hasten diren formak
!bero + handi\|asko\|gutxi\|txiki	"bero" forma eta jarraian "handi", "asko", "gutxi", "txiki" lemak
Ezaugarri morfologikoekin
proba + m:adj	"proba" lema eta jarraian adjketibo bat
proba +2 m:adj	"proba" lema eta bi hitzetako distantziak adjektibo bat adjketibo bat
bero + handi\|asko + m:adi	"bero" lema jarraian "handi" edo "asko" eta jarraian aditz bat
proba + m:izearr-erg	"proba" lema eta ergatibo kasuan dagoen izen arrunta

Ezaugarri morfologikoak

KATEGORIA

adb	adberbioa
adi	aditza
adilok	aditz-lokuzioa
adj	adjektiboa
det	determinatzailea
ior	izenordaina
izearr	izen arrunta
izepib	pertsona-izena
izelib	leku-izena
izeizb	erakunde-izena
lbt	laburtzapena
lotjnt	juntagailua
lotlok	lokailua
esr	esaera
esk	esklamazioa
prt	partikula
ono	onomatopeia
tit	titulua

KASUA

abs	absolutiboa
abl	ablatiboa
ala	adlatiboa
ban	banatzailea
dat	datiboa
des	destinatiboa
erg	ergatiboa
abz	hurbiltze-adlatiboa
ine	inesiboa
ins	instrumentala
gel	leku-genitiboa
mot	motibatiboa
abu	muga-adlatiboa
par	partitiboa
psp	postposizioa
pro	prolatiboa
soz	soziatiboa

MUGATASUNA/NUMEROA

mg	mugagabea
ms	mugatu singularra
mp	mugatu plurala
mph	mugatu plural hurbila

ADITZ MOTA

da	da
du	du
dio	dio
zaio	zaio
da-du	da-du
du-zaio	du-zaio
dio-zaio	dio-zaio
da-zaio	da-zaio
du-dio	du-dio
da-zaio-du	da-zaio-du
da-zaio-du-dio	da-zaio-du-dio

hizkuntza prozesamendu ataza	3 (0,02)
hizkuntza prozesamendu automatiko	2 (0,01)
hizkuntza prozesamendu arlo	1 (0,01)
hizkuntza prozesamendu aztertu	1 (0,01)
hizkuntza prozesamendu egin	1 (0,01)
hizkuntza prozesamendu hainbat	1 (0,01)
hizkuntza prozesamendu horrela	1 (0,01)
hizkuntza prozesamendu modulu	1 (0,01)
hizkuntza prozesamendu neurona	1 (0,01)
hizkuntza prozesamendu ohiko	1 (0,01)
hizkuntza prozesamendu oinarrizko	1 (0,01)
hizkuntza prozesamendu prozesamendu	1 (0,01)
hizkuntza prozesamendu rol	1 (0,01)
hizkuntza prozesamendu ulertu	1 (0,01)