Testuinguruan

Bilaketa

dist.

non

lema/forma

nola

bilaketa

kategoria

Iragazkiak

Mota/Gaia

Euskalkia

Itzulpena

Erregistroa

Ordena

Formularioa garbitu

Emaitzak: 42

2002
	‎Berba jardunean, hitzak eta esaldiak ez dira kate bateko begi isolatuak; aitzitik,	hitz bakoitzak bere eragina du bere ondokoan eta esaldi bakoitzak berea hurrengoan nahiz aurrekoan. Berba jarduna prozesu bat da, bere osotasunean hausnartzen ez baldin bada, erabat ulertzen ez dena.
	‎Morfologiaren eta sintaxiaren artean tagging edo etiketatze izeneko prozesua burutu ohi da, forma bakoitzari dagokion informazio guztia esleituz; ondoren, testuinguruaren informazioan oinarrituta,	hitz bakoitzari analisi egoki bakarra utziko zaio. Analisien artean bat hautatzeko prozedurari desanbiguazio morfologikoa esaten zaio.
2005
	‎Goiko tonuak eta behekoak erabiliz. Hortara, entzulea berehala jabetuko da esatariak ematen dion informazioaren zentzu zehatzaz,	hitz bakoitzean erabiliko dituen tonu maila ezberdinek argibide ezin hobea ematen diolako entzulearen belarriari.
2007
	‎Bestetik, hizkuntza beti herri historiko eta hizkera konkretuen formetan agertzen da, agertu. Hizkuntzak, eta	hitz bakoitzak, bi elementu duela osagarri, esango du Humboldt-ek:
	‎Humboldt-ek (1825) iruzkin luze bat idatzi dio Schlegel-i, Langlois ren kritikei ere puntuz puntu jaramon eginez. Printzipioz, dio?, itzulpeneko	hitz bakoitzean originalekoak asmagarria izan behar luke. Egia da, testu hindua Schlegel-en itzulpenean bakarrik ezagutzen duenak, kontzeptu hinduen ezagutzarik duela eskuratu.
	‎Logosak komunitateko abereak egiten gaitu, taldekoak soil gabe (ardiak edo inurriak legez). Gure ahoko	hitz bakoitzean
	‎oihartzuna durundiatzen da. Mintzatzen dugun	hitz bakoitzean hildakoak entzuten dira, arbasoak. Garaikide biziak mintzo dira, familia, non ere baitugu hitz egiten ikasi; lagunak, zeintzuekin ere komunikatu ohi baikara, hitz horiekin elkar ulertuz eta mundua geureganatuz.
	‎Aje naturalen puntu hau bukatzeko, bada: aditza egoki eraikia badago, frasea txukuna izanen da,	hitz bakoitzak erritmoaren barruan bere tinkotasunari eutsiko dio eta esaerak hitz guztiak behar bezala bereizi eta elkarri lotuko dizkio, sintesia betegina da, pentsamendua eta espresioa betakorki elkarraiutuak? «organismo dohatsu» hori hizkuntza flexiboetan bakarrik da osoki erdiestekoa643 Orduan:
	‎Mundua, zer ere den bera, hizkuntzaren barruan da. Eta horregatik bakarrik izan daiteke eta da diferentea gizakiaren kasuan banako bakoitzarentzat (bakoitzari modu diferentean soinu egiten dio	hitz bakoitzean hizkuntza osoaren hondo hark, hots, munduak), eta da diferentea hizkuntz komunitate bakoitzarentzat, hizkuntza bakoitzak bestela egin duelako, hitzak edo zer selekzionatu bakanak baino gehiago, erlazioen sare osoa, ahaidetasun, oposizio, barne eta azpibilketen sistema.
2008
	‎– Esaldiko	hitz bakoitzeko kolpe bat eman.
	‎Hizkuntzaren soinuen segidan jartzen da arreta, eta gero eta unitate txikiagotan zatitzen da segida hori. Unitate alfabetikoetan jartzen denean arreta, segmentu fonemikoz osaturik ikusten da	hitz bakoitza; grafemen eta fonemen ezagutzari eta egokitzapenari ematen zaio garrantzia; hau da, letren segidari eta faktore fonologikoei begiratzen zaie. Letra gehienen formak eta izenak edo soinuak ikasten dituzte haurrek fase horretan.
	‎3 hitzak izeneko fitxategi batean hitz bat dago lerro bakoitzeko. Kontatu zenbat hitz diferente dauden eta	hitz bakoitzaren maiztasuna. Eman emaitza maiztasunaren arabera (maiztasun handienekoak hasieran):
	‎for (i= 1; i <= NF; i++) #	hitz bakoitzeko
2009
	‎Programatzean, askotan errepikatu behar izaten dira zenbait eragiketa: egin hau erabiltzaileak teklatutik datuak idatzi bitartean; egin hori fitxategiko	hitz bakoitzeko; egin hura array ko elementu bakoitzari; etab. Atal honetan agindu bloke bat nahi adina aldiz errepikatzeko Perl ek eskaintzen dituen tresnak aztertuko ditugu, programazio lengoaien ingurunean iterazio egitura edo begiztak deiturikoak.
	‎Ariketa interesgarria da hurrengo hau: sarrera bezala testu bat jaso, eta testuko hitzak bistaratuko ditugu banan banan,	hitz bakoitzak testuan duen agerpen kopuruarekin batera. Programak komando lerrotik argumentu bakarra jasoko du:
	‎fitxategia lerroz lerro irakurri, bukaerako lerro jauzi karakterea kendu, split() funtzioarekin lerroa hitzetan banatu eta @hitzak array an gorde. Ondoren, array ko	hitz bakoitza indibidualki tratatuko du programak foreach begizta erabiliz.
	‎Berrikuntza	hitz bakoitzaren prozesamenduan dator:
	‎2.1 $lerro string ean aurkitzen duen	hitz bakoitzeko 2.1.1 Gorde hitza $hitza aldagaian
	‎Aurreko ariketan karaktereekin egindakoa, hitzekin egingo du oraingo programak: sarrera datu gisa fitxategi izena jaso eta bertako	hitz bakoitzaren agerpen kopurua kontatu. Emaitzak agerpen kopuruaren arabera ordenatuta bistaratuko ditu, handienetik txikienera, hitz bakoitzeko honako informazioa erakutsiz:
	‎sarrera datu gisa fitxategi izena jaso eta bertako hitz bakoitzaren agerpen kopurua kontatu. Emaitzak agerpen kopuruaren arabera ordenatuta bistaratuko ditu, handienetik txikienera,	hitz bakoitzeko honako informazioa erakutsiz: hitza bera, bere agerpen kopurua edo maiztasuna, eta maiztasun erlatiboa.
2014
	‎Aurreneko hirurak corpus historikoak dira, gure idazleek (klasikoek eta ez hainklasikoek)	hitz bakoitza non, nola eta noiz erabili izan duten erakusten digutena.Azken hirurek, berriz, gaur egungo hizkuntzaren erabilera jasotzen dute.
	‎Beharra baino gehiago erauzteko ahalmena izanez gero, gehigarri horieijaramonik ez egitea tokatuko zaigu. Adibidez, Freelingek gaztelaniarako analisiaegiterakoan,	hitz bakoitzaren generoa ematen du. Oro har, hori ez da beharrezkoaeuskarara itzultzeko, eta beraz, ezikusi egiten da1 Analizatzaile berri batek zeingutxieneko informazio erauzi behar duen ezarri dugu lehenbizi, eta ondoren, aukeranagusietatik bat hautatu dugu.
	‎–	hitz bakoitzaren forma,
	‎–	hitz bakoitzaren lema,
	‎–	hitz bakoitzaren kategoria gramatikala2,
	‎ea zerrendako zenbat gauza oroitzen dituzun. Gogoratutako	hitz bakoitzeko puntu bat ematen da.
	‎Ea zerrendako zenbat hitz gogoratzen dituzun. Gogoratutako	hitz bakoitzeko puntu bat ematen da. Ez dago denbora mugarik:
2015
	‎Ausazko ibilbideak konbergitzean, sarrerako	hitz bakoitzari PRP k probabilitateez osaturiko bektore (PPB) bat esleitzen dio, eta bektore hori da, hain zuzen, hitzaren esanahia adieraziko duena. 4 irudiakgrafikoki adierazten du grafo sinple batean PPB pisuak zeintzuk liratekeen.
	‎Sailkatzailea entrenatzeko, txio bakoitzaren ezaugarri linguistikoak behar ditugu, sailkatzaileak hauetatik ikas dezan. Horretarako, txioak tokenizatu ditugu, beste era batera esanda, hitzen banaketa bategin, eta	hitz bakoitzaren lema, kategoria gramatikala eta entitate izen mota eskuratu. Ezaugarri linguistikoen sorkuntza Stanfordeko CoreNLP tresnaren7 8 bidez egin dugu.
	‎3 taulak aurretik jarri dugun txioaren ezaugarriak irudikatzen ditu, lehenengo zutabeak txioko hitzaadierazten du, eta beste zutabeetan	hitz bakoitzaren lema, kategoria gramatikala, entitate izen mota etakategoria ageri dira. Kategoria ezagutza baseko argumentua da.
	‎Gure esperimentuetarako erabilitako sailkatzailea \Baldintzazko hausazko eremua" da (BHE, ingelesez, Conditional Random Field9). Sailkatzaile hau etiketatze sekuentzialean oinarritzen da, eta	hitz bakoitzaren inguruko hitzak aztertzen ditu datu multzoa entrenatzean, baita hitz baten etiketairagartzean ere. Aukeratutako BHE sailkatzailea Stanfordeko CoreNLP tresnarena da.
	‎a argumentuaren izena da eta i argumentuaren iragarpen potentziala. Txio bakoitzean, sailkatzaileakiragarpen probabilitate bat (p) ematen dio	hitz bakoitzari argumentu bakoitzeko. P aldagaiak iragarpenprobabilitate guztiak multzokatzen ditu, a argumenturako.
	‎Azkenik, comer con apetito bezalakoak konbinazio libretzat hartu ditugu, gure ustez hitz segidaohikoak baitira, berezitasun morfologiko, sintaktiko edo semantikorik gabeak. Hortaz, teorian, ez dutetratamendu berezirik behar,	hitz bakoitzari dagokion ordaina emanda itzulpen onargarriak lortu beharkobailirateke.
2017
	‎Guk erabiltzen dugun Lampleet al. (2016) laneko ereduak bi mailatan egiten du lan. Lehenik eta behin	hitz bakoitza modelatzen dubere karaktereen arabera, horrekin hitzaren zenbakizko errepresentazio bat sortuz (hainbat zenbaki izanohi ditu honek). Honekin, hitz bakoitzaren informazioa (sasi informazio linguistikoa) zenbaki sekuentziabaten bidez adieraziko da, lehen mailako informazioa.
	‎Lehenik eta behin hitz bakoitza modelatzen dubere karaktereen arabera, horrekin hitzaren zenbakizko errepresentazio bat sortuz (hainbat zenbaki izanohi ditu honek). Honekin,	hitz bakoitzaren informazioa (sasi informazio linguistikoa) zenbaki sekuentziabaten bidez adieraziko da, lehen mailako informazioa. Esaldian daukagun hitz bakoitzarentzako, aurreikuspen bat sortu behar dugu eta horretarako uneko hitzaz haratago, testuinguruaren informazioa izateakberebiziko garrantzia du.
	‎Honekin, hitz bakoitzaren informazioa (sasi informazio linguistikoa) zenbaki sekuentziabaten bidez adieraziko da, lehen mailako informazioa. Esaldian daukagun	hitz bakoitzarentzako, aurreikuspen bat sortu behar dugu eta horretarako uneko hitzaz haratago, testuinguruaren informazioa izateakberebiziko garrantzia du. Adibidez, ondorengo adibideko lehen kasuan,
	‎1 Irudia: silaba kopurua	hitz bakoitzeko ingelesez eta gazteleraz erabili ditugun corpusetatikkalkulatuta.
	‎Eta berazinstalatu eta, 130 hitzak itzultzen zituzten. Hori egin eta,	hitz bakoitzean, interesgarria zen fonemabaztertua zen Praat i esker eta Script en bidez, bai iraupena, bai energia baita ere formakinen heinakateratzen ziren. Ondotik IBM SPSS Statistics 19 logizielaren bidez akustikoki aztertu nahi izan diraateratako datuak.
	‎Aipatutako neurona sareek	hitz bakoitzari bi bektore esleituko dizkio; hitz moduan dituen ezaugarrisemantikoak gordetzen dituena (W espazioan), eta testuinguruko hitz moduan dituen ezaugarriak dituena (C espazioan). 1 ataleko nomenklaturari jarraiki, bi espazioak V x d tamainakoak dira.
	‎Sistema hiru azpiataletan antolatuta dagoen neurona sare konplexuen konbinazioan oinarritzen da, jarraian deskribatzen ditugu atal hauek guztiak: lehen azpiatalean, atentzioa deritzona, sarrerako esaldiparea irakurtzen da eta	hitz bakoitza dagokion EBarekin lotzen da. Ondoren, hitzen EBak konbinatuegiten dira neural attention delako teknika baten bitartez (eragiketa aljebraikoetan oinarrituta).
2019
	‎Azkenaldian kode alternantzia ikertu duten hainbat lanen arabera, sistema fonologiko bakarraerabili dezakegu hiztunok	hitz bakoitzaren errealizazio fonetikoan, eta ondorioz ezinezkoa da hitzbakarrean hizkuntza ezberdinetako elementuak txertatzea (MacSwan, 2005; MacSwan eta Colina, 2014). Alabaina, euskara eta gaztelaniaren arteko kode alternantzia hitz barnean ere ematen da, etahori dela eta, sistema fonologikoak ez daudela guztiz bereizita eta sistemen artean interakzioa egondaitekeela proposatzen dugu.
	‎bezala. Sareen ikuspegitik	hitz bakoitza token independente bat denez, sareak ez ditu ikusten euskarazgertatzen diren hitzen arteko erlazioak, euskararen prozesamendu automatikoa zailduz. Hasiera batean behintzat, sarearentzat, haurrarengatik?

Emaitza gehiago eskuratzen...

Aldaerak

Lehen forma

Argitaratzailea

Konbinazioak (2 lema)

Konbinazioak (3 lema)

Urtea

Bilaketarako laguntza: adibideak

Oinarrizko galderak
katu	"katu" lema duten agerpen guztiak bilatu
!katuaren	"katuaren" formaren agerpenak bilatu
katu*	"katu" hasiera duten lema guztiak bilatzen ditu
!katu*	"katu" hasiera duten forma guztiak bilatzen ditu
*ganatu	"ganatu" bukaera duten lema guztiak bilatzen ditu
!*ganatu	"ganatu" bukaera duten forma guztiak bilatzen ditu
katu + handi	"katu" eta "handi" lemak jarraian bilatu
katu + !handia	"katu" lema eta "handia" forma jarraian bilatu
Distantziak
katu +3 handi	"katu" eta "handi" lemak 3 elementuetako distantzian bilatu
katu +2 !handia	"katu" lema eta "handia" forma 2 elementuetako distantzian bilatu
katu +2 !handi*	"katu" lema eta "handi"z hasten diren formak 2 elementuetako distantzian bilatu
Formen konbinazioa desberdinak
bero + handi \| asko	"bero" lema eta jarraian "handi" edo "asko" lemak bilatu
bero +2 !handi* \| !asko*	"bero" lema eta jarraian "handi"z edo "asko"z hasten diren formak
!bero + handi\|asko\|gutxi\|txiki	"bero" forma eta jarraian "handi", "asko", "gutxi", "txiki" lemak
Ezaugarri morfologikoekin
proba + m:adj	"proba" lema eta jarraian adjketibo bat
proba +2 m:adj	"proba" lema eta bi hitzetako distantziak adjektibo bat adjketibo bat
bero + handi\|asko + m:adi	"bero" lema jarraian "handi" edo "asko" eta jarraian aditz bat
proba + m:izearr-erg	"proba" lema eta ergatibo kasuan dagoen izen arrunta

Ezaugarri morfologikoak

KATEGORIA

adb	adberbioa
adi	aditza
adilok	aditz-lokuzioa
adj	adjektiboa
det	determinatzailea
ior	izenordaina
izearr	izen arrunta
izepib	pertsona-izena
izelib	leku-izena
izeizb	erakunde-izena
lbt	laburtzapena
lotjnt	juntagailua
lotlok	lokailua
esr	esaera
esk	esklamazioa
prt	partikula
ono	onomatopeia
tit	titulua

KASUA

abs	absolutiboa
abl	ablatiboa
ala	adlatiboa
ban	banatzailea
dat	datiboa
des	destinatiboa
erg	ergatiboa
abz	hurbiltze-adlatiboa
ine	inesiboa
ins	instrumentala
gel	leku-genitiboa
mot	motibatiboa
abu	muga-adlatiboa
par	partitiboa
psp	postposizioa
pro	prolatiboa
soz	soziatiboa

MUGATASUNA/NUMEROA

mg	mugagabea
ms	mugatu singularra
mp	mugatu plurala
mph	mugatu plural hurbila

ADITZ MOTA

da	da
du	du
dio	dio
zaio	zaio
da-du	da-du
du-zaio	du-zaio
dio-zaio	dio-zaio
da-zaio	da-zaio
du-dio	du-dio
da-zaio-du	da-zaio-du
da-zaio-du-dio	da-zaio-du-dio

hitz bakoitz lema	3 (0,02)
hitz bakoitz egon	2 (0,01)
hitz bakoitz puntu	2 (0,01)
hitz bakoitz agerpen	1 (0,01)
hitz bakoitz analisi	1 (0,01)
hitz bakoitz argumentu	1 (0,01)
hitz bakoitz bera	1 (0,01)
hitz bakoitz bi	1 (0,01)
hitz bakoitz erabili	1 (0,01)
hitz bakoitz errealizazio	1 (0,01)
hitz bakoitz erritmo	1 (0,01)
hitz bakoitz forma	1 (0,01)
hitz bakoitz genero	1 (0,01)
hitz bakoitz hil	1 (0,01)
hitz bakoitz hitz	1 (0,01)
hitz bakoitz hizkuntza	1 (0,01)
hitz bakoitz honako	1 (0,01)
hitz bakoitz indibidualki	1 (0,01)
hitz bakoitz informazio	1 (0,01)
hitz bakoitz ingeles	1 (0,01)
hitz bakoitz kategoria	1 (0,01)
hitz bakoitz kolpe	1 (0,01)
hitz bakoitz maiztasun	1 (0,01)
hitz bakoitz modelatu	1 (0,01)
hitz bakoitz non	1 (0,01)
hitz bakoitz original	1 (0,01)
hitz bakoitz prozesamendu	1 (0,01)
hitz bakoitz testu	1 (0,01)
hitz bakoitz token	1 (0,01)