2007
|
|
Gaur egun, hizkuntza guztiek behar dituzte corpusak. Corpusak formatu elektronikoan eta linguistikoki etiketatuta dauden testu bildumak dira linguistikoki etiketatuta egoteak esan nahi
|
du
hitz bakoitzari dagokion lema, kategoria... ematen zaizkiola eta hizkuntzaren ikerketan eta hizkuntza teknologien garapenean erabiltzen dira. Oso baliabide garrantzitsuak dira hizkuntza teknologiak garatzeko, hiztegiak egiteko...
|
|
Arestian aipatu dugun bezala, ez dago euskarazko emaitzak soilik agertzen dituen bilatzailerik. Hori arazo bat da aurkitu nahi
|
dugun
hitza berdin esaten bada beste hizkuntza batzuetan. Horixe gertatzen da, hain justu, zenbait hitz teknikorekin adibidez, anorexia, sulfuroso eta byte, hitz labur batzuekin katu eta esne, esate baterako eta izen bereziekin Fiji eta Newton, besteak beste.
|
|
Alabaina, abantailak ez ezik, zenbait desabantaila ere baditu. Batetik, arestian aipatu den bezala, Internet linguistikoki etiketatu gabea denez, nolabaiteko ziurgabetasuna izango du beti lema bat baino gehiago
|
dituzten
hitzekin. Pilotari hitza bilatzean, adibidez; izan ere, pilota hitzaren datiboa ez ezik, pilotan jokatzen duen pertsona ere bada pilotaria.
|
|
Baina, pauso bat harago, teklatu birtualaren bidez idatzitako testuari ahotsa jarri dio COMPORTAk. Izan ere, goiko gorputz adarretako urritasun larriak
|
dituztenek
hitz egiteko zailtasunak ere izaten dituzte sarritan. Horretarako, ahots sintetizadoreak erabili dira, text to speech teknologiaren bidez erabiltzaileak idatzitakoa bozgorailuetatik irten dadin.
|
|
Pentsa ezazu hau kalera ateratzeko dela. Imajina ezazu ezin
|
duzula
hitz egin, eta okindegira sartu zarela ogia erostera. Sistemak ahal den azkarren eta eraginkorrena izan behar du, bestela ez dizute kasurik egiten.
|
2008
|
|
Landareei buruz hitz egitean neurona, sinapsi eta antzeko hitzak erabiltzea kritikatu zuten artikuluan. Izan ere, neurona hitza grekoz landare zuntz esan nahi
|
duen
hitzetik eratorria izatea ez da nahikoa arrazoi landare biologian aplikatzeko, zioten artikuluan.
|
|
Sar gaitezen, bada, gai erakargarri horretan. Gaur badakigu gene jakin batek (FOXP2 geneak) nolabaiteko eragina
|
duela
hitz egiteko gaitasunean. Nola iritsi ziren, ordea, gene horretaraino?
|
|
Orain dela hamabost urte inguru, mintzairaren nahaste espezifikoa deritzon gaitzak jotako familia bat aurkitu zuten Londresen. Pertsona horiek zailtasun handiak
|
dituzte
hitz egiteko; eta ez bakarrik hitz egiteko, esaldi konplexuak ulertzeko, hitz luzeak errepikatzeko eta abarretarako ere bai.
|
2009
|
|
Lehen pentsatzen zen zirkunboluzio angeluarrak hitzen formak ezagutzeko ardura
|
zuela
hitzen soinuetara eta esanahira jo baino lehen. Gaur egun, berriz, ikertzaileek ikusi dute zirkunboluzio angeluarrak ez dituela zuzenean hitzak soinuetara eta esanahietara itzultzen, baizik eta irakurketa prozesuan parte hartzen duela, hitzaren esanahia ezagutuz hizkiak aurreratuz.
|
|
Orain dela 20 urte ez zegoen hiztegi konputazionalik, denak paperezkoak ziren. Orain, aldiz, Interneten
|
dituzu
hitz guztien esanahiak, nola esaten diren beste hizkuntzetan eta abar. Morfologiaren aldetik, hizkuntza zailetarako (euskara bezalakoetarako),% 95 beteta dago.
|
2010
|
|
Bestalde, bilatu nahi
|
dugun
hitzak esanahi bat baino gehiago baditu, guri horietako batekin lotutako emaitzak soilik interesatuko zaizkigu normalean. Horiek bakarrik itzultzea oso lagungarria da, edo gutxienez emaitzak esanahi ezberdinen arabera taldekatuta agertzea.
|
|
Edonola ere, aukera hauek inplementatzeko, bilatzaileak asmatu beharra
|
du
hitzaren esanahietako zein interesatzen zaion erabiltzaileari. Hori egiteko hainbat modu daude.
|
|
Yanomamo izenez bataiatu zituen antropologo estatubatuar batek, haien hizkuntzan gizaki esan nahi
|
duen
hitzarekin, alegia.
|
|
2001 urtean ikusi zuten zientzialariek FOXP2 geneak nolabaiteko lotura
|
duela
hitz egiteko gaitasunarekin. Gene horretan mutazio jakin batzuk dituzten banakoek ez dute hitz egiteko gaitasunik.
|
|
2001 urtean ikusi zuten zientzialariek FOXP2 geneak nolabaiteko lotura duela hitz egiteko gaitasunarekin. Gene horretan mutazio jakin batzuk dituzten banakoek ez
|
dute
hitz egiteko gaitasunik. Alabaina, ezin da esan mintzamenaren genea denik.
|
2012
|
|
lehenengoan, zailtasun maila desberdineko ariketa fonologikoak, semantikakoak eta errimazkoak egin behar dituzte. Argi dago bertsolariak besteak baino hobeak izango direla bukaera jakin bat
|
duten
hitzen zerrendak osatzen; baina ikusi nahi dugu horretarako erabiltzen duten estrategiak beste arlo batzuetan ere abantaila ematen ote dien, adibidez, lehen silaba berdina duten hitzen zerrendak egiteko, edo arlo semantiko bereko hitzak emateko.
|
|
lehenengoan, zailtasun maila desberdineko ariketa fonologikoak, semantikakoak eta errimazkoak egin behar dituzte. Argi dago bertsolariak besteak baino hobeak izango direla bukaera jakin bat duten hitzen zerrendak osatzen; baina ikusi nahi dugu horretarako erabiltzen duten estrategiak beste arlo batzuetan ere abantaila ematen ote dien, adibidez, lehen silaba berdina
|
duten
hitzen zerrendak egiteko, edo arlo semantiko bereko hitzak emateko.
|
2016
|
|
Hiru adibideotan ageri den UFa despertar inters ez dago Matxinen hiztegian oraindik; beraz, gaur egun, ez
|
du
hitz konbinazio hori UFtzat tratatzen (4 irudia). Baina, Matxinen hiztegian egongo balitz ere, orain arte erabili izan duen metodoaren bidez, 6 adibidean bakarrik ezagutuko luke, esaldi horretan bakarrik agertzen baitira bi hitzak ordena berean eta tartean beste elementurik gabe.
|
2020
|
|
Laringektomizatutakoek ahots esofagikoarekin hitz egin dezakete, baina, elkarlan honen bidez, medikuek informazioa ematen zieten pazienteei, ebakuntzaren aurretik grabaketa egiteko. Hartara, ondoren bazuten aplikazioa, lehen asteetan ezin
|
baitute
hitz egin, azaldu du Hernaezek. Dioenez, elkarlan horrek bultzada handia eman dio proiektuari.
|