2015
|
|
Lanak helburu izango ditu euskarazko denboraegituren analisia, denbora informazioa batuko duen corpus baten sorrera eta denbora informazio horiprozesatuko duten tresnen garapena. Horretarako, nazioarteko NewsReader2 proiektuan egin dugunlana euskararako oinarritzat hartuko da eta bai IXA ikerketa taldean bai Italiako Fondazione BrunoKesslerren3 existitzen diren tresnak
|
euskarazko
denbora informazioa prozesatzeko egokituko dira edoberriak sortuko dira.
|
|
|
Euskarazko
denbora informazioaren prozesamendua egiteko baliabideak sortzen ari gara. Lehenik etabehin, euskarazko denbora egituren informazioa kodetzen duen markaketa lengoaia osatzen ari gara.Markaketa lengoaia hori baliatuta albiste ekonomikoz osatutako corpus bat eskuz etiketatzen ari gara, gold standarda sortzeko, etorkizunean tresna automatikoak ebaluatu ahal izateko.
|
|
Euskarazko denbora egituren azterketan euskarak berezkoak dituen egiturak eta ezaugarriak identifikatuditugu ekonomia corpusean. Etiketatze esperimentuan ikusi izan denez, ingelesezko TimeML ereduaegokia da
|
euskarazko
denbora informazioa adierazteko. Hala ere, egitura horiek adierazi ahal izatekoeuskararako etiketatze irizpide berriak sortu behar izan ditugu, izan atributu edo balio berriak.
|
2017
|
|
testu corpusak sortu behar dira.
|
Euskarazko
denbora informazioa kodetzeko, EusTimeML etiketatzelengoaia (Altuna et al., 2016) sortu dugu TimeML lengoaian (Pustejovsky et al., 2003) oinarrituta etadenbora informazioa duen corpusa osatzen ari gara. 2 irudian ikus dezakegu EusTimeMLren bidez kodetuta 1 irudiko esaldiko denbora informazioa.
|
|
Euskal TimeBank da gaur egun
|
euskararako
denbora informazioarekin anotatuta dagoen corpus bakarraeta horregatik erabili dugu bEVENT garatzeko. Euskal TimeBank eraikitzeko MEANTIME corpusaren (Minard et al., 2016) euskarazko bertsiotik hartutako 30 dokumentu ISO TimeML gidalerroen egokitzapenaren arabera anotatu ziren.
|
2019
|
|
|
Euskarazko
denbora informazioaren prozesamenduan, EusTimeML markaketa lengoaia definitzeaz gain, horri jarraituta, EusTimeBank corpusa (Altuna, 2018) sortu dugu eta euskarazko denbora informazioa automatikoki erauzten duten EusHeidelTime (Altuna et al., 2017) eta bTime (Salaberri Izko, 2017) tresnak garatu ditugu.Zehazki, EusHeidelTimek denbora adierazpenak identifikatzen eta sailkatzen ditu, eta ISO arauar...
|
|
Euskarazko denbora informazioaren prozesamenduan, EusTimeML markaketa lengoaia definitzeaz gain, horri jarraituta, EusTimeBank corpusa (Altuna, 2018) sortu dugu eta
|
euskarazko
denbora informazioa automatikoki erauzten duten EusHeidelTime (Altuna et al., 2017) eta bTime (Salaberri Izko, 2017) tresnak garatu ditugu.Zehazki, EusHeidelTimek denbora adierazpenak identifikatzen eta sailkatzen ditu, eta ISO arauaren araberako balio normalizatua (ISO TimeML working group, 2008) esleitzen die; bTimek, berriz, gertaerak eta denboraerlazioak identifikatzen eta sailkatzen ditu....
|