EEC zer den

Euskaltzaindia XX. mendeko 80. hamarkadan hasi zen corpusak lantzen, Orotariko Euskal Hiztegiaren corpusa eta XX. Mendeko Euskararen Corpus Estatistikoarekin. Horren ondoren, Lexikoaren Behatokia sortu eta eguneratzen jardun zuen. Corpus horiek gabe Euskaltzaindiak ez zituen, esate baterako, gaur egun garatzen ari den hiztegigintzako lanak dauden mailan izango.

Hala ere, euskararen egunean eguneko erabileraren berri izateko eta hizkuntza-teknologiek ekarri dituzten erronka berriei aurre egiteko, corpus handiago eta orekatuago baten beharra ikusten zuen Euskaltzaindiak. Hutsune hori betetzeko Euskararen Erreferentzia Corpusa (EEC) jarri zuen abian. Proiektu horren lehen emaitzak argia ikusi du eta erabiltzaileen esku dago.

EEC, hizkuntza-, literatura- edo ikerketa-helburuetarako estandar edo erreferente gisa erabilia izan ahal izateko asmoarekin sortu da. Hona hemen EEC sortzerako orduan aintzat hartu diren irizpide nagusiak:

  • Osaera: Corpusa irizpide espezifikoetan oinarritutako testuek osatzen dute, hala nola, generoa, denbora-tartea, egiletza edota erabilera-erregistroa, besteren artean.
  • Helburua: Analisi linguistikorako, ikasketa automatikorako edo ikerketan hipotesiak baliozkotzeko erabili ahal izango da, beste erabileren artean.
  • Oreka eta adierazgarritasuna: Egungo euskararen erabilera islatzeko helburuarekin, garrantzitsuak dira gaien aniztasuna mantentzea, euskalki guztietako adibideak eta testu-iturri desberdinetako (liburuak, aldizkarik, sarea,...) edukiak biltzea, eta publiko mota guztiei zuzendutako testuak (gazteak, publiko orokorra, espezialistak) kontuan izatea.
  • Markatze eta metadatuak: Markaketa linguistikoa (lematizazioa, analisi morfologikoa, desanbiguazioa,...) eta metadatuak (egilea, argitaratze-data, euskalkia, erregistroa, generoa, itzulpena den ala ez,...) gehitu dira testu guztietan.
  • Corpus dinamikoa: aurreko irizpideak oinarri hartuta, urtero eguneratuko da corpusa, bai edukiz eta bai oinarri teknologikoz.

Euskararen Erreferentzia Corpusa Euskararen Erreferentzia Corpusa (EEC)
© 2025 Euskaltzaindia