Corpusak

Corpusak hizkuntzak deskribatzeko eta ikertzeko baliatzen diren hizkuntza-datu bildumak dira.

Gure zalantzak argitzeko oso lagungarriak izan daitezke.   

Hizlarien lekukotasunak jasotzen ditu. Kasu batzuetan, bildutakoaren transkripzio-zatia eta bideoa kontsultatzeko aukera ere eskaintzen da.



Literatura du oinarri eta bertan aurkituko dituzu, besteak beste, testu zaharrak, lokuzioak, literatur testuak, kritikak, efemerideak, argazkiak, bertsoak... 

ATALAK webgunean hizkuntza eta literaturako material ugari aurkituko dugu: hiztegi zerrendak, unitateak, fitxak, irudiak, posterrak… 

Eroskiren aldizkariak argitaratu dituen testuetan oinarrituta dago, eta lau hizkuntzatan ematen ditu emaitzak: euskaraz, katalanez, galizieraz eta gaztelaniaz.


XX. mendeko euskara jasotzen duen corpus estatistikoa da XX. mendeko euskararen corpus estatistikoa, 4.658.036 testu-hitzez osatua. 


Hedabideak, literatura, zientziak eta entziklopediak oinarri dituen corpusa. 



Ereduzko idazleek idatzitakoak jasotzen ditu, gure eredu izan daitezen.



XVI. mendean hasi eta 1975. urtera arteko 496 liburu jasotzen ditu, eta denera 11,9 milioi testu hitzez osatuta dago.  

EHUko Euskara Institutuak modu askean kontsultatzeko gisan jartzen du "Goenkale corpusa". Hemengo materiala telesail horretako kapituluak egiteko erabilitakoa da.


Euskal literaturako testu klasikoen gordailua duzu hauxe.




Hedabideek erabiltzen duten materialarekin osatutako corpusa, UZEIk, Elhuyar-ek, EHUko IXA taldeak eta Euskaltzaindiak egindakoa.


Corpus paralelo eleaniztuna.

BBV Fundazioak (gero BBVA), Bizkaiko, Gipuzkoako eta Arabako Kutxek, Euskal Herriko Unibertsitateak eta Deustuko Unibertsitateak osatutako KLASIKOAK izeneko elkarteak argitara emandako liburuak biltzen dira hemen. 



"Euskal Herriko Mapa Digitala" sarean jarri du UZEIk. Euskaltzaindiak araututako Euskal Herriko herrien izendapenak biltzen ditu mapak, eta Google Maps zerbitzua erabiliz kontsulta daiteke. 



Elhuyar Fundazioak Web-corpusen Ataria sortu du. Erabiltzaileok hiru baliabide izango ditugu eskura:


Zientzia eta Teknologiaren Corpusa, edo ZT corpusa, zientzia eta teknologiaren alorreko euskarazko testu-bilduma da.



Corpus honen helburua da euskara juridikoaren eragile nagusiek sortutako testuak eskuragarri jartzea, euskarazko prosa juridikoa finkatzen laguntzeko. 


Corpus paraleloak

 UPV/EHUko Euskara Zerbitzuak ingelesezko, gaztelaniazko edo frantsesezko hitz bat, termino bat edota esapide bat euskarara nola itzuli duen kontsultatzeko baliabidea. 


 

 Egungo euskara-gaztelaniako corpus paralelo publiko handiena da. 


 

EIZIE eta Elhuyar Hizkuntza eta Teknologiako Eleka Ingeniaritza Linguistikoa unitatearen arteko lanaren emaitza da.