V roku 2001 ministerstvo kultúry v spolupráci s ministerstvom školstva a Slovenskou akadémiou vied pripravilo návrh projektu vybudovania Slovenského národného korpusu a projektu elektronizácie jazykovedného výskumu v rokoch 2002 – 2006, ktorý schválila vláda SR uznesením č. 137 z 13. februára 2002. Ide o elektronickú databázu textov súčasného slovenského jazyka, ktorá slúži na vyhľadávanie slov, slovných spojení a jazykových prostriedkov. Je určený každému používateľovi slovenského jazyka, ale predovšetkým redaktorom, prekladateľom, učiteľom a jazykovedcom. Na základe tohto projektu sa v Jazykovednom ústave Ľudovíta Štúra SAV 22. novembra 2002 otvorilo pracovisko Slovenského národného korpusu s cieľom vybudovať do roku 2006 korpus s kapacitou 200 miliónov tokenov – základných textových jednotiek používaných v korpusoch (napr. slovo, tvar slova, číslica a pod.).

V súčasnosti sa realizuje už 5. etapa tohto projektu (2022 – 2026). Hlavný korpus písaných textov Slovenského národného korpusu, jeho aktuálna verzia prim-8.0, bola sprístupnená 31. januára 2018 v rozsahu takmer 1,5 miliardy tokenov. Využitie na vedecko-výskumné ciele je bezplatné, prístup na vyhľadávanie dostane používateľ po zaregistrovaní sa na stránke https://korpus.sk/registration.html.

Posledná aktualizácia: 25. februára 2022 / MKSR Admin

Zdieľať