FidaPLUS

Iz Wikipedije, proste enciklopedije

Besedilni korpus FidaPLUS je obsežna zbirka elektronskih besedil, namenjena raziskovanju sodobnega slovenskega jezika. Korpus prinaša (pisna) besedila, s katerimi se govorci slovenščine v vsakdanjem življenju predvidoma najpogosteje srečujemo: iz večine slovenskih dnevnih časopisov, mnogih revij ter knjižnih publikacij različnih založb (literarna besedila, učbenike, stvarno literaturo). Poleg tega korpus zajema tudi besedila z interneta, prepise parlamentarnih govorov, t. i. besedilni drobiž (reklamna besedila, plačilni listki, računi) itd. Korpus tako ponuja možnost natančnega raziskovanja slovenskega jezika, kot se je pojavljal v besedilih, objavljenih od l. 1990 do 2006. Prinaša 621 milijonov besed, kar je visoka številka, primerljiva z velikostjo referenčnih korpusov drugih narodov.

Korpus FidaPLUS je referenčni korpus slovenskega jezika: je uravnotežen, kar pomeni, da se trudi biti reprezentativen vzorec jezika. To pomeni, da obsega vzorčni delež besedil slovenskega jezika in predstavlja jezik vsakdanje rabe. Osnovni namen takega korpusa je, da omogoča temeljit vpogled v jezik na najrazličnejših ravneh in področjih. Zato je pomemben vir za uporabno in teoretično jezikoslovje, npr. slovaropisje v vseh oblikah (eno- in večjezikovni slovarji, terminološki slovarji in drugi jezikovni priročniki), poučevanje jezika (učbeniki in učni pripomočki), jezikovne tehnologije (črkovalniki, avtomatski prevajalniki, govorni vmesniki itd.), ter tudi za druge družboslovne in humanistične vede, npr. literarno vedo, psihologijo in sociologijo.

Ker je korpus FidaPLUS prosto dostopen, ga lahko uporablja vsakdo, ki se pri svojem delu srečuje z jezikovnimi vprašanji (npr. lektorji, novinarji, učitelji slovenščine ...) oz. vsakdo, ki ga jezik preprosto zanima. Besedilni korpusi dajejo odgovore na vsa mogoča jezikovna vprašanja, če le-ta znamo pravilno postaviti.

[uredi] Zunanje povezave