Корпус (текстове)
от Уикипедия, свободната енциклопедия
Корпус от текстове или още литературни произведения е широка структура от текстове, обикновено използвана за статистически анализ, проверка на честотата на определени появи или валидиране на лингвистични правила специфични за дадена езикова или литературна сфера.
Корпусът е още основна база от знания в корпусната лингвистика. Текстови корпус се използва и за изучаване на исторически документи, като например опити за дешифриране на антични ръкописи.
[редактиране] Вижте също
- Корпусна лингвистика
- Търсачки: те аксесват уеб-корпусът.
- Обработка на естествен език