Компютърна лингвистика
от Уикипедия, свободната енциклопедия
Лингвистика |
Теоретична лингвистика |
Лингвистични методи |
Същност на езика |
Езикът като знакова система |
Езикът като система |
Фонетика |
Говорен апарат |
Артикулационна фонетика |
Гласни звукове |
Съгласни звукове |
Фонетична акустика |
Гласни звукове |
Съгласни звукове |
Фонетично членение на речта |
Фонология |
Фонема |
Позиция на фонемата |
Опозиция на фонемата |
Дистрибуция на фонемата |
Звукови промени |
Фонетични промени |
Нефонетични промени |
Морфология |
Синтаксис |
Семантика |
Лексикална семантика |
Стуктурална семантика |
Стилистика |
Диалектология |
Приложна лингвистика |
Психолингвистика |
Социолингвистика |
Генеративна лингвистика |
Когнитивно лингвистика |
Компютърна лингвистика |
Дескриптивна лингвистика |
Историческа лингвистика |
Компаративна лингвистика |
Етимология |
История на лингвистиката |
Лингвистични школи |
Известни лингвисти |
Нерешени проблеми |
Компютърната лингвистика е теоретико-приложна наука, дял от изкуствения интелект, която се занимава с използването на компютърните технологии при обработката на естествен език.
Съдържание |
[редактиране] Дялове
Основни дялове на компютърната лингвистика са:
- автоматичен анализ на текстове
- генериране на текстове
- анализ и синтез на реч
[редактиране] Приложение
[редактиране] Автоматичен анализ на текстове
Приложението на автоматичния анализ е в области като машинен превод, интелигентно търсене на информация и автоматично отговаряне на въпроси. Генерирането на текстове има приложение при интелигентните интерфейси. Обработката на реч се използва при комуникация с компютърни устройства с гласови команди, например управление на автомобил с глас.
Автоматичният анализ на текстове се провежда на различни нива: разделяне текста на лексеми, морфология|морфологичен анализ, синтактичен анализ, анализ на дискурсните феномени като местоименни и неместоименни анафори, елипси и др.
Различните нива на анализ използват различни програми: морфологични анализатори, синтактични анализатори /parsers/, разрешители на анафори, анализатори на реторичната структура.
Текущото състояние на автоматичния текстов анализ позволява сравнително надежден морфологичен анализ /до 99% точност/, не дотам точен синтактичен анализ /80-85%/ и твърде неточно разрешаване на анафори /70-80%/. Съществуват и разработки за привеждане на текста в логическа форма.
При автоматичния анализ на текстове се използват ресурси, в които е зададено знанието за езика. Такива ресурси са морфологичните речници, граматиките, онтологиите, честотни таблици, информация за синтактичните рамки на глаголите и др.
Друг източник на знания са колекциите от текстове в електронен формат /корпуси/, от които знанията се извличат чрез статистически техники. Този дял от компютърната лингвистика е познат като корпусна лингвистика.
[редактиране] Генериране на текстове
Генерирането на текст е противоположно на анализа. Програмите за генерация започват от някакъв модел на смисъла и конструират лингвистичното му представяне.
[редактиране] Анализ и синтез на реч
Обработката на реч използва статистически техники за да се превърнат гласовите команди в текст.