Компютърна лингвистика

от Уикипедия, свободната енциклопедия

Лингвистика
Теоретична лингвистика
Лингвистични методи
Същност на езика
Езикът като знакова система
Езикът като система
Фонетика
Говорен апарат
Артикулационна фонетика
Гласни звукове
Съгласни звукове
Фонетична акустика
Гласни звукове
Съгласни звукове
Фонетично членение на речта
Фонология
Фонема
Позиция на фонемата
Опозиция на фонемата
Дистрибуция на фонемата
Звукови промени
Фонетични промени
Нефонетични промени
Морфология
Синтаксис
Семантика
Лексикална семантика
Стуктурална семантика
Стилистика
Диалектология
Приложна лингвистика
Психолингвистика
Социолингвистика
Генеративна лингвистика
Когнитивно лингвистика
Компютърна лингвистика
Дескриптивна лингвистика
Историческа лингвистика
Компаративна лингвистика
Етимология
История на лингвистиката
Лингвистични школи
Известни лингвисти
Нерешени проблеми

Компютърната лингвистика е теоретико-приложна наука, дял от изкуствения интелект, която се занимава с използването на компютърните технологии при обработката на естествен език.

Съдържание

[редактиране] Дялове

Основни дялове на компютърната лингвистика са:

  • автоматичен анализ на текстове
  • генериране на текстове
  • анализ и синтез на реч

[редактиране] Приложение

[редактиране] Автоматичен анализ на текстове

Приложението на автоматичния анализ е в области като машинен превод, интелигентно търсене на информация и автоматично отговаряне на въпроси. Генерирането на текстове има приложение при интелигентните интерфейси. Обработката на реч се използва при комуникация с компютърни устройства с гласови команди, например управление на автомобил с глас.

Автоматичният анализ на текстове се провежда на различни нива: разделяне текста на лексеми, морфология|морфологичен анализ, синтактичен анализ, анализ на дискурсните феномени като местоименни и неместоименни анафори, елипси и др.

Различните нива на анализ използват различни програми: морфологични анализатори, синтактични анализатори /parsers/, разрешители на анафори, анализатори на реторичната структура.

Текущото състояние на автоматичния текстов анализ позволява сравнително надежден морфологичен анализ /до 99% точност/, не дотам точен синтактичен анализ /80-85%/ и твърде неточно разрешаване на анафори /70-80%/. Съществуват и разработки за привеждане на текста в логическа форма.

При автоматичния анализ на текстове се използват ресурси, в които е зададено знанието за езика. Такива ресурси са морфологичните речници, граматиките, онтологиите, честотни таблици, информация за синтактичните рамки на глаголите и др.

Друг източник на знания са колекциите от текстове в електронен формат /корпуси/, от които знанията се извличат чрез статистически техники. Този дял от компютърната лингвистика е познат като корпусна лингвистика.

[редактиране] Генериране на текстове

Генерирането на текст е противоположно на анализа. Програмите за генерация започват от някакъв модел на смисъла и конструират лингвистичното му представяне.

[редактиране] Анализ и синтез на реч

Обработката на реч използва статистически техники за да се превърнат гласовите команди в текст.

[редактиране] Вижте още