Procesamento da linguaxe natural

Na Galipedia, a wikipedia en galego.

O Procesamento da Linguaxe Natural, (PLN, ou NLP; Natural Language Processing), é unha subdisciplina da intelixencia artificial é unha das aplicacións máis útiles da lingüística computacional. O PLN ocupase da formulación e investigación de mecanismos eficaces computacionalmente para la comunicación entre persoas ou entre personas e máquinas por medio de linguaxe natural. O PLN non trata dea comunicación por medio de lenguaxes naturais dunha forma abstracta, senon de deseñar mecanismos para comunicarse que sexan eficaces computacionalmente -que podense realizar por medio de programas que executen ou simulen a comunicación. Os modelos aplicados se enfocan non so á comprensión da linguaxe de por sí, senon a aspectos xerais cognitivos humanos e á organización da memoria. A linguaxe natural sirve so de medio para estudiar estos fenómenos.

Índice

[editar] Historia

O Procesamiento da Linguaxe Natural (PLN) é unha das pedras angulares tempranas da intelixencia artificial (IA). A Traducción Automática, por exemplo, naceu a finais da década dos corenta, antes de que se acuñara a propia expresión «Intelixencia Artificial». Non obstante, o PLN desempeñou múltiples papeis no contexto da IA, e a sua importancia dentro de este campo ten crecido e decrecido a consecuencia de cambios tecnolóxicos e científicos. Los primeros intentos de traducir textos por ordenador a finais dos anos corenta e durante los cincuenta fracasaron debido a la escasa potencia de los ordenadores y a la escasa sofistificación lingüística. Sen embargo, os esfuerzos realizados nas décadas dos sesenta e os setenta para producir interfaces en lenguaje natural para bases de datos y otras aplicaciones informáticas obtuvieron un cierto grado significativo de éxito. A década dos oitenta e a principios dos noventa viu rexurdir a investigación no terreo da Traducción Automática.

[editar] Dificultades no procesamiento de linguaxes naturais

[editar] Ambigüedade

A linguaxe natural es inherentemente ambiguo a diferentes niveis:

  • A nivel léxico, unha misma palabra pode tener varios significados, e a selección do apropiado debese deducir a partir do contexto oracional ou coñecemento básico. Moitas investigacións no campo do procesamento de linguaxes naturais teñen estudiado métodos de resolver as ambigüedades léxicas mediante diccionarios, gramáticas, bases do coñecemento e correlacións estadísticas.
  • A nivel referencial, a resolución de [[anáfora]s] e catáforass implica determinar a entidade lingüística previa ou posterior a que fan referencia.
  • A nivel estructural, requirese da semántica para desambiguar a dependencia dos sintagmas preposicionais que conducen á construcción de distintos árboles sintácticos.
  • A nivel pragmático, unha oración, a miudo, non significa o que realmente estase a dicir. Elementos tales como a ironía teñen un papel importanteena interpretación da mensaxe.

Para resolver estos tipos de ambigüedades e outros, o problema central no PLN é traducción de entradas en linguaxe natural a unha representación interna sin ambigüedade, como árboles de análisis.

[editar] Detección de separación entre as palabras

Na lingua falada, non se acostuman facer pausas entre palabra e palabra. O lugar no que se debe separar as palabras a miudo depende de cal é a posibilidade que manteña un sentido lóxico tanto gramatical como contextual. Na lingua escrita, idiomas como o chino mandarín tampouco teñen separacións entre as palabras.

[editar] Recepción imperfecta de datos

Acentos extranxeros, rexionalismos ou dificultades na producción da fala, errores de mecanografiado ou expresións non gramaticais, errores na lectura de textos mediante OCR

[editar] Compoñentes

  • Análise morfolóxica

A análise das palabras para extraer raíces, rasgos reflexivos, unidades léxicas compuestas e outros fenómenos.

  • Análise sintáctica

A análise da estrutura sintáctica da frase mediante unha gramática da lingua en cuestión.

A extracción do significado da frase, e a resolución de ambigüedades léxicas e estructurais.

A análise do texto máis alá dos límites da frase, por exemplo, para determinar os antecedentes referenciais dos pronomes.

  • Planificación da frase

Estrucurar cada frase do texto co fin de expresarr o significado adecuado.

  • Xeración da frase

A xeración da cadena lineal de palabras a partir da estrutura xeral da frase, cos seus correspondentes flexións, concordancias e restantes fenómenos sintácticos e morfolóxicos.

[editar] Aplicacións

As principais tarefas de traballo na area do PLN son:

  • Síntesis do discurso
  • Análisis da lenguaxe
  • Comprensión da linguaxe
  • Recoñecemento da fala
  • Traducción automática
  • Extracción de información

[editar] Véxase tamén

  • Linguaxes naturais
  • Xeración de linguaxe natural
  • GATE General Architecture for Text Engineering

[editar] Ligazóns externas

[editar] Referencias