Estatística multivariante
Na Galipedia, a wikipedia en galego.
Os métodos estadísticos multivariantes e a análise multivariante son ferramentas estatísticas que estudian o comportamiento de varias variables ó mesmo tempo, incluindo a dependencia de unhas frente a outras. Úsanse principalmente para buscar as variables menos representativas para poder eliminarlas, simplificando así modelos estatísticos nos que o número de variables sexa un problema e para comprender a relación entre varios grupos de variables. Algúns dos métodos máis coñecidos e utilizados son a Regresión lineal e a Análise discriminante.
Pódense sintetizar dous objectivos claros:
- Proporcionar métodos nos que a finalidade é o estudio conxunto de datos multivariantes que a análise estatística uni e bidimensional é incapaz de conquerir.
- Axudar ó analista ou investigador a tomar decisións óptimas no contexto no que se encontre tendo en conta a información dispoñible polo conxunto de datos analizado.
Existen diferentes modelos e métodos, cada un co seu tipo de análise:
- Métodos de Dependencia:
- Un Estudio de regresión permítenos averiguar ata que punto unha variable pode ser prevista coñecendo outra. Utilízase para intentar predecir o comportamento de certas variables a partir de outras, como por exemplo os beneficios dunha película a partir do gasto en márketing e do gasto en produción.
- A Análise da Correlación canónica intenta analizar a posible existencia de relación entre dous grupos de variables.
- Unha Análise discriminante pódenos dar unha función discriminante que pode ser utilizada para distinguir entre dous ou máis grupos, e deste modo tomar decisións.
- Unha análise multivariante da varianza (MANOVA), extendendo a análise da varianza (ANOVA), cubre os casos nos que se coñeza a existencia de máis de unha variable dependente sin poderse simplificar máis o modelo.
- A Regresión loxística permite a elaboración de unha análise de regresión para estimar e probar a influencia de unha variable sobre outra, cando a variable dependente ou de resposta é de tipo dicotómico .
- Métodos de Interdependencia:
- A Análise de compoñentes principales (PCA) procura determinar un sistema máis pequeno de variables que sinteticen o sistema orixinal.
- A Análise clúster clasifica unha mostra de entidades (individuos ou variables) nun número pequeno de grupos de forma que as observacións pertencentes a un grupo sexan moi similares entre sí e moi disimilares do resto. A diferencia da Análise discriminante descoñécese o número e a composición de ditos grupos.
- Métodos Estructurais: Analizan as relacións existentes entre un grupo de variables representadas por sistemas de ecuacións simultáneas nas que se supoñen que algunhas delas (denominadas constructos) mídense con error a partir de outras variables observables denominadas indicadores. Os modelos utilizados constan, polo tanto, de duas partes: un modelo estrutural que especifica as relacións de dependencia existente entre as constructos latentes e un modelo de medida que especifica como os indicadores relaciónanse cos seus correspondentes constructos.