Distribución lognormal

Na Galipedia, a wikipedia en galego.

Log-normal
Función de densidade
Gráfico da Lognormal PDF
μ=0
Función de distribución
Grafico da Lognormal CDF
μ=0
Parámetros s \ge 0
-\infty \le \mu \le \infty
Soporte x \in [0; +\infty)\!
pdf \frac{e^{-[\frac{\ln(x)-\mu}{\sigma}]^2/2]}}{x\sigma \sqrt{2\pi}}
cdf \frac{1}{2}+\frac{1}{2} \mathrm{Erf}\left[\frac{\ln(x)-\mu}{\sigma\sqrt{2}}\right]
Media e^{\mu+\sigma^2/2}
Mediana eμ
Moda e^{\mu-\sigma^2}
Varianza (e^{\sigma^2}\!\!-1) e^{2\mu+\sigma^2}
Asimetría e^{-\mu-\sigma^2/2}(e^{\sigma^2}\!\!+2)\sqrt{e^{\sigma^2}\!\!-1}
Curtose e^{4\sigma^2}\!\!+2e^{3\sigma^2}\!\!+3e^{2\sigma^2}\!\!-6
Entropía \frac{1}{2}+\frac{1}{2}\ln(2\pi\sigma^2)
mgf (ver no texto os momentos)
Func. caract.

En probabilidade e estatísticas, a distribución log-normal é a distribución de probabilidade de calquer variable aleatoria con seu logaritmo normalmente distribuido (a base da función logarítmica non é importante xa que se loga X está distribuida normalmente si e solo si logb X está distribuida normalmente). Se X é unha variable aleatoria con unha distribución normal, entón exp(X) ten unha distribución log-normal.

"Log-normal" tamén se escribe "log normal" ou "lognormal".

Unha variable pode ser modelada como log-normal se pode ser considerada como o produto multiplicativo de moitos pequenos factores independentes. Un exemplo típico é o retorno a longo plazo de unha inversión nunha accion: pódese considerar como o produto dos retornos diarios.

A distribución log-normal ten a función densidade de probabilidade

f(x;\mu,\sigma) = \frac{1}{x \sigma \sqrt{2 \pi}} e^{-(\ln x - \mu)^2/2\sigma^2}

para x > 0, onde μ e σ son a media e a desviación estándar do logaritmo da variable. O valor esperado é

\mathrm{E}(X) = e^{\mu + \sigma^2/2}

e a varianza é

\mathrm{var}(X) = (e^{\sigma^2} - 1) e^{2\mu + \sigma^2}.

Índice

[editar] Relación coa media e a desviación estándar xeométrica

A distribución log-normal, a media xeométrica, e a desviación estándar xeométrica están relacionadas. Neste caso, a media xeométrica é igual a exp(μ) e a desviación estándar xeométrica é igual aexp(σ).

Se unha mostra de datos determínase que proven dunha poboación distribuida seguindo unha log-normal, a media xeométrica e a desviación estándar xeométrica pódense utilizar para estimar os intervalos de confianza tal como a media aritmética e a desviación estándar se usan para estimar os intervalos de confianza para un dato distribuido normalmente.

Límite do intervalo de confianza espazo log xeométrica
3σ límite inferior μ − 3σ \mu_\mathrm{geo} / \sigma_\mathrm{geo}^3
2σ límite inferior μ − 2σ \mu_\mathrm{geo} / \sigma_\mathrm{geo}^2
1σ límite inferior μ − σ μgeo / σgeo
1σ límite superior μ + σ μgeoσgeo
2σ límite superior μ + 2σ \mu_\mathrm{geo} \sigma_\mathrm{geo}^2
3σ límite superior μ + 3σ \mu_\mathrm{geo} \sigma_\mathrm{geo}^3

Onde a media xeométrica μgeo = exp(μ) e a desviación estándar xeométrica σgeo = exp(σ)

[editar] Momentos

Os primeiros momentos son:

\mu_1=e^{\mu+\sigma^2/2}
\mu_2=e^{2\mu+4\sigma^2/2}
\mu_3=e^{3\mu+9\sigma^2/2}
\mu_4=e^{4\mu+16\sigma^2/2}

ou de forma xeral:

\mu_k=e^{k\mu+k^2\sigma^2/2}.

[editar] Estimación de parámetros Maximum likelihood

Para determina-los estimadores que máis aproximan os parmámetros μ e σ da distribución log-normal, podemos utilizar o mesmo procedemonto que para a distribución normal. Para non repetilo, obsérvese que

f_L (x;\mu, \sigma) = \frac 1 x \, f_N (\ln x; \mu, \sigma)

onde por f_L (\cdot) denotamos a función de densidade de probabilidade da distribución log-normal, e por f_N (\cdot)— a da distribución normal. Polo tanto, utilizando os memos índices para denotar as distribucións, podemos escribir que

\begin{matrix}   \ell_L (x_1, x_2, ..., x_n; \mu, \sigma)   & = & - \sum _k \ln x_k + \ell_N (\ln x_1, \ln x_2, ..., \ln x_n; \mu, \sigma) = \\ \ & = & \operatorname {const} (\mu, \sigma) + \ell_N (\ln x_1, \ln x_2, ..., \ln x_n; \mu, \sigma). \end{matrix}

Xa que o primeiro termo é constante respecto a μ e σ, ambas funcións logarítmicas, \ell_L e \ell_N, obteñen o seu máximo co mesmo μ e σ. Por tanto, utilizando as fórmulas para os estimadores dos parámetros da distribución normal, e a inigualdade de arriba, deducimos que para a distribución log-normal cúmplese

\widehat \mu = \frac {\sum_k \ln x_k} n, \          \widehat \sigma^2 = \frac {\sum_k {\left( \ln x_k - \widehat \mu \right)^2}} n.

[editar] Distribución relacionadas

  • Y \sim N(\mu, \sigma^2) é unha distribución normal se Y = ln(X) e X \sim \operatorname{Log-N}(\mu, \sigma^2).
  • Se X_m \sim \operatorname {Log-N} (\mu, \sigma_m^2), \ m = \overline {1 ... N} son variables independentes log-normalmente distribuidas co mesmo parámetro μ e permitindo que varie σ, e Y = \prod_{m=1}^N X_m, entón Y é unha variable distribuida log-normalmente como: Y \sim \operatorname {Log-N} \left( \mu, \sum _m \sigma_m^2 \right).

[editar] Véxase tamén