Aportes a la Estadística
Blaise Pascal
Blaise Pascal (Clermont-Ferrand, Francia, 1623) fue un matemático, físico, filósofo y teólogo francés. Falleció el 19 de agosto de 1662 en París.
A los 18 años Pascal inventó la primera calculadora, para ayudar a su padre con las cuentas.
El desarrollo que Blaise Pascal hizo en el campo de la teoría de la probabilidad fue su contribución más influyente en el campo de las matemáticas.
La correspondencia con otro matemático, Fermat, dio lugar al tratamiento matemático las investigaciones sobre los índices de mortalidad, muy útiles a las compañías de seguro de esa época.
También dieron origen a los primeros análisis sobre las probabilidades aplicadas a los juegos de azar, algunos de cuyos resultados fueron dados a conocer en la obra de Pascal Tratado del triángulo aritmético que tiene aplicaciones de la teoría de las probabilidades, con las que argumentó el problema “la ruina del jugador”, obra que es considerada como pionera del análisis moderno sobre el proceso de tomar decisiones, aunque los aportes no están en sus trabajos matemáticos sino en su obra Pensamientos, que son reflexiones sobre la religión.
Sin embargo, debe tenerse en cuenta que Pascal y Fermat, a pesar de realizar importantes labores de inicio de la teoría de la probabilidad, no desarrollaron mucho el campo.
La teoría de probabilidad se ocupa de asignar un cierto número a cada posible resultado que pueda ocurrir en un experimento aleatorio, con el fin de cuantificar dichos resultados y saber si un suceso es más probable que otro.
George Box
George Edward Pelham Box nació el 8 de octubre de 1919 en Gravesend, Kent, Inglaterra y falleció el 28 de marzo de 2013, Madison, Wisconsin, Estados Unidos.
Fue químico, matemático, estadístico inglés, en el área de la estadística realizó importantes contribuciones en las áreas de Control de Calidad, Análisis de Series Temporales, Diseño de Experimentos y la Inferencia Bayesiana.
Durante la Segunda Guerra Mundial, trabajó en experimentos bioquímicos sobre el efecto de gases tóxicos en los animales pequeños para el ejército británico. Necesitaba asesoramiento estadístico para analizar los resultados de sus experimentos, pero no pudo encontrar un estadístico que podría darle orientación, por lo que él mismo estudio la estadística de los textos disponibles. Después de la guerra, se matriculó en la Universidad College de Londres y obtuvo una licenciatura en matemáticas y estadística.
El estadístico George Box acuñó, en 1953, el término robustez, para designar los métodos estadísticos que procuran asegurar resultados aceptables, cuando no se cumplen los supuestos estándares en que se basan los métodos estadísticos regulares. Ya desde fines del siglo pasado hubo científicos que se preocuparon del tema. Se dieron cuenta de los peligros de hacer inferencias, cuando los datos aparecen contaminados con valores extraños, y llegaron a proponer modelos y estimadores robustos como alternativas para estos casos. Sin embargo, no es sino a partir de la década de 1960, que este tópico es reconocido como un tema de investigación en estadística.
Las transformaciones de Box y Cox son una familia de transformaciones potenciales usadas en estadística para corregir sesgos en la distribución de errores, para corregir varianzas desiguales (para diferentes valores de la variable predictora) y principalmente para corregir la no linealidad en la relación (mejorar correlación entre las variables).
Karl Pearson
Nació en Londres el 27 de marzo de 1857 y falleció el 27 de abril de 1936, fue un prominente científico, matemático y pensador británico, que estableció la disciplina de la estadística matemática. Desarrolló una intensa investigación sobre la aplicación de los métodos estadísticos en la biología y fue el fundador de la bioestadística.
Pero sin duda su contribución más importante es al nacimiento de la Estadística Aplicada. Es por lo que le debemos el mayor crédito, en frase de él mismo "Hasta que los fenómenos de cualquier rama del conocimiento no hayan sido sometidos a medida y número, no se puede decir que se trate de una ciencia".
Introdujo el método de los momentos para la obtención de estimadores, el sistema de curvas de frecuencias para disponer de distribuciones que pudieran aplicarse a los distintos fenómenos aleatorios, desarrolló la correlación lineal para aplicarla a la teoría de la herencia y de la evolución. Introdujo el método de la χ2 para dar una medida de ajuste entre datos y distribuciones, para contrastar la homogeneidad entre varias muestras, y la independencia entre variables.
Las curvas de Distribución de Frecuencia: permiten examinar los Estadísticas de Tendencia Central, estas se grafican en una curva de distribución de frecuencia, donde en el eje horizontal se colocan las puntuaciones de izquierda a derecha, desde la más baja hasta la más alta respectivamente.
Una Curva de Distribución de Frecuencias es un sustituto de un histograma o polígono de frecuencia, los cuales se sustituyen por una curva, ella será una estimación de la forma como se distribuyen las puntuaciones en la población. Es importante destacar que el área bajo la curva representa el número total de individuos en la población y es igual a un porcentaje de 100%.
Método de los momentos: consiste en igualar los momentos poblacionales (que sean función del o los parámetros a estimar) con los momentos muestrales y despejar el parámetro a estimar.
Coeficiente de correlación lineal: Es una medida de la relación lineal entre dos variables aleatorias cuantitativas. A diferencia de la covarianza, la correlación de Pearson es independiente de la escala de medida de las variables.
Método de la distancia de la X2: Lo introduce para dar una medida del ajuste entre una distribución de probabilidad y una muestra.
La idea es, dada la muestra (x1, x2,... xn) y la distribución f(x/θ) construir el estadístico
Que se distribuye χ2k-1, si la muestra proviene de la distribución. Donde se supone realizada una partición de k elementos en el recorrido de la distribución, con lo que lo valores Yi, las frecuencias observadas de los xi en el elemento i de la partición, puede suponerse con distribución multinomial, e yi son las frecuencias observadas bajo la hipótesis de que la distribución de la muestra es f(x/θ).