PAST: Paquete de programas de estadística paleontológica para enseñanza y análisis de datos.
Escrito por Øyvind Hammer, David A. T. Harper, y Paul D. Ryan (Natural History Museum, University of Oslo)
PAST (PAleontological STatistics) es un paquete estadístico de uso gratuito para sistemas Windows 7, Windows 10, y Mac OSX, que contiene muchos de los análisis estadísticos utilizados en paleontología, que también son útiles en arqueología. La entrada de datos se realiza en una hoja de cálculo similar a Excel, y desde allí se ejecutan numerosos tipos de análisis, incluyendo estadísticas multivariadas, bivariadas y univariadas, análisis de series, gráficos estadísticos y otras funciones. PAST viene con varios ejemplos de análisis de datos específicamente paleontológicos. Los autores del software solicitan que al publicar análisis que usen PAST, se cite el artículo: Hammer, Ø., Harper, D.A.T., Ryan, P.D. 2001. PAST: Paleontological statistics software package for education and data analysis. Palaeontologia Electronica 4(1):9pp. https://palaeo-electronica.org/2001_1/past/past.pdf
PAST se obtiene de la página http://www.nhm.uio.no/english/research/infrastructure/past/, de donde también se puede bajar el manual de usuario. El programa no requiere instalación: simplemente obtenga el ejecutable (la última versión es "Past4.03.exe") y actívelo con doble clic.
Al final de esta página hay archivos en formato usado por PAST con los ejemplos del libro guía de este curso.
Entrada de datos. Digitalice la información como se haría en una hoja de Excel. También puede abrir (File|Open) archivos Excel (.xls, pero no .xlsx), o archivos de texto (.txt) pero con formato adecuado (ver "Ejemplo1.xls" y "Ejemplo1.txt" abajo). Los archivos creados en Past se guardan como archivos de texto (.dat). Para asignar nombres a filas seleccione la opción Show|Row attributes y para asignar nombres a columnas Show|Column attributes. Estas opciones permiten también asignar otros atributos como son el tipo de variable (Grupo, Ordinal, Nominal, Binaria, Caracter) para el manejo numérico adecuado de las columnas, y el color y el símbolo para cada fila (para distinguir casos en las gráficas). Una vez editados esos atributos, quite la marca de selección, para adelantar los análisis. Si sus datos se dividen por grupos, debe crear una columna de tipo "Group" y seleccionarla, junto con las columnas de datos, al hacer los análisis. Si quiere que los grupos se distingan por color o símbolo, seleccione la columna tipo "Group" y use la opción Edit|Row colors/symbols. Si los datos son nombres de categorías de dos variables categóricas, se pueden convertir a una tabla de frecuencias con Edit|Rearrange|Value pairs to matrix.
Selección de datos. Antes de realizar un análisis o aplicar una función, el usuario debe seleccionar los datos sobre la hoja de cálculo. Para ello, es conveniente que las columnas y filas en donde están los datos a usar sean contiguas. Para mover las columnas o las filas, se debe seleccionar la opción "Drag rows/columns". Para seleccionar los datos se debe volver a la opción "Select". Se puede entonces seleccionar un rectángulo con cierta porción de los datos, o un número de columnas enteras o filas enteras seleccionando el nombre de columna o de fila. Para hacer una selección continua, se usa la tecla "Shift" y el ratón, y para hacer selección múltiple, se usa la tecla "Ctrl" y el ratón. La selección de datos debe corresponder al tipo de análisis que se realizará. Si el tipo de datos o el número de filas o columnas es incompatible, se generará un aviso de error.
Estadísticos. PAST realiza la función que se escoja el usuario sobre los datos seleccionados, incluso cuando ellos están en varias columnas. Tenga cuidado en hacer la selección de solamente los datos que quiere analizar. Luego, seleccione la función en el menú adecuado. PAST tiene módulos para transformar datos, graficarlos, realizar análisis univariados, multivariados, modelos, diversidad, series de tiempo, geometría, estratigrafía, scripts y ayuda.
Estadísticos básicos. Seleccione datos (una o más columnas enteras o una parte de los datos) y luego seleccione el módulo "Univariate" y la función adecuada (resumen estadístico, test de una muestra, test de dos muestras, Anova, etc.)
Gráficas básicas. Seleccione datos (una o más columnas enteras o una parte de los datos) y luego seleccione el módulo "Plot" y la función adecuada (gráfica lineal, gráfica XY, histograma, caja y puntos, etc.)
Regresión lineal. Seleccione datos de dos columnas, y luego Model|linear|Bivariate|Ordinary LS. Los resultados incluyen los estadísticos básicos (datos de la línea recta, coeficientes de correlación, t y p, así como los residuales y los reportes gráficos.
Correlación de orden de rangos. Seleccione datos de dos columnas, y luego Transform|Convert to ranks, y entonces Model|linear|Bivariate. De esta forma r será lo mismo que la rho de Spearman. También se puede obtener Rho sobre los datos originales, con Univariate|Correlation|Spearmans rs
Análisis multivariado. Seleccione datos de n columnas, y luego Multivariate|Ordination y seleccionar el análisis (PCA, PCoA, MDS, CA, etc.) Los resultados incluyen los reportes numéricos correspondientes y reportes gráficos. Para análisis de agrupamiento, seleccione Multivariate|Clustering, y el tipo de agrupamiento (clásico o jerárquico, de unión de vecinos o de k-medias). Los resultados son las pertenencias a los grupos (que se pueden incorporar al conjunto de datos) y los dos primeros también producen dendrogramas.
Extracción de resultados. Para extraer los resultados numéricos o gráficos, desde la ventana de resultados use el botón "Copy" y luego pegue en el documento correspondiente. Se pueden ajustar las gráficas antes de exportarlas con el botón "Graph settings" seleccionar el tipo (.pdf, .tiff, .jpg, etc) y luego "Save as" . Alternativamente, se puede imprimir (con el botón "Print").
Figura: Ejemplo de análisis en PAST, con filas diferenciadas.
Más información sobre análisis en PAST:
- Matrices de distancia con PAST
- Matrices de distancia en Excel, PAST y Mystat
- Análisis Multivariado de Ixcaquixtla en Excel, Mystat y PAST
- Escalamiento Multidimensional en PAST
- Análisis de Componentes Principales en Mystat y PAST
- El análisis de agrupamientos “cluster” por casos en PAST
- Análisis del vecino más cercano en PAST
- Agrupamiento por K-medias en Mystat y PAST
Tutoriales en video sobre PAST
Introducción a PAST (Hector Aponte)
Índices de similitud en PAST (Maria Evarista Arellano Garcia)
Páginas web sobre PAST
https://palaeo-electronica.org/2001_1/past/pastprog/
PAST: PALEONTOLOGICAL STATISTICS SOFTWARE PACKAGE FOR EDUCATION AND DATA ANALYSIS