Componente Curricular: Estatística Multivariada I
Código: 1114205
Créditos: 04
Carga Horária: 60 horas
Pré-Requisito: Análise de Regressão (1114207)
Unidade Responsável: UAEst/CCT
Ementa
Vetores aleatórios. Vetor de médias e matriz de covariâncias. Normal multivariada. Componentes principais. Análise fatorial. Agrupamento. Discriminante. Análise de correspondência. Análise de correlações canônicas.
I - Objetivos
Capacitar o aluno para o entendimento e compreensão de diversas técnicas de análise multivariada.
II - Conteúdo Programático
UNIDADE 1: INTRODUÇÃO. Vetores aleatórios. Vetor de médias. Matriz de covariância. Matriz de correlação.
UNIDADE 2: A DISTRIBUIÇÃO NORMAL MULTIVARIADA. Introdução. Função densidade de probabilidade conjunta da normal multivariada. Propriedades. Distribuições marginais e condicionais.
UNIDADE 3: A DISTRIBUIÇÃO MULTINOMIAL.Caracterização como uma distribuição multivariada. Vetor de médias e matriz de covariância. Distribuição marginal de uma variável e distribuição conjunta de duas variáveis aleatórias. Distribuição condicional.
UNIDADE 4: DADOS MULTIVARIADOS. Matriz de dados. Vetor de médias amostral. Matriz de covariância amostral. Matriz de correlação amostral. Simulação de amostras da normal multivariada usando o R.
UNIDADE 5: ANÁLISE DE AGRUPAMENTOS (CLUSTERING). Objetivos e motivação a partir de um estudo piloto. Medidas de similaridade e de dissimilaridade. Coeficientes de parecença. Dendrograma. Matriz cofenética. Medidas de distâncias para variáveis nominais e ordinais. Métodos hierárquicos: single linkage, complete linkage, average linkage. Método K-means.Aplicações usando o R.
UNIDADE 6: ANÁLISE DE COMPONENTES PRINCIPAIS. Objetivos. Obtenção das componentes principais. Proporção da variação total explicada pelas componentes principais. Representação gráfica das componentes principais. Componentes principais amostrais.Aplicações usando o R.
UNIDADE 7: ANÁLISE FATORIAL. Objetivos. O modelo fatorial ortogonal. Comunalidade e variância específica. Estimação das cargas pelas componentes principais e por máxima verossimilhança. Rotação de fatores. Rotação varimax. Aplicações usando o R.
UNIDADE 8: DISCRIMINAÇÃO E CLASSIFICAÇÃO. Objetivos básicos de classificação, Cálculo de probabilidade de classificação errada, Probabilidade total de classificação errada (TPM). Custo de classificação errada. Valor esperado do custo de classificação errada (EMC) .Minimização do ECM. Funções discriminantes de Fisher (linear e quadrática) . Funções discriminantes amostrais. Avaliação de funções de classificação. Classificação com várias populações. Método de Fisher para discriminar várias populações. Classificação com variáveis qualitativas (regressão logística).
UNIDADE 9: ANÁLISE DE CORRELAÇÕES CANÔNICAS. Objetivos básicos. Variáveis canônicas e correlações canônicas. Interpretação.
UNIDADE 10: ANÁLISE DE CORRESPONDÊNCIA. Formulação Matemática. Decomposição em coordenadas principais. Representação gráfica das coordenadas principais
III - Referências Bibliográficas
Bibliografia Básica:
ANDERSON, R. E.; TATHAM, R. L.; BLACK, W. C.; HAIR, J. F.; BABIN, B. J. Análise Multivariada de Dados. 6. ed. Porto Alegre: BOOKMAN, 2009.
CHAN, B.; SILVA, F. L.; FAVERO, L. P.; BELFIORE, P. Analise de Dados. Modelagem Multivariada para Tomada de Decisões. Rio de Janeiro: Campus, 2009.
MINGOTO, S. A. Análise de Dados Através de Métodos da Estatística Multivariada. Belo Horizonte: Editora UFMG, 2005.
Bibliografia Complementar:
ANDERSON, T. W. An introduction to multivariate statistical analysis. 2. ed. New York: John Wiley, 1984.
JOHNSON, R. A.; WICHERN, D. W. Applied Multivariate Statistical Analysis. 5. ed. New Jersey: Prentice Hall, 2002.
OLIVEIRA, F. E. M. SPSS Básico para Análise de Dados. Rio de Janeiro: Ciência Moderna, 2008.
Multivariate Statistics. Uma visão geral e descrição de packages do R relacionados com análise de dados multivariados.
Disponível em http://cran.fiocruz.br/web/views/Multivariate.html.