O evento ocorrerá nos dias 25 e 26 de setembro de 2025
Palestrante: Dr. Paulo Justiniano Ribeiro Junior
Resumo: Serão apresentados trabalhos diversos desenvolvidos com colaboradores diversos, sendo a maior parte com temas de estatística espacial.
Palestrante: Dra. Daiane Aparecida Zuanetti
Resumo: Non-homogeneous hidden Markov models are a statistical paradigm in which a sequence of non-observable states generates a sequence of observations. Transitions between the non-observable states are controlled by transition coefficients and covariates. Because variable selection has been hardly explored for this model, the central purpose of this study is to propose scalable variable selection methods which improve predictive performance of the model. We propose two versions of the LASSO for the non-homogeneous hidden Markov model. The proposals consistently show better predictive performance than ARIMA and Penalized Linear Regression and very good performance when predicting the non-observable state sequence which generates the observable values. In terms of coefficient shrinkage efficiency, the proposals show excellent performance in all simulation scenarios when selecting variables via coefficient shrinkage. Finally, the methods are applied to characterize and predict the rainfall regime in the city of São Carlos, Brazil. This is a joint work with Gustavo Alexis Sabillón and partially funded by FAPESP in process 2024/00413-8.
Palestrante: Dr. Manuel Jesus Galea Rojas
Resumo: Binary regression models utilizing logit or probit link functions have been extensively employed for examining the relationship between binary responses and covariates, particularly in medicine. In this study, we introduce a diagnostic method associated with a novel family of link functions enabling the assessment of sensitivity for symmetric links in relation to their asymmetric counterparts. This new family offers a comprehensive model encompassing nested symmetric cases. Our method proves beneficial in modeling medical data, especially when evaluating the sensitivity of the commonly used logit link function, prized for its interpretability via odds ratio. Monte Carlo simulations are conducted to evaluate both the diagnostic method performance and parameter estimation of the general model, supplemented by applications to real data sets.
Palestrante: Dr. Miguel Angel Uribe Opazo
Resumo: Caracterizar a variabilidade espacial de dados agrícolas é uma etapa fundamental na Agricultura de Precisão, especialmente no manejo do solo e na criação de unidades de manejo diferenciadas para o aumento da produtividade. Modelar a estrutura de dependência espacial por meio de métodos geoestatísticos é de grande importância para estimar com eficiência os parâmetros que definem essa estrutura e realizar interpolação baseada na krigagem. Este trabalho apresenta técnicas de diagnóstico de influência global, local e alavancagem generalizada, utilizando o deslocamento da esperança condicional do logaritmo da verossimilhança conjunta, chamada Q-function. Esses métodos são usados para identificar a presença de observações influentes que podem interferir nas estimativas dos parâmetros, na seleção do modelo geoestatístico e na construção do mapa da variabilidade espacial. Para estudar dados espacialmente correlacionados, utilizamos a modelagem espacial linear com distribuição t-student reparametrizada. Essa distribuição tem sido usada como alternativa à distribuição normal quando os dados apresentam valores discrepantes, possuindo a mesma forma da matriz de covariâncias que a distribuição normal, o que permite uma comparação direta entre elas. A metodologia é ilustrada com um conjunto de dados reais e os resultados mostraram uma modelagem mais robusta na presença de observações influentes.
Palestrante: Dra. Carina Friedrich Dorneles
Resumo: A Ciência de Dados costuma ser associada a estatísticas avançadas, modelagem e aprendizado de máquina. No entanto, antes de qualquer análise ser realizada, há o trabalho essencial da engenharia de dados. Esta palestra tem como objetivo mostrar como a engenharia de dados estrutura o ciclo de vida da informação, desde a coleta em múltiplas fontes até a disponibilização em ambientes analíticos. Discutiremos práticas de integração, transformação e governança de dados, bem como arquiteturas modernas que suportam análises em larga escala. O objetivo é apresentar como se beneficiar dessa infraestrutura, entendendo seus limites, possibilidades e como potencializar resultados em projetos de ciência de dados.
Palestrante: Dra. Silvana Schneider
Resumo: Neste trabalho, apresentamos abordagens baseadas em modelos de fração de cura com censura dependente. A associação entre tempos de falha e censura dependente pode ser acomodada através do modelo de fragilidade ou através das funções cópula. As distribuições marginais são ajustadas pelas distribuições Weibull e exponencial por partes (PE). Os resultados do estudo de simulação mostram um viés relativo pequeno e probabilidade de cobertura próxima ao valor nominal. Com o objetivo de avaliar a adesão ao tratamento da Tuberculose (TB) e seus resultados subsequentes, considerando uma amostra de pacientes coinfectados por TB/HIV da Coorte Alvorada, um estudo epidemiológico realizado em Alvorada, Rio Grande do Sul.
Palestrante: Dra. Gabriela Bettella Cybis
Resumo: Modelos filogeográficos combinam dados de sequências genéticas e informações geográficas para inferir taxas de migração e padrões de dispersão espacial ao longo da história evolutiva de organismos. Esses modelos são amplamente utilizados na investigação de epidemias virais, como COVID-19, influenza e HIV, possibilitando reconstruir a origem geográfica de surtos, reconstruir sua disseminação espacial e identificar fatores determinantes da migração viral. Entretanto, é amplamente reconhecido que modelos discretos de difusão filogeográfica bayesiana são sensíveis a viéses amostrais, sobretudo em cenários onde limitações técnicas e de recursos comprometem a representatividade espacial das amostras em relação à prevalência real. Uma das abordagens mais comuns para minimizar esse impacto é realizar subamostragem dos dados observados. A fim de contornar esse problema, propomos o Bias-correcting Subsampling Trait Model (BSTM), uma nova abordagem para o cálculo da verossimilhança em processos com estados discretos sobre árvores filogenéticas. O BSTM busca corrigir o viés amostral sem necessidade de descartar dados, utilizando um modelo de mistura baseado em múltiplas árvores subamostradas, ponderadas por informações externas sobre frequências populacionais reais.
Palestrante: Dr. Diego Ramos Canterle
Título: Robust estimation via maximum Lq-likelihood estimator in a multivariate normal regression model with general parameterization
Resumo: This work addresses the maximum L$_q$-likelihood estimator in a multivariate normal regression model with general parameterization. We have derived the necessary quantities to make inferences which are explained in detail for three specific cases, namely, heteroscedastic nonlinear regression models, errors-in-variables models and mixed models. To evaluate the performance of our proposal, we conduct Monte Carlo simulations. Finally, we apply our method to real-world data.
Palestrante: Dr. Marcos Braz Vaz
Título: Tamanho amostral e poder do teste em experimentos com bovinos de corte
Resumo: O planejamento experimental é essencial para garantir a qualidade e a confiabilidade das pesquisas em produção animal. Esta palestra apresenta uma abordagem para a estimativa do tamanho amostral em experimentos com bovinos de corte, destacando o cálculo do número de repetições por tratamento em diferentes delineamentos com ANOVA. O método utiliza o estimador de Cohen para relacionar tamanho de efeito, poder do teste e erros do tipo I e II, permitindo identificar valores adequados de r que garantam maior precisão estatística, com o objetivo de orientar o pesquisador no equilíbrio entre rigor estatístico, viabilidade prática e bem-estar animal.
Palestrante: Dra. Amanda Merian
Título: Parametric quantile regression models: an overview
Resumo: Quantile regression is a flexible modeling framework that allows researchers to investigate the effects of covariates on the conditional quantiles of a response variable across the entire distribution, rather than focusing solely on the mean. Compared to regression models for the mean, it provides a better characterization of the quantities of interest and simpler interpretations than nonparametric regression. Although there is a growing literature in this area, most studies consider distribution-free approaches or semiparametric approaches. In this presentation, I will introduce general notions about parametric quantile regression models and, through an application to real data, illustrate the use of these models in health sciences, highlighting their ability to capture diferente effects in subgroups of individuals.
Andrea Schwertner Charão é Doutora em Informatique: Systèmes et Communications pelo Institut National Polytechnique de Grenoble (INPG), na França, é Professora Titular do Departamento de Linguagens e Sistemas de Computação do Centro de Tecnologia da UFSM. Com experiência internacional, visão global e conexões interdisciplinares, integra ensino, pesquisa e extensão em iniciativas que combinam expertise em Computação. Traduz lógica em insight, códigos em soluções e curiosidade em prática, sempre com foco em gerar impacto real.
Carina Friedrich Dorneles é Professora no Departamento de Informática e Estatística (INE) da UFSC. Membro do CD-CEBD 2018/2020 ( Comitê Diretivo da Comissão Especial de Banco de Dados - DB Steering Committee). Membro da Comissão de Avaliação Trienal Capes 2014/2016 e Quadrienal Capes 2017/2020. Bolsista PQ 2 - CNPQ de março/2011 a março/2017. Atua em pesquisa, ensino e orientação nos níveis de IC, graduação, mestrado e doutorado. Em 2016, atuou como Coordenadora do CTIC/SBC e Coordenadora do WTDSI do SBSI/SBC, além de membro do Comitê Especial de Avaliação da FAPERGS em 2016. Seus interesses de pesquisa incluem as áreas de Gerenciamento de Dados, Recuperação de Informação, Mineração de Dados com ênfase na Web, Descoberta de Conhecimento e Extração e Matching de Informação. Atua como revisora Ad hoc de agências de fomento como CNPq, Capes, FAPESC, FAPERGS e FAPESP, bem como CTIC/RNP. Participa como revisora de artigos em periódicos e eventos nacionais e internacionais desde 2000. Participa de projetos de colaboração internacional, dentre eles o projeto VIDAS, com a França, dentro do programa CAPES/COFECUB. Em 2005, foi co-idealizadora da Escola Regional de Banco de Dados, e da Sessão de Demos do Simpósio de Banco de Dados. Atuou como Editora da Coluna Bits, Bytes e Batom da revista eletrônica SBC Horizontes.
Jodavid de Araujo Ferreira é Professor do Departamento de Estatística da Universidade Federal de Pernambuco (UFPE) e do Programa de Pós-Graduação em Estatística da UFPE (PPGEST). Realizou um Pós-Doutorado no Programa de Pós-Graduação em Modelos de Decisão e Saúde na UFPB (2021-2024). Possui doutorado em em Estatística pela UFPE (2021), mestrado em Estatística pela UFPE (2017) e graduação em Estatística pela UFPB (2015). É entusiasta de software livre e de código aberto (free and open-source software - FOSS) e procura estar sempre atualizado em avanços tecnológicos e temas relacionados à Inteligência Artificial. Desenvolve pesquisas em áreas da estatística como Ciência de Dados, Aprendizagem Estatística de Máquina, Estatística Computacional, Aprendizado Supervisionado (classificação), Aprendizado Não Supervisionado (segmentação, clusterização), distribuições de Probabilidade, Probabilidade Fuzzy, testes de hipótese, inferência estatística, teoria da informação e IA Generativa aplicados a dados estruturados e não estruturados como processamento de imagens.
Walmes Marques Zeviani é Engenheiro Agrônomo pela Universidade Federal da Grande Dourados (2003-2007) e Mestre (2008-09) e Doutor (2009-13) em Estatística & Experimentação Agropecuária pela Universidade Federal de Lavras. Professor Adjunto III do Departamento de Estatística da Universidade Federal do Paraná (2010-hoje). Atua principalmente com ensino no Curso de Bacharel em Estatística e na Especialização em Data Science & Big Data (UFPR). Tem experiência com cursos de capacitação do software R para planejamento e análise de experimentos, modelos de regressão linear e não linear, manipulação e visualização de dados e construção de interfaces gráficas e pacotes R.