O evento ocorrerá no dia 24 de setembro de 2025
Palestrante: Felipe Queluz (UFPR)
Resumo: Processamento paralelo é a execução simultânea de diferentes partes de uma tarefa ou de múltiplas tarefas em vários núcleos (cores) de processamento. Esta oficina visa apresentar uma introdução a técnicas de processamento paralelo na linguagem R, além de expor uma breve exposição teórica sobre o tema. Tais técnicas são úteis para usuários interessados em alavancar recursos computacionais e, em especial, poupar tempo na execução de seus scripts. Serão tratados especificamente dos pacotes desenvolvidos para essa finalidade, expondo suas sintaxes e aplicações.
Pré-requisitos: Conhecimentos intermediários em R, em especial da família “apply” de funções.
Palestrante: Dra. Taiane Schaedler Prass (UFRGS)
Resumo: Este minicurso oferece uma introdução concisa e prática aos princípios essenciais para o desenvolvimento de pacotes em R. Voltado para aqueles que desejam organizar e compartilhar seu código de forma estruturada, o curso abordará desde a configuração inicial até a documentação básica, permitindo que os participantes compreendam o fluxo de trabalho para criação de pacotes.
Pré-requisitos: Noções básicas de programação em R e familiaridade com a criação de funções.
Palestrante: Dra. Márcia Helena Barbian (UFRGS)
Resumo: Nesta oficina, os participantes serão introduzidos ao Shiny, pacote do R que permite criar aplicações web interativas, sem necessidade de conhecimentos em HTML, CSS ou JavaScript. Serão apresentados os fundamentos do desenvolvimento com Shiny, incluindo a estrutura básica de um aplicativo, o conceito de reatividade, inputs e outputs, além de exemplos interativos com visualizações dinâmicas usando o ggplot2. A oficina terá enfoque prático e introdutório, ao final, os participantes estarão aptos a desenvolver uma aplicação funcional básica, podendo utilizar os conceitos aprendidos em seus próprios projetos.
Pré-requisitos: conhecimentos básicos de R.
Palestrante: Dr. Wagner Hugo Bonat (UFPR)
Resumo: Este tutorial tem como objetivo apresentar aplicações de Large Language Models (LLMs) no contexto da Ciência de Dados. A partir do pacote ellmer, serão exploradas técnicas de análise de textos, tais como análise de sentimentos, extração de entidades nomeadas e clusterização de documentos. Serão discutidas também estratégias para estruturar dados a partir de texto não estruturado e formas de estender a capacidade dos LLMs por meio da integração com funções específicas. Por fim, será introduzida a técnica de Retriever Augmented Generation (RAG), destacando sua fundamentação conceitual e exemplificando sua implementação prática com o pacote ragnar.
Pré-requisitos: Conhecimentos básicos de R.
Pacote Spada (Shiny Package for Data Analysis)
Estruturação da Composição Racial em Rebanho Brangus: Fundamentos para Avaliações Genéticas em Sistemas Multirraciais
Desenvolvimento de aplicativo em Shiny para Visualização de Dados Meteorológicos no Rio Grande do Sul
OxSR: Soil Iron Oxides via Diffuse Reflectance (Óxidos de ferro do solo via refletância difusa)
Análise Interativa dos Dados do SINASC por meio de Aplicativo Shiny
Risco de Crédito com Transparência: Uma Abordagem Explicável com Random Forest
Palestrante: Dr. José Jairo de Santana e Silva (UFPR)
Resumo: Este mini-tutorial apresentará o Positron, o novo Ambiente de Desenvolvimento Integrado (IDE) da Posit, antiga RStudio, Inc. Construído sobre a plataforma do Visual Studio Code (VS Code), o Positron foi desenhado para unificar o fluxo de trabalho de cientistas de dados, permitindo uma colaboração eficaz entre equipes que utilizam múltiplas linguagens, especialmente R e Python. Durante a apresentação, exploraremos as primeiras impressões da interface, combinando a flexibilidade do VS Code com ferramentas especializadas conhecidas do RStudio (como visualizador de plots, ambiente de variáveis e gerenciamento de pacotes). Abordaremos também o suporte robusto ao Python, a gestão de projetos mistos (incluindo Quarto e notebooks Jupyter) e funcionalidades essenciais para interoperabilidade, como a integração com Git.
Palestrante: Dr. Jodavid de Araujo Ferreira (UFPE)
Resumo: O MLOps, ou DevOps para Machine Learning, é uma abordagem que combina os princípios de desenvolvimento e operações de software (DevOps) com práticas específicas para o ciclo de vida dos modelos de aprendizado de máquina. Esta conferência visa familiarizar os participantes com as práticas de MLOps utilizadas no mercado, destacando o uso da linguagem R. Serão apresentados pontos como metodologias e ferramentas para gerenciar as etapas do ciclo de vida dos modelos de aprendizado de máquina, oferecendo uma visão prática do campo de operações com esses modelos.
Palestrante: Dr. Tiago Olivoto (UFSC)
Resumo: O plimanshiny é um aplicativo Shiny que amplia as funcionalidades do pacote R pliman, com foco em fenotipagem de alto rendimento a partir de imagens capturadas por celular, drones ou satélites. O aplicativo está sendo construído utilizando a framework golem, adotando uma estratégia de modularização, na qual cada conjunto de funcionalidades é organizado em módulos independentes. Isso torna o aplicativo mais escalável, de fácil manutenção e com maior potencial de integração de novos recursos, permitindo que diferentes análises sejam adicionadas sem comprometer a estrutura já existente. Na conferência, será apresentada a motivação por trás da criação de uma interface gráfica em Shiny para o pliman, destacando a democratização do acesso às análises. Também serão discutidos os primeiros passos do desenvolvimento, os desafios enfrentados e a curva de aprendizado observada na implementação dos módulos, oferecendo uma visão prática e aplicada desse processo.
Tiago Olivoto é Professor Adjunto no Departamento de Fitotecnia da Universidade Federal de Santa Catarina (UFSC), onde coordena o programa de melhoramento genético do linho do Núcleo de Estudos e Pesquisas em Experimentação e Melhoramento Vegetal (NEPEM). Desenvolve atividades relacionadas ao planejamento, condução e análise de experimentos com culturas anuais, com foco no aprimoramento de métodos estatísticos e experimentais para a avaliação de ensaios multi-ambientes no contexto do melhoramento genético de plantas. É autor dos pacotes metan e pliman para o software R, amplamente utilizados em análises estatísticas e fenotípicas, e do aplicativo PlimanShiny, voltado para a implementação de pipelines de fenotipagem de alto rendimento.
Alessandro Dal' Col Lucio possui graduação em Agronomia pela Universidade Federal do Espirito Santo (1994), mestrado em Agronomia pela Universidade Federal de Santa Maria (1997), doutorado em Agronomia (Produção Vegetal) [Jaboticabal] pela Universidade Estadual Paulista Júlio de Mesquita Filho (1999) e pós-doutorado no Instituto Politécnico de Bragança [Portugal] (2015). É professor titular do Departamento de Fitotecnia do Centro de Ciências Rurais da Universidade Federal de Santa Maria e líder do grupo de pesquisa Experimentação registrado no CNPq. Atualmente é membro associado da Região Brasileira da Sociedade Internacional de Biometria - RBRAS, da International Biometric Society e da Sociedade Brasileira para o Progresso da Ciência - SBPC. Editor de área (Estatística), nas revistas científicas Ciência Rural, Brazilian Journal of Biometrics, Sigmae e Revista Brasileira de Fruticultura. Diretor do Centro de Ciências Rurais da Universidade Federal de Santa Maria. Tem experiência na área de Probabilidade e Estatística, com ênfase em Experimentação Agrícola, atuando principalmente nos seguintes temas: planejamento de experimentos, precisão experimental, relações lineares e não lineares, análise multivariada, amostragem e variabilidade.
Márcia Helena Barbian possui graduação em Estatística pela Universidade Federal do Rio Grande do Sul (2006), mestrado em Estatística pela Universidade Federal de Minas Gerais (2010) e doutorado em Estatística pela Universidade Federal de Minas Gerais (2016). Atualmente é professora adjunta da Universidade Federal do Rio Grande do Sul. Tem interesse na área de Probabilidade e Estatística, com ênfase nos seguintes temas: Estatística Espacial e Machine Learning.
Deisy Morselli Gysi é docente no Departamento de Estatística da Universidade Federal do Paraná (UFPR). Graduou-se em Biotecnologia pela Pontifícia Universidade Católica do Paraná (PUC-PR) em 2011, seguida de uma segunda graduação em Estatística pela UFPR em 2013. Em 2019, obteve seu doutorado em Ciência da Computação pela Universität Leipzig. Atuou como Pesquisadora Associada no BarabasiLab, do Network Science Institute, na Northeastern University, e atua como Trainee de Pesquisa na Channing Division of Network Medicine, na Harvard Medical School – Brigham and Women's Hospital e no Veteran Affairs (VA) – Boston. Seus interesses de pesquisa concentram-se na identificação de biomarcadores para doenças complexas associadas a respostas autoimunes, transtornos mentais e outras condições. Além disso, dedica-se ao desenvolvimento de métodos para a reutilização de medicamentos destinados a doenças negligenciadas e tropicais. Sua abordagem combina diversas técnicas, incluindo análise multiômica, aprendizado de máquina estatístico e análise de redes. Recentemente, teve a honra de participar da edição especial da revista Nature, que celebrou os 20 anos do Projeto Genoma Humano.
Anderson Ara é Professor Adjunto da Universidade Federal do Paraná (UFPR), campus Curitiba-PR, Departamento de Estatística (DEst) do Setor de Ciências Exatas. Graduado (2009) e Mestre (2011) em Estatística pela Universidade Federal de São Carlos (UFSCar). Doutor em Estatística (2016) através dos Programas de Pós-graduação em Estatística (PPGEst-UFSCar) e Pós-graduação em Ciência da Computação (PPG-CC-UFSCar). Foi Professor Visitante na University of Toronto (UofT), Toronto-ON, Canadá (2023), Professor Adjunto da Universidade Federal da Bahia (2017-2021) e Professor da Faculdade de Tecnologia SENAI-SP (2009-2015). Docente da Especialização em Data Science & Big Data (DSBD-UFPR) e MBA em Advanced Analytics e Business Optimization (AABO-UFPR). Pesquisador do Programa de Pós-Graduação em Informática (PPGInf-UFPR) e do Programa de Pós-Graduação em Métodos Numéricos (PPGMNE-UFPR). Coordenador do DataSci Labs UFPR. Atua principalmente nas seguintes áreas: Aprendizado Estatístico de Máquina, Inferência Estatística e Métodos Computacionais. Possui mais de 50 artigos publicados na área de aprendizado de máquina e 20 prêmios nacionais e internacionais. Bolsista MEC/FNDE (2022-2028). Maiores detalhes em leg.ufpr.br/~ara.