O estudo permitirá o desenvolvimento de algoritmos de inteligência artificial conhecidos como transfer learning, para criar representações que poderão ser utilizadas como base para modelos com baixa disponibilidade de dados, como no caso de doenças emergentes e surtos. Esses novos algoritmos irão auxiliar os profissionais de saúde na tomada de decisão sobre diagnóstico e intervenção quando o conhecimento científico da área ainda não está estabelecido. O projeto tem como objetivo específico descobrir se é possível criar uma representação básica para problemas de saúde em geral, dado um conjunto suficiente de variáveis de baseline. Com o avanço do conhecimento científico em saúde, tem ocorrido um movimento em direção à especialização da formação médica e da prática clínica, esquecendo-se da semelhança dos problemas de saúde e suas origens em comum
Financiamento: Pró-Reitoria de Pesquisa da USP.
Coordenadores: Alexandre Chiavegatto Filho e André Filipe de Moraes Batista.
O projeto irá analisar os resultados de um estudo longitudinal de 502.632 indivíduos acompanhados desde 2006-2010, que coletou características socioeconômicas, demográficas, fatores de risco, informações sobre histórico de saúde, medidas antropométricas e amostras de sangue e de urina, totalizando mais de 600 variáveis. Serão testadas as performances de 17 modelos de machine learning para predizer óbito em 1, 2 e 5 anos por mortalidade geral e segundo grupos de causas básicas, utilizando as variáveis coletadas no baseline. O projeto permitirá identificar se é possível predizer com boa acurácia quem irá a óbito, e por qual causa, utilizando um grande número de características iniciais. O projeto estabelecerá uma nova parceria entre o Laboratório de Big Data e Análise Preditiva (LABDAPS) da FSP/USP e a Plataforma de Ciência de Dados Aplicada à Saúde da Fiocruz-RJ.
Financiamento: FAPESP.
Coordenadores: Alexandre Chiavegatto Filho, André Batista, Mariane Borba, Fernanda Fortti, Diego Barboza.
O Programa Mais Médicos é responsável por mais de 18 mil médicos que atuam em 4.058 municípios brasileiros. A análise do seu impacto na saúde, entretanto, traz desafios metodológicos devido à falta de aleatorização da intervenção e a diferenças pré-existentes entre os municípios, o que pode fazer com que os seus impactos não sejam facilmente identificados. O presente estudo tem como objetivo aplicar novas metodologias causais em crescente utilização em epidemiologia para testar o impacto do programa na situação de saúde e no acesso a serviços de saúde nos municípios brasileiros. A análise do efeito dos médicos na saúde de populações vulneráveis tem como objetivo auxiliar na formulação de políticas públicas na área da saúde, incentivando a alocação dos médicos em áreas onde terão um maior efeito.
Financiamento: CNPq.
Coordenadora: Alexandre Chiavegatto Filho, Joana Raquel Raposo dos Santos.
Using data from several meta-analyses and considering the association among risk factors, the main known risk factors for AD [low level of education, diabetes, systemic arterial hypertension (HBP), obesity, physical inactivity, depression and smoking] account for about 28% of cases of AD worldwide. Thus, it is imperative to better understand the pathophysiology of dementia, including the discovery of new risk factors. Predictors will be selected from a list of around 100 variables from the ELSA-Brasil dataset. We will test the following algorithms to predict cognitive impairment and decline: logistic regression with and without regularization, neural networks, gradient boosted trees and random forests. Hyperparameters will be optimized with 10-fold cross-validation. We also intend to use the Super Learner (SL) ensemble algorithm to test for any performance improvement. The area under receiver operating characteristic curve (AUROC) will be used as a metric for predictive performance.
Coordenador: André Filipe de Moraes Batista.
Colaboradoras: Claudia Kimie Suemoto, Laiss Bertola.