IFPR-Labtelecom, Monitor COVID-19

Com base nos dados dos boletins da Secretaria da Saúde do Estado do Paraná, o Labtelecom está monitorando a situação da COVID-19 no Estado do Paraná e na cidade de Curitiba. O Servidor de rede principal (ALS) monitora periodicamente o site e realiza a coleta, processamento e apresentação dos dados. Quando não é emitido o boletim diário o sistema simplesmente repete os dados do dia anterior. Além disso, é calculada a taxa de letalidade no Estado, o percentual de casos confirmados na Capital e analisada a taxa de evolução dos casos. Nos casos confirmados e óbitos são contabilizados o total de casos no Estado do Paraná, porém não estão sendo considerados os casos de residentes fora do Estado.

Com base nesses dados são utilizados dois modelos de previsão de curto prazo (1 e 2) visando estimar os casos dos próximos 5 dias. Esse modelos são lineares e projetam uma reta ao longo da curva de total de casos. Essa característica resulta em erros maiores no início e final da curva. Importante salientar, que no trecho linear da curva de total de casos os erros diminuem bastante e ficam constante. Nessa situação específica ocorre o período de pico da epidemia que teoricamente seria no ponto de inflexão da curva.

Um outro modelo de previsão (3) determina o número de casos confirmados utilizando como base a regressão de uma progressão geométrica com dois coeficientes (A e B). O sistema calcula 2000 equações e classifica as duas com menores erros estatísticos, respectivamente. Um modelo de previsão (4) realiza uma extrapolação de dados do modelo (3) e utiliza uma combinação com 18000 equações em 6 possíveis cenários para estimar o ciclo final da epidemia, o total de casos confirmados e a previsão do pico da epidemia no Estado do Paraná. Esse sistema é dinâmico, isto significa que os coeficientes de equação e cenários mudam com base nos resultados diários.

Avisos:

01- Conforme Nota Oficial não foram emitidos os Informes Epidemiológicos de 08/08/2020 e 09/08/2020 devido instabilidades nos sistemas da Sesa/PR. Mais informações no comunicado oficial: http://www.saude.pr.gov.br/Noticia/Parana-soma-88978-casos-e-2319-obitos-pela-Covid-19

02- Os dados de 08/08/2020 a 10/08/2020 foram atualizados com base no informe da Sesa/PR http://www.saude.pr.gov.br/Noticia/Saude-informa-93139-confirmacoes-e-2370-obitos-pela-Covid-19 

03- Os dados de 08/08/2020 a 10/08/2020 referente aos casos totais de Curitiba e de pacientes recuperados não foram divulgados e foram repetidos com base no informe de 07/08/2020.

04- Informe de 13/11/2020: foram detectados aumentos consideráveis de novos casos confirmados e óbitos conforme rvisão dos critérios no período de 17/03 a 12/11 conforme os critérios do Guia de Vigilância Epidemiológica do Ministério da Saúde. Para determinar os novos casos diários o sistema calcula a diferença entre o total de casos confirmados entre o dia atual e anterior. Logo, essa revisão retroativa dos dados pode gerar um aumento no gráfico de novos casos diários.

05- Informe de 16/12/2020: foi verificado um aumento considerável de casos confirmados do período de 01/04/2020 a 14/12/2020, sendo 14227 casos em Curitiba devido a integração com o sistema Notifica COVID-19. Lembrando que, para determinar os novos casos diários o sistema calcula a diferença entre o total de casos confirmados entre o dia atual e anterior. Logo, essa revisão resulta em um pico no gráfico de novos casos diários.

06- Informe de 07/01/2021: Após a qualificação da base de dados, foram identificadas inconsistências de casos e óbitos anteriores. Dessa forma, foram inseridos 31.425 casos e 377 óbitos retroativos que estão somados ao número total do dia 7 de janeiro de 2021, e excluídos 2.417 casos e 19 óbitos, devido a duplicidades. 

07- No dia 18/01/2021 foi iniciada a vacinação no Estado do Paraná. A resposta acumulativa de casos antes do período de vacinação estão disponíveis aqui com 499777 casos confirmados, sendo 123721 casos ativos.

08- Informe de 07/03/2021: foram divulgados 42.724 casos retroativos, confirmados no período de 07/05/2020 a 05/03/2021, e 222 óbitos retroativos, confirmados entre 22/06/2020 e 05/03/2021. Destes números, 39.910 casos e 177 óbitos por Covid-19 ocorreram em Curitiba.

09- No dia 03/03/2023 o boletim passou a ter atualização semanal. Conforme comunicado: https://www.saude.pr.gov.br/Noticia/Apos-orientacao-do-Ministerio-da-Saude-boletim-da-Covid-19-se-torna-semanal-no-Parana

10- No dia 15/12/2023 foi encerrado o processamento de dados do sistema.

Relatório em tempo real:  apresenta o resultado em tempo real do processamento realizado pelo sistema. Logo abaixo é apresentado um resumo da previsão dos modelos e dos 3 cenários que menores erros absolutos.

Total de casos confirmados no Paraná: são apresentadas as quantidades de casos confirmados no Estado do Paraná e na cidade de Curitiba com base nos dados oficiais da Secretaria de Saúde do Estado do Paraná (Sesa/PR). Os boletins oficiais estão disponíveis no final dessa página. No dia 27/03/2020 foram detectados os dois primeiros óbitos registrados em Maringá, sendo iniciado o levantamento de óbitos no estado do Paraná. No dia 17/04/2020 a Sesa/PR passou a divulgar os dados em Informes Epidemiológicos e foram computadas as primeiras pessoas recuperadas com 296 casos. O número total de casos ativos é calculado pelo sistema com base no total de casos confirmados descontando os casos recuperados e óbitos.

covid19_curitiba.pdf

Quantidade diária de novos casos confirmados: o boletim publicado pela Secretaria de Saúde forma um distribuição acumulativa, ou seja, considera o total de casos confirmados desde o início da epidemia. Nessa situação, para determinar a quantidade de novos casos confirmados em um dia específico basta calcular o resultado do boletim atual e subtrair pelo resultado do dia anterior. Logo abaixo é apresentada essa resposta.

Taxa de letalidade: é calculada pela relação entre os óbitos e o total de casos confirmados de COVID-19 no Estado do Paraná. O sistema utilizado os dados a partir de 27/03/2020 quando foram confirmados os dois primeiros óbitos.

Percentual de casos confirmados: com base no total de casos do Estado do Paraná, o sistema determina o percentual de casos confirmados em Curitiba. O percentual restante está distribuído em outras cidades do Paraná.

Taxa de evolução dos casos confirmados: calcula a razão de aumento de casos confirmados, ou seja, divide o número de casos confirmados do dia atual pelo dia anterior. Podendo apresentar as seguintes respostas:

a) Taxa = 1: Se o valor for 1 significa que não houve aumento de casos confirmados no dia. Nesse sistema pode indicar também que não houve publicação de dados, pois os dados do dia anterior são repetidos.

b) Taxa > 1: Se essa taxa for maior que 1 significa que houve aumento de casos confirmados. Esse comportamento é muito comum por vários dias consecutivos no início de epidemias. 

Modelo de previsão 1 - casos confirmados: esse modelo utiliza a média móvel da taxa de evolução dos casos confirmados (gráfico abaixo). O sistema calcula automaticamente a média dos últimos cinco dias e projeta a evolução dos casos dos próximos cinco dias. Importante salientar que o crescimento é exponencial, por exemplo, uma taxa de 2, indicaria uma propagação na razão de 2, 4, 8, 16 e 64, logo o desvio é maior ao longo dos dias.

Modelo de previsão 1 - taxa média de evolução: apresenta a taxa de evolução utilizada no dia para estimar os próximos 5 dias. Esse valor é proveniente da média da taxa de evolução de casos confirmados dos últimos 5 dias.

Modelo de previsão 1 - erro percentual absoluto: o sistema calcula o erro percentual entre o valor real (divulgado pelo boletim) com o valor estimado pelo modelo no dia anterior. O erro é calculado por: e= (valor real - estimado) / valor real. O valor zero indica que não houve erro entre a previsão e o valor do boletim. Um erro positivo indica que os casos confirmados foram maiores que os previstos e um erro negativo indica que os casos confirmados foram menores que os estimados pelo modelo. Na legenda da figura é apresentada a média quadrática do erro, indicando o erro percentual absoluto do modelo no Paraná e Curitiba.

Modelo de previsão 1 - correlação entre casos estimados x confirmados: o sistema apresenta o gráfico da correlação entre os casos estimados pelo modelo de previsão 1 e o resultado divulgado pelo boletim. A reta em azul representa a correlação ideal com coeficiente de determinação unitário.

Modelo de previsão 2 - casos confirmados: esse modelo utiliza a média da taxa de evolução dos casos confirmados (modelo 1) e incrementa a média da variação dessa taxa com base nos últimos 5 dias, ou seja, o fator multiplicador é formado pela taxa média + variação média da taxa dos últimos 5 dias. Com o aumento de testes e consequentemente casos confirmados a partir de 28/05 os dados do modelo 2 ficaram semelhantes ao modelo 1.

Modelo de previsão 2 - erro percentual absoluto: o sistema calcula o erro percentual entre o valor real (divulgado pelo boletim) com o valor estimado pelo modelo no dia anterior. O erro é calculado por: e= (valor real - estimado) / valor real. O valor zero indica que não houve erro entre a previsão e o valor do boletim. Um erro positivo indica que os casos confirmados foram maiores que os previstos e um erro negativo indica que os casos confirmados foram menores que os estimados pelo modelo. Na legenda da figura é apresentada a média quadrática do erro, indicando o erro percentual absoluto do modelo no Paraná e Curitiba.

Modelo de previsão 2 - correlação entre casos estimados x confirmados: o sistema apresenta o gráfico da correlação entre os casos estimados pelo modelo de previsão 2 e o resultado divulgado pelo boletim. A reta em azul representa a correlação ideal com coeficiente de determinação unitário.

Modelo de previsão 3 - casos confirmados: o modelo de previsão 3 utiliza um algoritmo de classificação de 2 equações entre 1000 manipulando os dois coeficientes de regressão com base nos casos já confirmados no Paraná. A equação 1 corresponde ao modelo com o menor erro estatístico do coeficiente aplicado a série de dados com os casos já confirmados pela Sesa/PR. A equação 2 utilizada apenas a série de dados de equação proveniente o modelo.

Modelo de previsão 4: esse modelo é derivado do modelo 3, porém a previsão é calculada até o fator multiplicador da equação atingir 1, ou seja, a partir desse data existem poucos novos casos diários indicando uma perspectiva de declínio da epidemia ao final dessa curva. Esse modelo utiliza uma combinação com 18000 equações em 6 possíveis cenários, selecionados pelos menores erros absolutos. No gráfico abaixo as barras indicam os casos já confirmados pela Sesa/PR e são apresentadas as curvas de projeção dos 6 cenários, considerando que cenários maiores apresentam maiores intensidades. Na legenda é possível visualizar os coeficientes (A e B) da equação o o coeficiente de classificação (e). Algumas considerações, quanto mais próximas as curvas para no mesmo cenário, indica que o cenário está mais próximo dos resultados dos últimos dias. A linha em laranja representa a data atual, ou seja, onde estamos no atual momento.

Se calcular a diferença entre o total de casos do dia atual menos o total do dia anterior é possível determinar os novos casos diários, resultando no gráfico abaixo. A região de pico desse gráfico coincide com a inflexão da curva de total de casos confirmados. Logo abaixo, são apresentados os novos casos confirmados e as equações de tendência do modelo. A linha em laranja representa a data atual, ou seja, onde estamos no atual momento. Importante salientar que as variações de horário e casos dos boletins oficiais resultam nas variações do gráfico abaixo.

Esse modelo é dinâmico e os coeficientes A e B mudam conforme os resultados diários. O modelo classifica as equações com base no resultado atual para obter a equação com o menor erro absoluto dentro de cada cenário com base nos resultados já confirmados de todos os boletins. Logo abaixo, é apresentada a variação desse parâmetro para todos os cenários. No dia 04/07/2020 a métrica do algoritmo de classificação foi modificada com base no total de casos confirmados mais recente.

No dia 11/06/2020 o algoritmo do modelo de previsão 4 foi otimizado visando ampliar a variação do coeficiente A para minimizar o erro absoluto (e). Por esse motivo, foi adicionada a resposta temporal desses coeficientes conforme apresentado no gráficos abaixo.

Sobre o sistema Monitor COVID-19: Esse sistema foi desenvolvido em código aberto sendo executado por shell script em sistemas operacionais GNU/Linux. O front-end utiliza o GNUPlot para geração de gráficos e APIs do Google Site para apresentação dos dados nessa página. O sistema também funciona em rede, utilizando atualmente 3 computadores (um servidor principal e dois notebooks). Toda a comunicação em nuvem é realizada pelo Dropbox e GDrive. Essa não é uma demanda obrigatória para o funcionamento, sendo utilizada apenas como redundância e maior robustez do sistema. O back-end desenvolvido em shell script controla todo o sistema e realiza o processamento de dados. Um módulo de processamento distribuído foi adicionado ao sistema visando torna as simulações mais rápidas, também não é uma demanda obrigatória, pois tudo pode ser realizado pelo computador local. O código-fonte pode ser livremente utilizado e adaptado respeitando os termos da Licença Geral Pública (GPLv3).

Fonte de dados:

Dados Estadual - Boletim Sesa/PR: http://www.saude.pr.gov.br/Pagina/Coronavirus-Covid-19

Dados Conselho Nacional de Secretários de Saúde: http://www.conass.org.br/painelconasscovid19/

Dados Nacionais - Ministério da Saúde: https://covid.saude.gov.br/

Dados Nacionais - Observatório COVID-19: https://covid19br.github.io/index.html

Dados Internacionais - Universidade Johns Hopkins COVID-19: https://coronavirus.jhu.edu/map.html