Estatísticas da carreira de Daniel Alves + Dicas do R
Estatísticas da carreira de Daniel Alves + Dicas do R
Publicado em 17/09/2021
A saída recente de Daniel Alves do São Paulo mobilizou muito as redes sociais. Esse jogador inspira muitas polêmicas, em especial por seu posicionamento fora de campo. Mas e dentro de campo? Quais os clubes e estatísticas melhor definem a carreira do lateral brasileiro?
O objetivo desse texto é mostrar como com poucos passos (feitos numa manhã chuvosa) com o software estatístico R pode-se gerar gráficos e tabelas para análises de dados básica. Aquele que gosta de passar o tempo com curiosidades aleatórias também pode se interessar. Para isso usaremos a carreira do jogador. Gosta de estatística e/ou de futebol? És convidado a ler as próximas linhas.
Dado que esse texto tem um objetivo de apresentar simples técnicas estatísticas, utilizaremos o formato R, com os códigos utilizados na análise aparecendo no corpo do texto.
Esses são os times que o atleta de 38 anos defendeu em sua carreira profissional. A análise que se segue utiliza dos dados de gols, assistências por equipe na carreira afim de demonstrar alguns possíveis usos da ferramenta estatística R (todos os códigos utilizados no software estarão em formato itálico).
O software R para proceder as análises aqui desejadas demanda o uso de três pacotes:
library(tidyverse)
library(knitr)
library(kableExtra)
Para dados do numero de jogos e gols de Alves utilizei o site transfermarket, para assistências no Bahia confiei em uma reportagem da Gazeta esportiva.
time <- c("Bahia","Sevilla", "Barcelona", "Juventus", "PSG", "SãoPaulo", "Brasil") #os clubes e a seleção
jogos <- c(37, 250, 391,33, 73,95, 119) # na sequencia por time
gols <- c(5,16,21,6,8,10,8) # na sequencia por time
media_gols <- gols/jogos
data <-data.frame (jogos, gols, media_gols, time)
data
## jogos gols media_gols time
## 1 37 5 0.13513514 Bahia
## 2 250 16 0.06400000 Sevilla
## 3 391 21 0.05370844 Barcelona
## 4 33 6 0.18181818 Juventus
## 5 73 8 0.10958904 PSG
## 6 95 10 0.10526316 SãoPaulo
## 7 119 8 0.06722689 Brasil
O que foi gerado está meio estranho que tal gerar uma bonita tabela?
tabela1 <- data %>%
dplyr::select(time, jogos, gols, media_gols) %>%
arrange(desc(media_gols))
tabela1 %>%
kbl(caption = "Carreira de Daniel Alves(gols)") %>%
kable_classic(full_width = F, html_font = "Garamond")
Dani Alves se notabilizou mais pelas assistências do que pelos gols, que tal incluir esse dado na análise?
# acrescentar as assistências
assistencias <- c(3, 29, 101, 7, 18, 14, 21)
media_assistencias <- assistencias/jogos
data <-data.frame (jogos, gols, media_gols, time, assistencias, media_assistencias)
tabela2 <- data %>%
dplyr::select(time, jogos, gols, media_assistencias) %>%
arrange(desc(media_assistencias))
tabela2 %>%
kbl(caption = "Carreira de Daniel Alves (assistências)") %>%
kable_classic(full_width = F, html_font = "Garamond")
Em relação às assistências o Barcelona parece ter sido o período mais fértil da carreira do atleta.
A fim de compreender se há alguma relação entre assistencia e gols, utilizaremos a correlação de Pearson já utilizada nesse site em outras oportunidades.
cor(media_assistencias, media_gols)
## [1] -0.08420912
A correlação oscila entre -1 relação negativa forte 0 sem relação 1 relação positiva forte o valor de -0.08 indica frágil relação. Ou seja, em alguns clubes Alves foi mais artilheiro, já em outros mais garçom. Que tal unificar as duas medidas criando um indíce de participação de gols?
Particip <- gols + assistencias
media_particip <- Particip/jogos
data <-data.frame (jogos, gols, media_gols, time, assistencias, media_assistencias, Particip, media_particip)
b7 <- data %>%
dplyr::select(time, jogos, gols, media_particip) %>%
arrange(desc(media_particip))
b7 %>%
kbl(caption = "Carreira de Daniel Alves") %>%
kable_classic(full_width = F, html_font = "Garamond")
A breve passagem do lateral pela Juve parece ter sido aquela em que ele mais se destacou em termos de participação nos gols, uma ótima média de 0.39 por jogo. Isso é muito significativo, levando em consideração que o atleta é um defensor.
Por fim duas análises são ainda cabíveis.
A primeira é a criação de um gráfico que observa a correlação entre jogos e essa média de participações, destacando cada clube pelo qual Daniel passou em sua vitoriosa carreira:
f <- ggplot(data, aes(jogos, media_particip))
f + geom_text(aes(label = time)) + ylab("Média Gols + Assistências")
A segunda é um cruzamento entre gols e assistências levando em consideração o time:
j <- ggplot(data, aes(media_gols, media_assistencias))
j + geom_text(aes(label = time)) + scale_x_continuous(limits = c(0, 0.32)) + scale_y_continuous(limits = c(0, 0.32)) +
ylab("MédiaAssistências") + xlab("Média Gols")
Em ambos os gráficos, no que concerne as assistências, percebemos que os números do início da carreira (Bahia e Sevilla) não são tão bons quanto os do auge da carreira (Barça, Juve e PSG). A parte mais final da carreira (São Paulo) e o time que atravessa boa parte de sua carreira (seleção) apresentam números intermediários.
Já em relação aos gols não há um padrão tão claro.
Análises mais profundas sobre a carreira de Dani Alves são possíveis, mas dado que o objetivo era mostrar uma curta análise a imbricação entre o R e o futebol esse texto se encerra convidando o leitor a seguir-nos nas redes para ficar sabendo de mais conteúdos desse tipo.
Temos em nosso site também conteúdos mais robustos associando futebol e estatística: