Aqui serão publicadas todas as atualizações semanais da Equipe Golf.
Semana 1
(08/10 à 15/10)
Esta semana, nós nos reunimos para discutir sobre a rotina de cada um e adaptar os nossos encontros conforme sua possibilidade, e começamos a montar o nosso website para podermos mostrar o nosso desenvolvimento no decorrer do projeto. Após o término do website, começamos a fazer nosso termo de abertura o qual passamos por dificuldade para definição de escopo do produto, pois ainda não era tão claro qual era o resultado que sairia deste projeto, fora isso passamos um certo tempo tentando definir a função principal de cada um, pois por sermos uma equipe, acaba havendo uma colaboração mutua principalmente neste início de trabalho que ainda não é tão específico em questão da afinidade com os conhecimentos que serão abordados nessa olimpíada.
Lições aprendidas: Nesta semana aprendemos que o trabalho em equipe e a comunicação são essenciais para a elaboração e gestão do projeto. A organização do grupo pela plataforma Trello nos permitiu centralizar as informações necessárias para as tomadas de decisões e execuções de tarefas, e os encontros síncronos do grupo foram muito importantes para pensarmos em conjunto qual caminho tomar nessa primeira etapa, gerando discussões bastante produtivas sobre o que definiríamos como finalidade, escopo do projeto e escopo do resultado único que pretendemos obter. Percebemos que ainda precisamos ter uma melhor compreensão das atividades que devem ser executadas, para podermos definir as funções e os responsáveis por elas. Desse modo, precisamos realizar um encontro para pensarmos, a partir da experiência e aptidão de cada integrante, a estrutura analítica do projeto.
Plataforma de Organização:
Semana 2
(18/10 à 22/10)
Nesta semana foi desenvolvida uma WBS para o projeto, com o objetivo de dividir e hierarquizar todas as tarefas de forma mais objetiva e simplificada de se visualizar. Infelizmente, durante o decorrer da semana, um dos membros do grupo decidiu sair por motivos de ordem pessoal, tal situação trouxe uma necessidade de reajustes em relação às tarefas delegadas para cada integrante, também houveram avanços consideráveis no aprendizado quanto ao uso da ferramenta Ganttproject para o trabalho durante a semana.
Lições Aprendidas: A identificação das tarefas auxiliam o grupo a pensar na forma em que o projeto será planejado e executado, além dos imprevistos que podem acarretar na necessidade de diversas alterações do planejamento, gerando inúmeras restrições outrora não ponderadas.
Semana 3
(23/10 à 29/10)
Foi elaborada nesta semana a Rede de Atividades do projeto, a partir das tarefas elencadas no WBS. Na sua construção definimos os responsáveis por cada tarefa, buscando refletir a melhor aptidão de cada um. Além disso, foram estimadas as durações de cada ação, por meio do estabelecimento da duração das tarefas de execução do projeto, encarada pela equipe como as mais importantes para o alcance dos objetivos do projeto e do resultado único. A estimativa foi feita a partir da média de duração de cada vídeo da respectiva área, dobrando o resultado e estabelecendo uma rotina de 2,5 horas e meia de estudo por semana, desta forma, e considerando as tarefas que já haviam sido executadas e data da olimpíada, consideramos o restante das atividades de planejamento e controle. Decidimos iniciar o estudo em linguagem R para todos os membros, para dai então dividir as matérias de estatística descritiva, inferencial, regressão simples e multivariada, entre 4 membros, enquanto os outros ficarão responsáveis pelas tarefas de acompanhamento e administrativas nessa parte mais crítica do projeto. A decisão de anteciparmos os estudos sem ainda haver realizado os planos de Riscos e de Gestão de Qualidade foi tomada levando em conta o fato de a partir da estimativa de duração, verificarmos que para conseguirmos um bom período de estudos, seria necessário iniciar os estudos logo depois da criação da Rede de Atividades.
Lições Aprendidas: Aprendemos que a estimação de duração das tarefas não é uma atividade simples quando ainda não se tem experiência naquela atividade específica, devendo levar em conta também a forma que cada um realiza tal função. No nosso caso, da capacitação para a olimpíada, mesmo todos sendo estudantes, cada um tem seu método de estudo e, para isso, devemos levar em conta essa diferença de modo de executar. Nossa solução foi uniformizar um tempo para estudos e para assistir as aulas, e uma quantidade de estudos semanais relativamente leve, para podermos alterar caso haja algum imprevisto. Aprendemos também que o GanttProject é um ótimo software gratuito que te fornece as principais ferramentas para gerir o tempo do projeto, sendo bastante intuitivo seu uso.
Semana 4
(01/11 à 05/11)
Semana da elaboração da Matriz de Riscos, por conta dos feriados previsto na semana, o grupo se reuniu tarde para a discussão da tarefa, mas empenhou um bom trabalho em equipe, apesar das dificuldades em se adaptar ao Google Sheets - alternativa ao Excel, que permite o compartilhamento simultâneo da planilha. Também foi iniciado os estudos na linguagem de progamação R com materiais de apoio recolhidos de aulas passadas e os recursos disponíveis pelo professor, além de atualizações nos documentos anexados para corrigir tudo que foi posto pelo professor no feedback.
Lições Aprendidas: Discutimos muito em relação ao modelo/formato ideal para exibir nossa matriz, pegamos diversos exemplos disponíveis no site do projeto para nos basear, pautamos diversos riscos e filtramos os que mais faziam sentido. Durante a fase de estudo dos R, uma das dificuldades que surgiram de um integrante, foi na definição do diretório para importar o arquivo CSV, pelo comando setwd, porém foi possível definir pelo menu session, set working directory, e visto que o erro surgia quando colocava o endereço com "\" e os endereços utilizados no R são divididos com "/".
Evolução no GanttProject, foram realizadas duas tarefas simultâneas, a realização do Plano de Riscos e o início dos estudos em R
Semana 5
(08/11 à 12/11)
Durante a semana foi realizada a Gestão de Qualidade do projeto, essa tarefa em especial se mostrou desafiadora por uma série de razões que surgiram durante o período: 1) Não houve um tempo hábil do grupo parar e se organizar, garantindo tempo para revisões e/ou ajustes, isso se deu, principalmente, devido à incompatibilidade na rotina dos integrantes para encontros e 2) Houveram muitas dúvidas com relação ao formato adotado para a organização da Gestão de Qualidade, se estava adequada com os requisitos. Também houve uma atualização no Ganttproject do grupo, a correlação na gestão de qualidade apareceu como outra dificuldade, dois membros tiveram funções que mudaram, pois havia uma saturação de integrantes na função "capacitação em linguagem de programação R", pois percebemos que não seria necessário a participação dessas duas pessoas, devido nas atividades seguintes elas não participarem na continuidade do estudo. Desta forma, teremos maior liberdade para dispormos desses dois integrantes na próxima semana. Será importante que durante essa última semana dos estudos iniciais em R seja finalizado, para que então os quatro integrantes que darão continuidade aos estudos estejam aptos a realizar os testes definidos como indicadores de desempenho.
Lições Aprendida: O grupo se viu na situação cuja impossibilidade de combinar horários fez surgir a necessidade de discutir a agenda fixa e semanal, para que todos estejam livres e garanta uma margem de segurança no tempo com relação aos prazos. O grupo realizou que o planejamento da gestão da qualidade traz a possibilidade de controlar os processos de forma organizada, a partir do objetivo do projeto, e de garantir a sua qualidade de entrega, possibilitando os ajustes e as ferramentas para sua avaliação. Desta forma, o avanço do projeto poderá ser feito de forma mais controlada e eficiente.
Semana 6
(15/11 à 19/11)
Durante essa semana repensamos nossas ideias e estratégias sobre como lidaríamos com o cronograma de estudos para deixa-lo o mais otimizado possível para nós, ampliamos os materiais de apoio na linguagem de programação R para a entrega do teste enviado pelo professor para treinarmos para o dia da olimpíada.
Lições Aprendidas: Essa semana o grupo seguiu com seus estudos sobre a linguagem R, aonde sentiu dificuldades no aprendizado da linguagem por conta de alguns integrantes nunca tiveram contato com programação antes e esses sentiram um estranhamento ao começar a estudar o R, e para superarmos esse problema nós conversamos entre o grupo e quem tinha mais experiencia ajudou as pessoas que tiveram dificuldade no aprendizado.
Gráfico Gantt antes da alteração
Gráfico Gantt após a alteração
Semana 7
(22/11 à 27/11)
Mais uma fez foi reforçado os temas delegados para estimular a equipe nos estudos. O tema envolto na linguagem de programação R está sendo muito bem aproveitado, com o extenso material de apoio deixado pelo professor e também pela participação especial do grupo no laboratório de R fornecido pela professora Daniela de Econometria 1 toda segunda-feira. Ademais, diversos exercicios do modelo estatistico de uma regressão linear simples, foi proposto ao grupo para garantir um bom aproveitamento do tema. Já com relação aos temas voltados a Estatistica descritivas, o encarregado Gabriel Borges está criando um escopo base das formulas primordiais + exercicios para serem feitos em conjuntos. O mais pesado esta sendo a divisão abrangente da Estatistica Inferencial que toma grande parte dos membros para seu estudo. Nossa proposta agora é entender como já ir alocando o R para a resolução dos problemas envoltos da Estatistica Descritiva.
Lições Aprendidas: Estamos tendo dificuldades em manter a comunicação ativa com o grupo. Também foi necessário à adição de um membro nos estudos de regressão linear para ajudar na implementação do tema, devido a agenda de outro participante. Fora isso, tivemos que buscar aulas anteriores gravadas para retomar alguns pontos importantes dos temas ligados a estatistica.
Semana 8
(29/11 à 03/12)
Nesta semana foi dada a continuidade nos estudos de estatística descritiva, estatística inferencial e regressão linear e múltipla. A realocação dos integrantes na semana anterior permitiu uma melhor divisão dos estudos, porém, há ainda a dúvida de como realizaremos a reunião do conhecimento obtido quando da participação na olimpíada. Em conjunto, a equipe que está estudando estatística inferencial e o integrante que está estudando estatística descritiva trabalhou para responder as questões do 3º desafio, enquanto que o grupo voltado a ao estudo de regressão linear e múltipla se empenhou a recuperar o atraso que ocorreu na semana anterior, e se aproximar do tempo proposto pelo nosso cronograma. A parte gerencial do projeto acompanhou o andamento dos estudos, perguntando durante a semana sobre as possíveis dificuldades que os integrantes poderiam estar passando, e motivando a comunicação no nosso grupo.
Lições aprendidas: A maior dificuldade encontrada foi na identificação das hipóteses nula e alternativa das questões relacionadas ao teste de uma proporção. Foi considerado que a hipótese nula seja, no caso, a igualdade do valor suscitado pelo enunciado, e a hipótese alternativa os valores maiores que Ho. Outra dúvida que surgiu foi na questão 9, na qual o teste sugere a verificação de uma hipótese de uma variável que admite 3 valores (criança, adulto e idoso), podendo incorrer em erro por não se enquadrar num intervalo binário sucesso, fracasso [0,1]. Porém, consideramos que o valor do teste retornaria a probabilidade da ocorrência da proporção de idosos e não idosos, no qual aguardaremos a correção do professor para conferir se acertamos ou não.
Evolução dos estudos semanais
Semana 9
(06/12 à 10/12)
Na semana em questão houve uma continuidade nos estudos de estatística inferencial e descritiva, assim como de regressão linear e múltipla, o grupo notou durante a semana que subestimou o tempo necessário para se dedicar à estatística inferencial e regressão, para resolver esse problema o tempo de estudos nas referidas partes foi estendido em uma semana, reduzindo o tempo de revisão, nesta semana foi finalizado o estudo de estatística descritiva, fora a necessidade de aumentar o prazo não houve contratempos maiores no trabalho durante a semana.
Lições Aprendidas:A semana trouxe como aprendizado, mais precisamente uma situação prática de algo que já foi discutido, a necessidade de haver uma margem de folga para lidar com atrasos, na resolução de problemas de questionário o grupo aprendeu as funções de testes de duas amostras, uma dificuldade apareceu para obter a média da amostra a partir do set.seed, erro solucionado com a atualização do software R.
Aumento do tempo previsto no cronograma para os estudos de estatística inferencial e regressão linear e múltipla
Semana 10
(13/12 à 17/12)
Foi finalizado os estudos referentes a parte de execução do projeto. A próxima etapa será a de revisão e correção dos estudos, coordenada pelos integrantes Eliezer e Felipe, por meio de novas tentativas dos desafios em que houve maior dificuldade (teste de duas médias e ANOVA). Também realizaremos exercícios a partir dos livros "Using R for Introductory Statistics" de John Verziani e "Introductory Statistics With R" de Peter Dalgaard, principalmente para a revisão do estudo de Regressão Linear. Com o atraso dos estudos, o grupo concordou em fazer as revisões durante as duas primeiras semanas do ano de 2022, já que grande parte do nosso período planejado de revisão coincidiu com o período de nosso recesso. Durante essa etapa pretendemos selecionar os exercícios e direcioná-los para os integrantes, discutindo posteriormente as dificuldades e aprendizados obtidos.
Lições aprendidas: Foi aprendido o teste ANOVA para um e dois fatores que indicam a relação entre uma ou duas variáveis de interesse. Também, foi aprendido a fazer boxplot, que havia passado em branco nos estudos anteriores. Foi percebido o impacto negativo de ter atrasado estudos na etapa anterior e de ter negligenciado o fato da ocorrência da revisão durante o período de recesso. Por isso a revisão proposta para a próxima etapa será realizada de forma branda para que haja engajamento dos integrantes, que estarão em um período de descanso. Essa solução foi aceita pelos membros, com o objetivo de apresentar o melhor resultado possível na Olimpíada.
Encerramento dos estudos, divisão da tarefa "revisão e correções" em "Recesso" e "Revisão/Correção"
Recesso
(18/12/2021 à 02/01/2022)
Semana 11
(03/01 à 07/01)
Nesta semana foi realizado o desafio como forma de revisão dos estudos em teste Chi-Quadrado e de construção de tabelas de contingência. Simultaneamente, os membros Gabriel Guarnieri e Eliezer revisaram os estudos de regressão linear e estatística inferencial a partir dos capítulos 9 e 11 do livro de Verziani (Using R for Introductory Statistics) e o integrante Felipe se ocupou de revisar o teste Chi-Quadrado a partir do capítulo 10 do mesmo livro e do site "http://www.sthda.com/english/wiki/chi-square-test-of-independence-in-r" que o auxiliou muito durante as dúvidas que surgiram durante a realização do desafio.
Lições aprendidas
Foi aprendido a conversão de arquivos do formato SAV para o formato CSV, a partir das funções library(haven) e library(readr), também foi aprendido a função residuals dos elementos de chisq.test, e a plotagem a partir da função corrplot que torna mais fácil visualizar o relacionamento entre as variáveis em questão. Surgiu uma dúvida sobre a questão 5 do desafio, pois o p-value = 0,06007 estava muito próximo do nível de significância em questão (0,05). Fizemos o teste mais algumas vezes para um valor de p simulado e seu valor manteve-se acima de 0,05, portanto, resolvemos aceitar a hipótese nula.
Semana 11 - Realização do desafio Chi-Quadrado e início das revisões
Semana 12
(07/01 à 13/01)
Nessa semana o nosso grupo se empenhou na resolução da olimpíada proposta pelo professor, o que testou todos os nossos conhecimentos sobre a análise de dados utilizando a linguagem R que adquirimos durante todo o semestre, fora a atualização do termo para retirarmos o nome de um integrante do grupo que saiu e também atualização de funções.
Para obtermos o conhecimento suficiente para a realização da olimpíada, nós utilizamos de técnicas de gestão de projetos apresentadas para nós pelo material disponibilizado pelo próprio professor para nos organizar de maneira eficiente como equipe para a realização do projeto sem haver prejuízo algum na rotina de qualquer integrante.
Lições aprendidas
Durante a resolução dos exercícios da olimpíada, nos deparamos com desafios muito parecidos com o que vinha sendo apresentado durante o curso. A questão que foi mais desafiadora ao grupo foi a questão 4, que envolveu a escolha do método mais adequado para a análise dos dados. Por encontrarmos a distribuição das idades de forma não paramétrica nas amostras, resolvemos adotar o teste U de Mann-Whitney, que indicou a forte correlação entre as medianas, afirmando que não há diferença significativa entre as medianas das idades das populações A e B. Porém, ao compararmos com a verificação nas populações, havia uma pequena diferença entre as médias, o que suscitou dúvidas quanto ao método utilizado. Aguardamos a correção dos exercícios para verificarmos se fizemos a escolha certa ou não.
Realização das olimpíadas
Reflexões finais sobre o projeto
O projeto foi realizado durante o segundo semestre letivo do ano de 2021, e envolveu o aprendizado conjunto da matéria de Elaboração e Gestão de Projetos e conteúdo de Ciência de Dados analisados no âmbito da linguagem de programação R (Estatística descritiva, indutiva e regressão linear simples e múltipla). O grupo conseguiu entregar dentro dos prazos estabelecidos as atividades propostas, os documentos do projeto e cumpriu as atividades de elaboração, planejamento, execução e controle do projeto, conseguindo assim, aquilo que foi determinante para atingir o objetivo que nos propomos, o de obter o aprendizado satisfatório em Ciências de Dados, matéria tão importante para o nosso desenvolvimento acadêmico e profissional.
O projeto se desenvolveu conforme o planejado?
Durante o desenvolvimento do projeto, tivemos alguns percalços, sendo o primeiro a saída de um integrante, que decidiu por motivos pessoais abandonar o projeto. Também houve alguns momentos em que nos deparamos com a necessidade de modificar o planejamento inicial, por percebermos que a quantidade de horas de estudo de nossa estimativa inicial ser demasiado grande, considerando o tempo em que os integrantes se aplicavam no estudo de outras matérias durante o semestre, como também, as questões que surgiam no âmbito pessoal dos integrantes.
Foi necessária muita comunicação e o ajuste durante a execução dos estudos para que pudéssemos realizar os desafios e estudar para a Olimpíada. Nesse momento, o software Gantt Project foi uma ferramenta extremamente útil para ajustarmos nossas atividades conforme surgiam novas questões. A realização da Olimpíada foi feita de forma bastante tranquila, pois esta envolveu muito dos conceitos que vínhamos trabalhando durante o semestre, não obstante, tivemos dificuldade em uma questão em específica, mas que depois, pela correção do professor, descobrimos onde havíamos errado, e saímos bastante felizes com o resultado de nosso esforço.
Quais foram os maiores desafios?
Os maiores desafios foram principalmente a diferença de agendas dos integrantes, a comunicação, que precisava ser assertiva no momento certo, a falta de conhecimento inicial da maioria dos integrantes na linguagem de programação R e realização em conjunto da elaboração, gestão e execução do projeto, com as demais matérias, sem que houvesse prejuízo em nenhuma das partes. O fato de termos planejado e trabalhado em equipe reduziu a probabilidade dessas dificuldades afetarem o desenvolvimento do projeto.
A criação de um canal de comunicação e o respeito aos horários possíveis, os acordos entre os integrantes e também a repartição das tarefas foram essenciais para o andamento do projeto conforme o planejado. Os integrantes que já tinham algum conhecimento prévio em R ajudaram os integrantes com maiores dificuldades com a plataforma, e as atividades foram distribuídas por aptidão. A gestão do tempo foi facilitada por meio do software Gantt Project e, quando houve necessidade, modificamos os prazos e os estendemos conforme as necessidades reais do grupo, algumas que surgiram durante o projeto (a exemplo de enfermidades, saídas, viagens a trabalho). Ao fim, os desafios motivaram os integrantes, mesmo que algumas vezes surgindo por meio de pequenos conflitos, a acharem uma solução para eles.
Quais foram as lições aprendidas?
As principais lições aprendidas, além do importante conhecimento nos tópicos de Ciência de Dados, foram aquelas que surgiram dos momentos mais desafiadores do projeto. A capacidade de trabalhar em equipe, de se comunicar, de desenvolver habilidades interpessoais, de organizar, planejar, dividir opiniões e defender pontos de vistas distintos, chegar a consensos que visam o melhor desenvolvimento do projeto. Aprendemos a replanejar, analisar as condições do projeto, dos integrantes e reformular o caminho no qual seguir, por meio de ferramentas e métodos como o Gantt Project, WBS, a rede de atividades, matriz de riscos e gestão de qualidade. Por fim, aprendemos os conceitos de estatística necessários para realizar comparação de médias, verificação da distribuição de uma variável, de proporção de uma e duas amostras, testes paramétricos e não-paramétricos, teste Chi-quadrado e estimar o(s) parâmetro(s) de uma regressão linear simples e múltipla, por meio da linguagem de programação R.
O que vocês recomendariam aos alunos das próximas turmas?
Remendamos aos alunos da próxima turma que aproveitem ao máximo o conteúdo transmitido pelas vídeo-aulas e pelo material didático disponibilizado pelo professor; que se atentem aos prazos e aos feedbacks; que realizem as tarefas semanais, pois nelas surgirão as dificuldades necessárias para as possíveis alterações do projeto; que os integrantes se comuniquem, conversem sobre suas dificuldades, dúvidas e opiniões que serão muito úteis para o desenvolvimento do projeto pois, no final das contas, vocês que colocarão a "mão na massa". E por fim, que vocês tenham em mente que o conhecimento adquirido nesta matéria é um conhecimento muito rico que será aproveitado em todas as áreas de sua vida, seja no âmbito pessoal, profissional ou acadêmico!
---------------------------------------
Nós do grupo Golf, gostaríamos de agradecer ao professor Dr. João Alberto do Amaral pela oportunidade desta experiência em elaboração e gestão de projetos, pelas valiosas lições aprendidas, pelo alto nível de qualidade do ensino, que sempre nos exigiu nosso melhor, fazendo valer a qualidade da instituição de ensino da EPPEN/UNIFESP e pelo zelo para com os alunos e com o matéria.