Workshop on Data Science and Statistical Learning

7-8 November 2019

Plenary Talks

Talk 1 (C1)

Programa de Formação de Ninjas Vert

Sobre o Desafio Ninja

Procuramos estudantes das melhores universidades que tenham interesse em trabalhar com Inteligência Analítica. O mercado está cheio de oportunidades que não são preenchidas por falta de profissionais qualificados. O Desafio Ninja busca treinar e desenvolver universitários que almejam tornar-se cientistas de dados e participar de projetos de Inteligência Analítica com uso de inteligência artificial e modelos estatísticos e preditivos.

Sobre a Vert

Fundada em 1997, a VERT é uma empresa de soluções de TI especializada no desenvolvimento, provimento e integração de tecnologias para a Transformação Digital dos negócios de seus clientes. Posicionada como Trusted Advisor no mercado B2B, se destaca por uma forte cultura de inovação baseada em entrega de valores como tecnologia, desempenho e resultados a uma base de mais de 300 clientes corporativos já atendidos em todo o Brasil. Possui um abrangente portfólio de produtos e serviços disponibilizados via alianças estratégicas com parceiros e fabricantes de classe mundial. No início de 2016, a empresa aumentou a oferta de serviços digitais e inaugurou seu primeiro Data Center, baseado em Containers, voltado para o mercado de serviços integrados e ambientes de alta disponibilidade de computação em Nuvem.

Speaker: Humberto Sampaio (Diretor Comercial) and Rachel Silva (Coordenadora de Gestão de Pessoas)

Institution: Vert

Talk 2 (C2)

Classificação de Estrelas-Galaxias usando o Machine Learning

A separação entre galáxias e estrelas no contexto de observações astronômicas são necessárias para uma cosmologia/ astrofísica de precisão. Para lidar com grande número de dados em pesquisas futuras, devem ser desenvolvidas ferramentas novas a fim de se obter respostas rápidas e precisas. Utilizamos diferentes métodos de Aprendizado de Máquina com o intúito de classificar objetos luminosos em estrelas e galáxias. Os dados utilizados foram os observado pela moderna colaboração Javalambre Physics of the Accelerating Universe Astrophysical Survey (J-PAS); parceria construida por Brasil e Espanha.

Speaker: Pedro Otavio Souza Baqui

Institution: Graduate Program in Physics/Federal University of Espírito Santo

Talk 3 (C3)

Redes neurais profundas e suas aplicações em visão computacional

Redes neurais são modelos matemáticos criados para simular o comportamento dos neurônios do cérebro humano. Elas geralmente estão organizadas em camadas de neurônios e são treinadas usando um conjunto de dados como entrada e suas respectivas respostas como saída. Aprendizado profundo (deep learning) é uma técnica para treinar redes neurais profundas (redes neurais com muitas camadas) que já vem sendo estudada há algumas décadas, porém que se popularizou apenas em 2012 com o advento de máquinas com grande poder computacional paralelo (i.e., com GPUs) e com disponibilização de grades massas de dados, principalmente imagens, na internet. Nesse trabalho de 2012, um grupo de pesquisadores utilizou uma rede neural convolucional (Convolutional Neural Network - CNN) para obter um resultado surpreendente no desafio de classificação do ImageNet Large Scale Visual Recognition Challenge of 2012, superando as outras técnicas por uma grande margem. A partir daí, uma série de outros grupos se interessou por essa técnica e várias soluções começaram a surgir para problemas cotidianos. Primeiramente, foco era dado a problemas de classificação, ou seja, dado uma entrada (ex. uma imagem) a rede prediz uma saída (ex. carro, como sendo a classe correspondente àquela imagem). Posteriormente, outros problemas como detecção (em que a rede é capaz de localizar objetos em uma imagem), segmentação (em que a rede é capaz de determinar a classe de cada pixel da imagem), geração de imagens artificiais (em que a rede é capaz de gerar imagens artificias realísticas), entre outros, também foram se popularizando. Nesta palestra, exploraremos os resultados obtidos pelos grupos de pesquisa em inteligência artificial que participo no Programa de Pós-graduação em Informática da UFES, incluindo, mas não se restringindo a, reconhecimento de expressões faciais, detecção de faixa de pedestres, detecção de semáforos, reconstrução de documentos fragmentados, detecção de carros em contextos diferentes.

Speaker: Thiago Oliveira dos Santos

Institution: Department of Informatics/Federal University of Espírito Santo

Talk 4 (C4)*

Ciências de Dados e Aplicações

Uma breve exposição de cases de sucesso de aplicação de ciências de dados em problemas do banco. Além disso, uma breve descrição do perfil do cientista de dados.

Speaker: Thiago Feitosa

Institution: Itau-Unibanco

This talk will be held via web conference

Talk 5 (C5)

Deep Learning, uma conversa sobre a área de pesquisa com algumas aplicações de visão computacional

A palestra tem por objetivo apresentar uma introdução a uma técnica de Aprendizado de Máquinas chamada redes neurais profundas (também conhecida como deep learning) iniciando com conceitos fundamentais, uma resenha histórica e finalizando com exemplos de algumas aplicações.

Speaker: Jorge Aching Samatelo

Institution: Department of Electrical Engineering/Federal University of Espírito Santo

Talk 6 (C6)

Aplicações do Modelo Vetorial e de Técnicas de Clustering para Analise de Aprendizagem de Programação

Representações vetoriais e Técnicas de Clustering aplicadas em amostras de soluções de exercícios de programação para avaliação diagnóstica, composição automática de gabaritos, predição de desempenhos e análise de plágios.

Speaker: Marcia Gonçalves Oliveira

Institution: IFES

Talk 7 (C7)

Afinal, o que faz um cientista de dados?

Partindo das seis etapas típicas de um projeto de ciência de dados, podemos entender quais são os conhecimentos e talentos esperados de um profissional da área, além do valor de um time multidisciplinar para este tipo de solução.

Speaker: André Lima

Institution: Accenture

Talk 8 (C8)

Ciência de dados na era das redes

Redes Sociais, Internet das Coisas, Cidades Inteligentes e outras aplicações emergentes estão tornando o mundo e as pessoas cada vez mais conectados, fazendo que quantidades colossais de informação sejam transmitidas pela rede. No intuito de extrair novos conhecimentos e informações relevantes desses dados, a Ciência de Dados está se popularizando e ganhando espaço nas mais diversas áreas de conhecimento. Nesse contexto, esta palestra traz uma visão sobre o valor dos dados no modelo econômico da Internet, fazendo uma análise do impacto dos dados na privacidade e a urgente necessidade de proteção dos dados. Como tópicos de pesquisa, discute-se sobre análise do padrão de comunicação em redes, detecção de ataques e orquestração de redes programáveis.

Speaker: Magnos Martinello

Institution: Department of Informatics/UFES

Talk 9 (C9)

Assessing Candidate Preference through Web Browsing History

Predicting election outcomes is of considerable interest to candidates, political scientists, and the public at large. We propose the use of Web browsing history as a new indicator of candidate preference among the electorate, one that has potential to overcome a number of the drawbacks of election polls. However, there are a number of challenges that must be overcome to effectively use Web browsing for assessing candidate preference - including the lack of suitable ground truth data and the heterogeneity of user populations in time and space. We address these challenges, and show that the resulting methods can shed considerable light on the dynamics of voters' candidate preferences in ways that are difficult to achieve using polls.

Speaker: Giovanni Comarela

Institution: Department of Informatics/Federal University of Viçosa

Talk 10 (C10)

Aprendizado de Máquina em bases de dados desbalanceadas

Técnicas de Aprendizado de Máquina têm se mostrado efetivas para realizar diversas tarefas. Entretanto, a qualidade dos dados usados para obter um modelo é um fator determinante, sendo um deles o desequilíbrio entre a quantidade de amostras de diferentes classes/categorias. Esta palestra tem como foco apresentar os problemas relacionados ao uso de bases de dados desbalanceadas em Técnicas de Aprendizado de Máquina, e algumas estratégias para mitigar os efeitos negativos.

Speaker: Patrick Marques Ciarelli

Institution: Department of Electrical Engineering/Federal University of Espírito Santo

Talk 11 (C11)

Desafios e perspectivas para a construção de Machine Learning socialmente responsável

Com a intensificação do uso de soluções de inteligência artificial e aprendizagem de máquina, cresce também a preocupação dos impactos sociais do uso dessas ferramentas. Recentemente parte considerável da comunidade em ciência de dados têm se preocupado sobre o efeito discriminatório que esses algoritmos podem ter em certos grupos sociais por fazerem uso das discrepâncias sociais capturadas nos dados em que são desenvolvidos. Nessa apresentação introduzirei alguns dos paradigmas usados para tratar sobre a discriminação de algoritmos presentes na literatura e discutirei um pouco os desafios que temos encontrado sobre o assunto no DataLab Experian assim como algumas das alternativas temos pensado para atacá-lo no contexto de crédito no mercado brasileiro.

Speaker: Ramon Vilarino

Institution: DataLab/Serasa Experian

Workshop on Data Science and Statistical Learning

7-8 November 2019

Plenary Talks

Talk 1 (C1)

Talk 2 (C2)

Talk 3 (C3)

Talk 4 (C4)*

Talk 5 (C5)

Talk 6 (C6)

Talk 7 (C7)

Talk 8 (C8)

Talk 9 (C9)

Talk 10 (C10)

Talk 11 (C11)

Organization

Support