Análise Inteligente de Vídeo
Projeto de formatura do PCS
Membros:
- Lais Giardullo de Araujo
- Eric Alkmin Santos La Rosa [PTC]
- Saint Clair Barbosa Bernardes [PTC]
Orientador: Reginaldo Arakaki
Co-Orientadores: Diego Colón [PTC], Marcelo Pita e Leandro Souza
Contexto:
Atualmente, muitos estabelecimentos comerciais contam com um sistema de câmeras de vigilância para proporcionar sua segurança. As câmeras passam o dia colhendo informações, mas estas, em sua maioria, só são consultadas quando há alguma ocorrência incomum.
Dessa forma, muita informação potencialmente útil e de valor estratégico para o planejamento do negócio é perdida, devido 'a falta de análise constante das imagens.
Hoje, as empresas, para serem competitivas, precisam obter cada vez mais dados e saber utilizá-los de forma efetiva para tomar decisões e proporcionar serviços diferenciados para seus clientes.
Projeto:
O projeto visa desenvolver um Sistema de Análise Inteligente de Vídeo que seja capaz de processar as imagens obtidas por câmeras de segurança e reconhecer padrões utilizando técnicas de segmentação de imagem e Machine Learning.
O produto tem como objetivo principal a detecção e tracking de pessoas em um sistema de restaurantes para obter informações relevantes para o negócio, como a quantidade de pessoas nas filas ou tempo médio de permanˆencia, o que poder ser disponibilizado tanto para os administradores quanto para o clientes do restaurante, em uma plataforma web.
Negócio:
O nosso sistema prevê o aumento de experiência do uso do estabelecimento pelo cliente em conjunto com o aumento das informações de negócios para os administradores.
É importante ressaltar que o nosso projeto pode ser adaptado para qualquer tipo de estabelecimento ou local. Neste estudo, focamos na aplicação do sistema particularmente em redes de restaurantes com balcões para fazer o pedido (sem o uso de garçons).
No diagrama a seguir vemos os principais parceiros de negócio do projeto. O administrador da rede de estabelecimentos terá acesso a um ou mais estabelecimentos. Em cada um desses lugares, temos o cliente e funcionário presentes no estabelecimento, que não são usuários primários do nosso sistema, e o cliente que acessa o website do restaurante
Requisitos:
Requisitos Funcionais
No sistema de análise de vídeo, temos os seguintes requisitos funcionais:
•Contagem em real-time de pessoas no v ́ıdeo
•Contagem do número de pessoas na fila para o pedido
•Notifica ̧c ̃ao automática para o administrador indicando lotações inesperadas
•Display de vídeo e informações via plataforma web
•Coleta e visualização de dados de quantidade de pessoas por tempo
•Coleta e visualização de dados de distribuição espacial de pessoas
•Divisão da imagem da camera em clusters
•Acompanhamento da imagem de cada pessoa e de seu movimento
•Geração de relatório comparando franquias
•Geração de relatórios por restaurante
•Visualização do número de pessoas no restaurante e nas filas (plataforma clientes)
•Visualização de estimativa de espera nas filas (plataforma clientes)
Requisitos Não-Funcionais - Análise de Vídeo
•Funcionamento com diferentes cameras IP
•Funcionamento em sistema operacional Windows
•Funcionamento nos navegadores Google Chrome, Internet Explorer e Mozilla Firefox
•Banco de dados com capacidade para armazenar dados relativos a 3 anos de uso do
sistema
•Dados do sistema não devem ser acessados por pessoas n ̃ao autorizadas pelo administrador do sistema
•Calibração inicial do sistema deve existir
Requisitos Não-Funcionais - Filmagem do Ambiente
•Filmagem com camera em lugar fixo (parada)
•Camera posicionada acima de 3 metros de altura
•Ambiente filmado estar claro
•Imagem filmada abranger o espaço inteiro onde deseja-se ter a contagem
Infraestutura do Sistema de Análise
Arquitetura do Sistema de Análise:
Algoritmo Desenvolvido
De uma forma simplificada, o algoritmo desenvolvido segue 3 passos principais:
1. Identificar os contornos referentes a objetos em movimento na imagem por meio do algoritmo de background substractor:
2. Usar a técnica de árvore de decisão para identificar quais contornos são pessoas e quantas pessoas existem em cada um deles.
3. Analisar local de pessoas já salvas anteriormente e aplicação do algoritmo de Optical Flow para identificar quais dessas são novas detecções e quais devem ter suas posições atualizadas para o tracking :