Análise Inteligente de Vídeo

Projeto de formatura do PCS

Membros:

Lais Giardullo de Araujo
Eric Alkmin Santos La Rosa [PTC]
Saint Clair Barbosa Bernardes [PTC]

Orientador: Reginaldo Arakaki

Co-Orientadores: Diego Colón [PTC], Marcelo Pita e Leandro Souza

Contexto:

Atualmente, muitos estabelecimentos comerciais contam com um sistema de câmeras de vigilância para proporcionar sua segurança. As câmeras passam o dia colhendo informações, mas estas, em sua maioria, só são consultadas quando há alguma ocorrência incomum.

Dessa forma, muita informação potencialmente útil e de valor estratégico para o planejamento do negócio é perdida, devido 'a falta de análise constante das imagens.

Hoje, as empresas, para serem competitivas, precisam obter cada vez mais dados e saber utilizá-los de forma efetiva para tomar decisões e proporcionar serviços diferenciados para seus clientes.

Projeto:

O projeto visa desenvolver um Sistema de Análise Inteligente de Vídeo que seja capaz de processar as imagens obtidas por câmeras de segurança e reconhecer padrões utilizando técnicas de segmentação de imagem e Machine Learning.

O produto tem como objetivo principal a detecção e tracking de pessoas em um sistema de restaurantes para obter informações relevantes para o negócio, como a quantidade de pessoas nas filas ou tempo médio de permanˆencia, o que poder ser disponibilizado tanto para os administradores quanto para o clientes do restaurante, em uma plataforma web.

Negócio:

O nosso sistema prevê o aumento de experiência do uso do estabelecimento pelo cliente em conjunto com o aumento das informações de negócios para os administradores.

É importante ressaltar que o nosso projeto pode ser adaptado para qualquer tipo de estabelecimento ou local. Neste estudo, focamos na aplicação do sistema particularmente em redes de restaurantes com balcões para fazer o pedido (sem o uso de garçons).

No diagrama a seguir vemos os principais parceiros de negócio do projeto. O administrador da rede de estabelecimentos terá acesso a um ou mais estabelecimentos. Em cada um desses lugares, temos o cliente e funcionário presentes no estabelecimento, que não são usuários primários do nosso sistema, e o cliente que acessa o website do restaurante

Requisitos:

Requisitos Funcionais

No sistema de análise de vídeo, temos os seguintes requisitos funcionais:

•Contagem em real-time de pessoas no v ́ıdeo

•Contagem do número de pessoas na fila para o pedido

•Notifica ̧c ̃ao automática para o administrador indicando lotações inesperadas

•Display de vídeo e informações via plataforma web

•Coleta e visualização de dados de quantidade de pessoas por tempo

•Coleta e visualização de dados de distribuição espacial de pessoas

•Divisão da imagem da camera em clusters

•Acompanhamento da imagem de cada pessoa e de seu movimento

•Geração de relatório comparando franquias

•Geração de relatórios por restaurante

•Visualização do número de pessoas no restaurante e nas filas (plataforma clientes)

•Visualização de estimativa de espera nas filas (plataforma clientes)

Requisitos Não-Funcionais - Análise de Vídeo

•Funcionamento com diferentes cameras IP

•Funcionamento em sistema operacional Windows

•Funcionamento nos navegadores Google Chrome, Internet Explorer e Mozilla Firefox

•Banco de dados com capacidade para armazenar dados relativos a 3 anos de uso do

sistema

•Dados do sistema não devem ser acessados por pessoas n ̃ao autorizadas pelo administrador do sistema

•Calibração inicial do sistema deve existir

Requisitos Não-Funcionais - Filmagem do Ambiente

•Filmagem com camera em lugar fixo (parada)

•Camera posicionada acima de 3 metros de altura

•Ambiente filmado estar claro

•Imagem filmada abranger o espaço inteiro onde deseja-se ter a contagem

Infraestutura do Sistema de Análise

Arquitetura do Sistema de Análise:

Algoritmo Desenvolvido

De uma forma simplificada, o algoritmo desenvolvido segue 3 passos principais:

1. Identificar os contornos referentes a objetos em movimento na imagem por meio do algoritmo de background substractor:

2. Usar a técnica de árvore de decisão para identificar quais contornos são pessoas e quantas pessoas existem em cada um deles.

3. Analisar local de pessoas já salvas anteriormente e aplicação do algoritmo de Optical Flow para identificar quais dessas são novas detecções e quais devem ter suas posições atualizadas para o tracking :