10th Peruvian Simposium in Computer Graphics and Imaging (SCGI)

The Computer Graphics and Imaging group of the Peruvian Computing Society announces to our community the 10th Peruvian Symposium in Computer Graphics and Imaging (SCGI) to be held on Thursday January 5th, 2017 at the Universidad Nacional de San Agustín (Arequipa, Perú).

The purpose of this event is to gather Peruvians pursuing a degree or working in these topics in foreign universities, research institutions, and industry. This is a great opportunity to be aware of their research and connect to other attendees. Also, this event provides an exceptional place to connect undergrad students from local universities with Master and PhD students from foreign universities to get information and contacts to thus pursue a degree abroad.

The following activities will take place.

      • Presentations of research work with topics related to Computer Graphics, Computer Vision, and Imaging
      • Round table with professionals in this area about a relevant problem within our community
      • Chicha-break: experimental session of 30 minutes devoted to connect local students with students, professionals, and professors from foreign universities

Organization:

      • Omar U. Florez (Intel Labs - USA)
      • Jorge Poco (University of Washington - USA)
      • Juan Carlos Gutierrez (Universidad Nacional de San Agustin - Peru)
      • Alex Cuadros (Universidad Católica San Pablo - Peru)
      • Eveling Castro (Universidad Nacional de San Agustin - Peru)
      • Marco Aedo (Universidad Nacional de San Agustin - Peru)
      • Guillermo Camara (Federal University of Ouro Preto - Brazil)
      • Erick Nieto (IBM Research - USA)



Lugar:

Auditorio Ingeniería de Sistemas

Universidad Nacional de San Agustín

Av. Independencia S/N. Cercado, 04001

Telf. +51 54 237808

Arequipa - Perú

Program

10.00am - 10.30am

Real Time Violence Detection in Video with ViF and Horn-Schunck

Vicente Enrique Machaca Arceda

enriquefirst@gmail.com

We evaluated the performance of ViF in violence datasets varying the optic flow algorithm, we used Iterative Reweighted Least Squares (IRLS), Horn-Schunck and Lucas- Kanade. As datasets, a Crowded and Hockey datasets were used, also we built a new dataset with videos taken from surveillance cameras, we named it Surveillance Videos (SV). In Hockey dataset Horn-Schunck had a better performance, but in SV and Crowded datasets IRLS was better. We also evaluated the computational cost processing two frames, Horn-Schunck had a very low cost of 0.25 seconds against 7.80 seconds of IRLS so we could use it in real time environments.

10.30am - 11.00am

Normalización de Iluminación en Imágenes basado en la Transformada de Logaritmo, Ecualización de Histograma y la Transformada Discreta de Coseno

Rolando Jesús Cárdenas Talavera

jecardenast200@gmail.com

La normalización de la iluminación en imágenes es de suma importancia en diferentes aplicaciones, existe en la literatura varias técnicas propuestas que poseen ventajas y desventajas, pero estas no son claras al momento de querer aplicarlas. En ese sentido, este trabajo presenta una revisión de las técnicas de normalización de iluminación en imágenes y se eligen tres técnicas: la Transformada de Logaritmo, la Ecualización de Histogramas y la Transformada Discreta de Coseno, se ha comparado esta propuesta con la función de Ecualización de Histograma de Matlab, obteniendo mayor cantidad de restauraciones de iluminación adecuadas, adicionalmente, se han aplicado al reconocimiento de vehículos y rostros, se puede ver en los resultados que las técnicas mejoran las tasas de reconocimiento lo que significa que son de suma importancia para aplicaciones reales.

11.00am - 11.30pm

Análisis de Micrografías fluorescentes

Filomen Incahuanaco Quispe

fincahuanaco@usp.br

Hoy en dia es posible obtener imágenes del citoesqueleto de muy buena calidad y mediante técnicas de fluorecencia poder etiquetarlas, facilitando discriminar entre filamentos de actina, microtubulos, redes de mitocondrias, filamentos intermedios, entre otros. Este trabajo muestra una comparacón de diferentes técnicas del estado de arte para poder tratar dichas imágenes, tales como Bag of Visual Words, Local Binary Pattern y Textons basados en Complex Networks.

11.30am - 12.00pm

Weakly Supervised Learning in Continuous Sign Language Recognition

Leonardo Braulio Guzman Zenteno

leonardogz18@gmail.com

Sign language (SL) recognition, has been explored for many years but is still a challenging problem for real practice because of the recognition of the movement epenthesis (the transition from the ending point of a gesture and the starting point of the next one) and the amount of time and resources needed to create a database largely enough to recognize all the signs in a specific SL. We propose a weakly supervised technique for isolating gestures from large videos making use of the data provided by the Intel RealSense 3D sensor (handshape, hand movement, hand location and palm orientation) so we can use those isolated signs in our SL recognition system.

LUNCH

2.00pm - 2.30pm

Una aplicación a la detección en tiempo real y experiencias en el área de investigación de sistemas biológicos en Alemania.

Elian Laura Riveros

elian.laura.riv@gmail.com

La inteligencia artificial está en nuestras vidas, cada vez es más corto el tiempo entre apariciones de nuevas técnicas que intentan alcanzar el nivel de la inteligencia humana e incluso superarla. Pero ¿De dónde proviene la inteligencia?¿Cómo se obtiene?, la respuesta está en Machine Learning (aprendizaje de máquina). Machine learning es el hecho de extraer información, aprenderla y seguidamente hacer predicciones sobre algún evento u objeto del escenario. Durante muchos años los algoritmos responsables de estas tareas fueron decision tree learning, inductive logic programming. clustering, reinforcement learning, Bayesian networks, entre otros. Años más tarde emerge Deep Learning (aprendizaje profundo), enfoque inspirado en las conexiones neuronales del cerebro. En el campo de reconocimiento de objetos deep learning influyó en aplicaciones exitosas. Su funcionamiento en varios niveles de abstracción y representación aporta en dar sentido a la información de la imagen [Wang et al., 2014]. Como parte de este enfoque de aprendizaje profundo surgieron las redes neuronales convolucionales (CNN), que tienen la capacidad de extraer características y clasificarlas, ambas etapas en un solo paso. Su componente extractor de características consta de una serie de operaciones de convolución que obtienen el respectivo vector de características, este puede ser aprovechado para alimentar otro modelo de clasificación, o un algoritmo de análisis de datos, también en el reconocimiento de patrones, etc. Los hiperparámetros que constituyen una CNN influyen en su desempeño, un análisis de tres hiperparámetros fue realizado con la finalidad de estudiar su comportamiento, tomando como conjunto de datos imágenes de vehículos. De esta manera se observa una arquitectura neuronal artificial que intenta conseguir los mismos resultados de reconocimiento de objetos de una arquitectura neuronal humana. Estudiar a un ser vivo tiene por objetivo entender su acción y reacción frente a un determinado problema, estos estudios permiten emplear las estrategias de los sistemas biológicos para el análisis de datos visuales y el aprendizaje de máquina. Mi experiencia durante mi estancia en Berlín se resume en la visita de grupos de investigación de procesamiento de información en sistemas biológicos, de dos de las principales Universidades de Berlín. El intercambiando de ideas y conocimientos con docentes/investigadores de otro país refuerza el compromiso de colaboración mutua y oportunidades de estudios en el extranjero.

2.30pm - 3.00pm

SIPRAD - Sistema de Planejamento Radioterápico

Andrey Omar Mozo Uscamayta

omar2562@gmail.com

A radioterapia atual exige a integração de um sistema de planejamento (TPS) em tratamentos conformados (3DRT) baseados em tomografia computadorizada (TC). Porém, diversos serviços de radioterapia nacionais ainda não dispõem desta tecnologia, devido principalmente ao custo e acesso a estas soluções. O sistema SIPRAD apresenta uma solução em software para o planejamento radioterápico de tratamento de câncer. O SIPRAD interopera com os demais sistemas hospitalares e apresenta uma excelente ferramenta de contorno para áreas de tumores e órgãos de risco, que devem ser protegidos, e, para a definição dos volumes alvos de tratamento. Este TPS foi modelado e desenvolvido com base em design participativo de profissionais de saúde da área. Utiliza-se como base, arquivos DICOM-RT que são acrescidos de informações desde o planejamento até o envio para o acelerador linear. O SIPRAD é inovador no cenário nacional, com potencial benefício ao acesso da radioterapia conformacional para aqueles serviços que ainda carecem desta tecnologia

3.00pm - 3.30pm

Oriented Image Foresting Transform Segmentation: Connectivity Constraints with Adjustable Width

Lucy A. Choque Mansilla

lucyacm2@gmail.com

In this work, we extend a novel seed-based segmentation algorithm, which provides global optimum solutions according to a graph-cut measure, subject to high-level boundary constraints: The simultaneously handling of boundary polarity and connectivity constraints. The proposed method incorporates the connectivity constraint in the Oriented Image Foresting Transform (OIFT), ensuring the generation of connected objects, but such that the connection between its internal seeds is guaranteed to have a user-controllable minimum width. In other frameworks, such as the min-cut/max-flow algorithm, the connectivity constraint is known to lead to NP-hard problems. In contrast, our method conserves the low complexity of the OIFT algorithm. In the experiments, we show improved results for the segmentation of thin and elongated objects, for the same amount of user interaction. Our dataset of natural images with true segmentation is publicly available to the community.

3.30pm - 4.00pm

Reconocimiento de Escenas Violentas en Video Usando Massive Threading

Jorge Thony Ramírez Ticona

jthonyrt@gmail.com

Analizando que el problema de reconocimiento de acciones violentas se ha convertido en un tema de actualidad dentro de la visión computacional, la detección de peleas o comportamientos agresivos en el ámbito espacial han sido menos estudiadas en la literatura. Dicha capacidad puede ser muy útil en algunos escenarios de vídeo vigilancia como en las cárceles, centros psiquiátricos, calles de la ciudad. Bajo este marco, las características espacio-temporales se extraen de las secuencias de vídeo y se utilizan para la clasificación. A pesar de resultados alentadores en el que se alcanzaron cerca de 90\% de precisión para esta tarea específica, el coste computacional de la extracción de tales características es prohibitivo para aplicaciones prácticas, en particular en los sistemas de vídeo vigilancia. Para afrontar esta problemática actual, se realizó el trabajo de investigación el cual realiza un reconocimiento de escenas violentas en vídeo, la misma que concluye que el uso de programación massive threading es necesaria para desarrollar una aplicación viable de reconocimiento de violencia en tiempo real. Una importante contribución de esta tesis magistral es proponer un método para el reconocimiento de violencia en vídeo la misma se hace espacial y temporalmente. En esta tesis, se realiza una evaluación amplia utilizando más de 1000 vídeos; con el fin de dar a conocer las ventajas de usar programación paralela en descriptores locales para el reconocimiento de la violencia en vídeo. De acuerdo con los experimentos, el método propuesto utiliza programación paralela en los procesos mas críticos del descriptor STIP con una tasa de acierto de 90.2\% y una segmentación espacial de la violencia en el vídeo con una acertividad de 74\% las cuales produjeron mejores resultados que otros métodos de la literatura y en tiempo real (33 FPS).

4.00pm - 4.30pm

Reconocimiento de acciones cotidianas basado en información multimodal

Kelly Vizconde La Motta

kelly.vizconde@gmail.com

Recognition of daily actions has been a very active field in recent years, easy access to technology and low cost of this have produced several research increasingly more accurate and with different types of information. Most of the proposals are based on intensity information, being this type of information, the most studied. Good results have been achieved using only this channel, but current technology offers more channels of information. At the present moment, there are still few researches focused in using multimodal information. Based on that, this research proposes a method for human action recognition based on multimodal information. The proposed method consists of three parts: features extraction, the use of bag of words and classification. For the first stage, we use the STIP descriptor for the intensity channel and HOG descriptor for the depth channel, MFCC and Spectrogram for the audio channel. In the next stage, it was used the bag of words approach in each type of information separately. We use the K-means algorithm to generate the dictionary. Finally, a SVM classifier labels the visual word histograms. For the experiments, we manually segmented the videos in clips containing a single action, achieving a recognition rate of 94.4\% on Kitchen-UCSP dataset, our own dataset and a recognition rate of 88\% on HMA videos.

4.30pm - 5.00pm

Boundary smoothing for segmented simplicial meshes generated from images

Tony Choque, Alex Cuadros

Among the techniques for generating quality meshes from images, we find the Imesh algorithm that consists of the following phases: mesh initialization, mesh partitioning and mesh improvement. At the end of the mesh initialization in Imesh, it computes the color pattern for each cell (triangle or tetrahedron) of the mesh by considering the intensity of colors inside the cell. This color pattern is not accurate in the boundary of objects, it depends on the approximation of the generated mesh from the input image. Then, with the help of partitioning operators, it groups cells with similar color patterns, to finally get the partitioned mesh. In this partitioning, due to not accurate color patterns in the boundary, cells can be grouped wrongly to neighbor regions. This is the cause of irregularities in the boundary as singularities and peaks. In this work we search options for repairing singularities and smoothing boundaries in segmented simplicial meshes generated from images.

5.00pm - 5.30pm

kMesh: Adaptive and parallel mesh construction method from image data

Ronald Gonzales, Alex Cuadros

Due to the development of computer graphic methods and technologies to capture volumetric images an important increase in geometrical modeling methods was made. This work proposes a new geometric model construction method denominated as kMesh which proposes a 3-step mesh construction algorithm adaptable to the shape of the object from images in 2 and 3 dimensions. Our proposal uses a combination of distance transform, skeletonization and distribution of points using Poisson disk sampling. This way we get a parallel, adaptable, scalable and portable method.

5.30pm - 6.30pm

ROUND TABLE

6.30pm - 7.00pm

CLOSING WORDS + CHICHA BREAK



Sponsors: