2022 동계 모각소

노각소 활동내용 및 발표자료

<팀원>

미디어학과 박지영

미디어학과 이대호

미디어학과 김아영

<팀원별 활동내용>

박지영

프론트엔드(HTML, CSS, JS) 지식을 학습한다. 앞 3회차는 HTML, CSS을 학습하는 시간으로 투자하였고,

이후 회차에서는 JS 학습과 만들고 싶은 어플을 설계해보는 시간을 가졌다.

이대호

OCR 관련 최신 논문을 읽고, 인퍼런스를 진행한 뒤, 직접 OCR 모델을 구현한다.

일단 네이버 연구팀의 최신 논문들을 읽고 코드를 인퍼런스한 뒤, OCR 의 방식에 대해서 이해하는 시간을 가졌다.

이후, 이해한 내용을 토대로 OCR 모델링을 구현하고자 했다.

김아영

OCR 관련 AI model들을 inference하여 성능을 확인하고, 이들을 활용하여 이미지 번역 기능을 구현하는 목표를 가지고 개발한다.

이 과정에서 OCR 최신 모델에 대한 논문을 접했다. 더 나아가 detect와 recognition에 대한 모델을 찾아보며 OCR모델을 디자인 하고자했다.

또한 detect 모델 중 YOLO에 대해 알아보며 버전 별 차이를 알아볼 수 있었다.

<팀원별 최종성과>

박지영

HTML,CSS,JS의 개념을 정리하고, 만들고 싶었던 일기 앱의 큰틀(방향성, 요구사항 등)을 잡을 수 있었다.

이대호

기존에 알지 못했던 여러 이미지 디텍터 및 RNN에 기반한 문장 이해에 관련한 문제해결 능력을 기를 수 있었고, 모델 구축하는 법에 대해서 더욱 이해할 수 있었다

김아영

OCR 모델이 detect와 recognition 모델이 합쳐진 것이라는 것을 알게 되었으며, 이를 end to end로 해결하는 naver의 Donut이란 모델을 알 수 있었다.

또한 이를 응용하는 애플리케이션을 만드는 계획에서 합성을 위한 여러 가지 방법론을 고민해 볼 수 있었다.

하지만 처음 진행해보는 AI 프로젝트여서 시간적으로 부족함이 많아 아쉬움도 많았다.

<팀원별 향후계획>

박지영

학습한 내용과 추가적인 공부를 통해 일기 앱의 UX/UI를 설계하고 React-Native를 통해 구현할 예정이다.

이대호

학습한 내용을 토대로 자연어처리 분야의 공부를 심화 학습할 예정이다.

또한 더욱 견고한 OCR 모델 구축하고 관련하여 논문을 투고해볼 계획이 있다.

김아영

이미지 번역을 계획했지만, OCR model에 시간을 많이 소모하여 관련 방법론을 고안만 했을 뿐 개발을 하지 못해 아쉬웠다.

진행했던 프로젝트를 토대로 프로젝트 초에 고안했던 계획을 수행해나갈 계획이다.

<발표자료>