수업자료를 제작하기 위해 자료를 찾다보면 이미지 파일이나 PDF파일을 많이 만나게 된다. 두 파일 형식 모두 문서편집 형식이 아니다보니 문서 속 텍스트를 사용하기 위해 직접 타이핑 했던 기억이 있을 것이다.
이러한 문제를 해결하기 위해 구글 드라이브의 광학식 문자 판독 기능(OCR, Optical Character Reader/Recongnition)을 활용해 보도록 하자.
01. 이미지 파일에서 텍스트 추출하기
공학일반 교과서의 한 페이지를 이미지 자료로 촬영하였다. 이 사진자료에서 교과내용에 대한 설명 부분 텍스트를 사용하고자 한다. 이미지 안에 있는 텍스트를 추출하는 방법을 함께 해보도록 하자.
먼저 이미지 파일을 구글 드라이브에 저장한다.
2. 구글 드라이브에 저장한 이미지 파일에서 마우스 우클릭 --> 연결앱-->구글문서 순으로 클릭한다.
3. 이미지 파일과 같은 이름의 구글 문서 파일이 생선되면서 구글문서 파일이 열린다. 구글 문서 파일 1쪽에 이미지 파일 원본이 삽입되고, 2쪽에는 이미지 파일에서 추출된 편집 가능한 텍스트가 나온다. 이렇게 되면 해당 텍스트를 복사하여 사용이 가능하다.
02. PDF 파일에서 텍스트 추출하기
수업 자료를 검색하다 보면 마찬가지로 PDF문서의 텍스트를 추출해야 하는 경우가 있다. 이때에도 이미지와 마찬가지로 구글 OCR 기능을 사용할 수 있다. 특히 영어 논문 자료의 경우 구글 문서 도구에서 번역까지 사용한다면 더욱 유용하다.
먼저 PDF 파일을 구글 드라이브에 저장한다.
2. 구글 드라이브에 저장한 이미지 파일에서 마우스 우클릭 --> 연결앱-->구글문서 순으로 클릭한다.
3. 영어 논문의 경우 구글 문서의 '문서 번역' 기능을 이용하여 우리 말로 바꾸면 더욱 편리하게 이용 가능하다.