토종 음성인식기술, 구글·애플 대결에서 꽃 필 수 있을까

게시자: 양승엽, 2013. 1. 30. 오전 12:49   [ 조선비즈에 의해 업데이트됨(2013. 1. 30. 오전 12:49) ]
류현정 기자전효진 인턴기자 | 2013/01/30 09:00:00

 
음성인식 분야에서 애플과 구글의 기술력은 독보적이다. 애플은 음성인식 소프트웨어인 ‘시리(siri)’를 개발한 후, 자동차 업체들로부터 러브콜을 받고 있다. 말(言)로 자동차를 조종하는 미래형 자동차를 개발하기 위해서다. 구글은 음성인식 소프트웨어를 동영상 서비스인 유튜브(Youtube)에 적용했다. 동영상 음성을 인식하는 자막 서비스 덕분에 사용자의 만족도가 높아졌다.

공룡들의 틈바구니에서 국내 음성인식 기술이 얼마나 피울 수 있을까. 조선비즈가 지난 23일 개최한 연구포럼에 발표자 및 토론자로 참석한 박상규 한국전자통신연구원(이하 ETRI) 자동통역지식처리연구센터장과 신원호 LG전자 연구위원은 “현재 구글과 애플이 음성인식 분야에서 크게 앞서고 있지만, 국내 기술로도 해 볼만 싸움”이라고 입을 모았다.
한국 전자통신연구원(ETRI)은 지식경제부 지원으로 음성인식앱인 ‘지니 톡(Genie Talk)’을 개발, 상용화했다. LG는 ‘Q 보이스’를 앞세워 말귀를 알아듣는 각종 전자제품을 선보이고 있다. 네이버의 ‘링크’, 다음의 ‘보이스 서치’, 삼성의 ‘S 보이스’ 등도 토종 음성 인식 기술이다.

박 센터장은 “구글의 통역 서비스는 중간에 반드시 영어를 거쳐야 하는 ‘피봇(Pivot)방식’일 뿐 아니라 전 세계 50여개국을 대상으로 서비스를 동시에 진행하기 때문에 해당 언어에 대한 깊이가 얕다”고 지적했다. 구글에서 한국어-불어 통역을 시도하면 한국어-영어-불어의 3단계를 거치게 된다는 것이다. 한국어가 중간에 영어로 변환하고 다시 불어로 바뀌는 방식이다.

박 센터장은 “ETRI는 한국어를 바로 불어로 통역할 수 있는 기능을 추가 개발해 지니톡(Genie Talk)에 적용할 예정”이라면서 “구글의 피봇 방식보다 높은 통역 품질을 얻을 수 있을 것”이라고 말했다.

LG전자도 음성인식 기술 개발 초기엔 어려움을 겪었지만 현재는 각종 전자제품에 음성인식 기술을 탑재해 상용화하고 있다.
▲박수 소리를 인식하는 로봇 청소기 ▲‘김치’,’치즈’,’스마일’ 등 소리를 인식해 사진을 자동으로 찍는 스마트 셔터 ▲일정이나 책을 읽어주는 음성합성기능 등 기술적용 범위가 넓어졌다. LG전자는 얼마 전 미국 라스베이거스에서 열린 국제전자제품박람회(CES)에서 자연어 처리 기능을 제공하는 스마트TV를 선보였다.

신 연구위원은 “음성인식 기술이 실용화 되기 위해서는 휴대폰과 자동차 등 일상생활과 밀접한 기기에 결합돼야 한다”며 “‘한국어’ 특성에 맞는 자연어 처리는 LG전자의 기술이 경쟁사보다 뛰어나다고 본다”고 말했다.

이번 포럼 토론자들은 음성인식 기술의 미래를 긍정적으로 평가했다. 박 센터장은 “음성인식 기술은 50여 년 전부터 이미 있던 기술인데 상용화되지 못하다가 최근 데이터 수집 기술 발달에 힘입어 급성장하고 있다”이라며 “모바일 정보검색이나 자동차 네비게이션 등 적절한 응용분야를 찾아내는 것이 요하다”고 말했다.

박 센터장은 “음성인식 기술을 활용해 교육용 소프트웨어를 개발하면 원어민 교사 확보가 어려운 농촌지역 학생들에게도 발음을 교정해주는 좋은 학습 도구를 제공해줄 수 있다”이라고 덧붙였다.

신 연구위원 역시 “음성인식은 실패한 기술이라는 분위기가 팽배했을 때 구글이 좋은 역할을 해 준 게 사실”이라면서 “전 세계 음성인식 기술업체들은 서로 협력해 더 나은 제품을 만드는 데, Q보이스나 스마트TV의 음성인식기술도 구글과 뉘앙스 기술을 결합해 발전을 거듭하는 중”이라고 말했다.


Copyrights ⓒ ChosunBiz.com
Comments