당연할거라 생각했지만 긴장했고, 결과에 묘한 안도감이 흘렀다. 21일 세종대학교, 세종사이버대와 국제통번역협회가 공동 주최한 ‘인간 대 인공지능의 번역대결’에서 번역사 4명과 인공지능 번역기 3개가 같은 과제를 번역한 결과 30점 만점에 번역사는 평균 24.5점, 인공지능 번역은 평균 10점을 기록했다.
최근 기계번역은 문장 전체 맥락을 고려해 번역하는 인공신경망번역기술(NMT)이 상용화 됐지만 ▲오역 및 누락여부 ▲심층적 의미 파악 여부 ▲어법에 맞는 표현 ▲어휘선택과 표현의 적절성 ▲내용의 논리성 ▲전후맥락 고려여부 등을 종합한 결과는 아직 미진한 단계라는 분석이다.
지난해 바둑에서 인공지능 ‘알파고’가 이세돌 9단을 누른 이후 관심이 높았지만 승패는 다소 싱겁게 갈렸다. 바둑과 달리 승패를 가리기 어려운 대결이었다는 점에서 결과보다는 인공지능 활용 범위를 확인해보는 자리였다는 평가가 나왔다.
대결은 문학과 비문학 분야로 나누어 진행됐으며, 영어를 국어로, 국어를 영어로 번역하는 4개 지문이 각각 주어졌다. 인간 대표는 한국외대 통번역대학원 출신 전문번역사 4명이 출전했고 번역에 50분의 시간이 배정됐다. 인터넷검색도 허용했다. 인공지능은 구글, 네이버파파고, 시스트란 등 3개사 번역기가 나왔다.
결과와 관련해 심사위원장을 맡은 곽중철 한국외대 교수는 “인공지능은 80~90%의 문장이 어법에 맞지 않고 고유명사와 일반명사도 잘 구분하지 못했다”며 “어순을 재구성하지 않고 단어를 순서대로 나열하는 경향이 있었다”고 밝혔다. 허명수 한동대 교수(한국번역학회장)도 “통번역의 경우 글에 담긴 감정이나 문학적인 요소 등이 고려돼야 하는데 전혀 반영되지 않았다”며 “기계가 글에 실린 사람의 마음까지 알아내기에는 아직 역부족인 것 같다”고 설명했다.
하지만 비문학 분야의 기사 글 일부는 완벽하게 번역해내는 등 일정한 패턴을 갖는 문장에서는 발전가능성을 보였다는 평가도 나왔다. 김대균 세종사이버대 교수는 “기계 번역이 토익 정도의 문장은 완벽하게 번역할 수 있다”며 “문학 외 업무분야에서는 활용도가 높을 것”이라고 전망했다.
김유석 시트스란 상무는 “NMT 기반 번역기는 현재 초등학생보다 조금 높은 수준에 있지만 시간이 갈수록 데이터가 축적되면 원숙한 수준의 번역이 가능할 것으로 전망한다”며 “고도화 절차를 거치고 정제화나 클렌징 작업을 포함시키면 NMT 방식의 번역이 생각보다 이른 시일 내에 상용화 될 수도 있을 것”이라고 밝혔다.
일각에서는 최근 활용도를 높여가고 있는 NMT 방식이 적용되지 않은 점이나 인공지능이 유리한 번역 시간 평가가 반영되지 않은 점 등을 이번 대결의 한계로 지적했다. 실제로 네이버파파고나 구글은 지난해부터 200자 이내의 문장에 대해 NMT방식의 번역 서비스를 제공하고 있지만 이번에 출제된 문제는 영한번역 220단어, 한영번역 705자 내외로 구성돼 완벽한 인공지능 방식이 아니라 일반 번역기 수준의 프로그램이 적용됐다.