본문 바로가기
언어학

음성 변환과 합성, 자동 번역 및 번역 지원

by 키리타니 2023. 2. 17.
반응형

수식의 음성 변환

수학 공식과 각종 과학 기술 분야에서 사용하는 심벌은 일반적인 텍스트로는 표현에 제약이 있거나 해당 분야 전문가가 아니면 여러 전문적인 기호와 수식들로 정확하게 읽을 수 없는 경우가 많다. 음성 합성 기술이 발전됨에 따라 수식을 읽어주는 기능이 발달하고 그 부분에 중점적으로 접목하여 장애인뿐만 아니라 일반인들의 교육용에도 점점 많이 응용이 시도되고 있다.

 

인터넷에서의 음성 합성

음성 합성 마크업 언어 - 텍스트 음성 변환을 위한 XML 기반의 마크업 언어가 다수 있다. 최근 SSML W3C에서 제안되어 초안 상태이며, 이외에도 SABLE, JSML 등이 있다. Cascading Style Sheets 2의 이전 버전인 Aural Cascading Style Sheets을 포함한다. 대화 마크업 언어는 텍스트 음성 변환뿐만 아니라, 음성 인식 등도 지원하고 있어, 음성 합성 마크업 언어인 VoiceXML은 같은 대화 마크업 언어와는 다르다고 볼 수 있다.

최근 해외에선 구글 TTS, 대한민국에선 [보이스몬] Archived 2014 12 23 - 웨이백 머신, 웹톡스 와 같이 별도의 플러그인 소프트웨어 없이 특정 자바스크립트 삽입 만으로 인터넷을 통해 원격에서 음성지원이 되는 웹스크린리더 기술이 보편적인 시력 및 시각 장애인과 난독증과 같은 학습장애, 인지장애인과 노인, 다문화가족 등의 웹접근성을 지원하기 위해 사용되고 있다.

화자 인식(Speaker Recognition)은 음성 인식 분야의 가장 어려운 분야 중 하나이며, 이론상으로는 완벽한 식별은 불가능하다고 알려져 있다. 음성 인식 보안 설루션에 많이 가장 많이 응용되고 있는 기술이기도 하다. , 입력받은 음성 데이터를 미리 저장된 데이터베이스와 비교하여 화자가 누구인지 식별하는 기술을 말한다.

기계 번역은 다른 말로 자동 번역이라고도 하는데, 인간이 사용하는 자연 언어를 컴퓨터를 사용하여 다른 언어로 번역하는 일을 말한다.

장점으로는 일관성과 통일성이 있게 번역되는 점을 들 수 있다. 다만, 기계 번역은 현재로서는 자연스러운 번역을 보장하기는 어려우며, 문장이 부자연스러운 어투로 나오는 경우가 사실 잦다. 하지만 기술적인 진보가 계속해서 이루어지고 있어, 통계 및 인공 지능과 컴퓨터 처리 능력의 발전으로 점점 더 빠르게 성장할 것이다.

기계 번역의 개념 자체는 컴퓨터의 존재 이전부터 존재하기 때문에 기계 번역은 번역 소프트웨어와 동의어는 아니지만, 현재 기계 번역은 대부분 번역 소프트웨어로 구현된다. 예를 들어, 영어 문장을 입력하면 그것을 번역하는 한국어 문장을 출력하는 영한 번역 소프트웨어 등이 있다.

 

초창기 기계 번역은 규칙 기반의 기술을 이용한 것이 대다수였다. 규칙기반 기술은 언어의 문법을 규칙화해 번역하는 방법으로, 개발 과정에서 언어학자가 중심이 되어야 구축이 가능한 번역 기술이었다. 규칙기반 기계 번역은 알고리즘의 기초를 문법에 두기 때문에 정확성이 매우 높다는 장점이 있었으나, 개발 시간과 비용이 많이 들기 때문에 번역 전문 대기업만 할 수 있는 분야였다. 이후 통계기반 기술은 방대한 양의 연구 자료, 즉 빅데이터를 이용해 통계적으로 규칙을 생성해 번역하는 방법이 나타난다. 1988 IBM이 통계방식의 기술을 기계번역에 도입하면서 혁신적인 변화가 일어났다. 통계기반의 기계 번역은 언어학자 없이도 개발을 할 수 있고 데이터가 많이 쌓일수록 번역의 품질이 높다는 장점이 있다. 다만, 반대로 대량의 데이터가 쌓이기 전까지는 번역의 품질이 떨어진다는 단점이 있다.

통계방식의 기계번역이 도입된 이후, 언어 데이터를 다루는 검색 엔진 기업 등의 글로벌 IT 기업들이 기계 번역 개발에 뛰어들 수 있게 됐다. 최근에는 규칙기반 기계번역도 통계기반 기술을 함께 사용하는 하이브리드 방식으로 진화 중이다.

 

번역 소프트웨어의 가능성

번역 소프트웨어의 효과적인 사용법에 대해서는 선입견에 기반한 오해가 매우 많은 것이 현실이다. 특히 초기의 번역 소프트웨어 개발에 포함된 사람들 사이에서는, 당시에 비해 하드웨어·소프트웨어적인 모든 부분에서 비약적으로 발전해 있음에도 불구하고 오해가 뿌리 깊다. 이것은 전적으로 '번역 소프트웨어를 어떻게 사용해야 하느냐'는 논의가 부족했다고 생각된다.

덧붙여, 번역가가 고급 편집 작업을 수행하는 번역 지원과 번역될 언어를 초심자가 지정하지 않은 완전 자동 번역을 혼동하는 경우가 많다. "외국어에 약해서 번역 소프트웨어를 사용한다"는 선입견을 버릴 수 없는 것이다. 이 두 가지 모두 살짝 보며 비슷한 기능으로 보일 수 있지만, 사실은 전혀 방향성이 다르다. 현재 기계 번역의 현 기술로는 소설이나 회화 등을 정확하게 100%로 그 의미와 숨어져 있는 뜻을 번역할 수 없다. 번역 소프트웨어 비교라고 칭하는 기사 등에서 번역 소프트웨어가 골칫거리로 하는 문장만을 번역하려고 하지만, 이것은 번역 소프트웨어를 활용하려는 관점에서 볼 때 극히 비실용적이다.

다만, 극히 일부의 고급 번역자는 이러한 번역 소프트웨어의 가능성에 대해 인식하여 적극적으로 활용하고 있는데, 그것은 바로 매뉴얼 등과 같은 구문과 어휘가 한정되어 있기 때문에 매우 높은 정밀도가 얻어진다. 번역할 언어와 번역될 언어에 대한 고도의 능력, 번역 능력, 컴퓨터 기술을 익힌 번역자가 번역 소프트웨어의 특성을 제대로 이해하고 사용하면 번역 작업의 효율을 대폭 향상할 수 있다.  최근 특히 컴퓨터 매뉴얼이나 사용 설명서 등 같은 유사한 문장이 많이 포함된 문서 번역 등에 있어서의 실무 번역에서는, 번역 메모리라는 번역 지원 도구가 사용되고 있다. 번역자 사이에서도 오해가 퍼져있지만, 번역 메모리와 번역 소프트웨어는 기본적인 발상을 완전히 달리할 것이다. 번역 지원 도구에 번역 메모리와 번역 소프트웨어가 포함된다. 업무용 번역 소프트웨어는 번역 메모리 기능을 포함하는 경우도 많다. 그러나 업무용 번역 소프트웨어와 함께 제공되는 번역 메모리 기능은 별도의 번역 메모리와 비교했을 때 관리 및 유연성에 있어서 뒤떨어진다. 따라서, 번역 메모리와 번역 소프트웨어를 연계시키는 작업 환경이 개발되고 있다.

 

자동 번역 및 번역 지원

기계 번역은 "자동 번역" "번역 지원"이라는 완전히 다른 두 방향으로 사용된다. (자동 번역과 번역 지원의 간략한 한 줄 정리는 위로 이동하여 번역 소프트웨어의 가능성 부분을 읽어보면 바로 알 수 있다.) 자동 번역은 번역될 언어를 초심자가 지정하지 않아, 인간의 개입을 최소화하며, 모든 것을 기계적으로 번역시키려고 한다. , 이것은 "번역할 언어를 이해할 수 없는 사람"을 위한 기술이다. 이것은 기술적으로 대단한 어려움을 수반하기 때문에 아직까지 갈 길이 멀다.

한편, 번역 지원은 전문 번역가가 번역 작업을 효율적으로 수행하기 위해 번역 소프트웨어를 활용하는 것이다. 이것은 이미 일부 선진적인 번역가에 의해 활용되고 있다. 하지만 현재로서는 고급 기술이 필요하며 누구나 사용할 수 있는 것은 아니다.

반응형

'언어학' 카테고리의 다른 글

자동번역(기계번역)과 기호학  (0) 2023.02.20
의미론과 화용론  (0) 2023.02.15
음성 변환  (0) 2023.02.15
담론과 자연언어  (0) 2023.02.14
수사학  (0) 2023.02.14

댓글