본문 바로가기
언어학

자동번역(기계번역)과 기호학

by 키리타니 2023. 2. 20.
반응형

자동 번역의 유용성에 관하여

현실의 번역은 서로의 언어 관계와 문화에 따라 크게 다르다. 언어는 각각 고립되어 존재하는 것이 아니라, 어느 정도 서로 영향을 주며 존재한다. 특히 공통의 역사가 긴 경우, 문법과 어휘에 공통성과 공통의 기원을 더 가질 수 있다. 그런 경우, 극단적으로 말하면 단어를 대체만 하더라도 어느 정도의 번역이 가능하기 때문에, 기계 번역도 더 쉽다.

대체적으로 대강의 의미를 알기 위한 개요적인 번역을 보자면 프랑스어, 스페인어, 이탈리아어 등 인도 유럽 어족 로맨스(Romance)어 계 어족 간의 자동 번역은 비교적 당연히 쉽다고 볼 수 있다. 또한, 영어와 로망스어계 혹은 게르만어계 언어 간의 자동 번역은 현재 실용적인 수준에 이르렀다고 할 수 있다.

한국어의 번역의 경우, 실제로 사용 가능한 수준에 있는 것은 한일 자동 번역이다. 한국어와 일본어는 교착어라는 문법적인 공통성과, 한자어를 사용해서 자동 번역의 정확도는 문체에 따라 다르지만 보통 80%~90%이다. 따라서 한일 자동 번역 게시판 등에 실제 사이트가 존재한다.

일본어의 경우 조사나 동음 이의어가 다수 존재하는 형태소를 분석하는 단계에서의 난이도가 상당히 높다. 그러므로 일반적으로 일한 번역에 비해 일영 번역의 능력은 낮은 단계에 있다. 영어 능력이 없는 사람이 영어로 된 글을 번역기를 이용하여 번역해서 완성된 영문으로 된 글을 평가할 수 없는 경우, 영어로 번역된 문장을 일본어로 다시 변환을 시도하여 일본어로 의미 합격 여부를 확인해 보면 좋다. 이러한 것은 한국어일 경우에도 마찬가지이다.

실제로 한영, 영일, 한일 모두 잘 번역기로 쓰고 있다. 특히 영일의 경우, 다시 한번 더블 체크하거나 하긴 한다. 말하고자 하는 내용이 정확하게 전달하기 위해서이다.

번역 지원의 경우는 특정 분야의 번역에 적합한 사용자 사전을 작성하면 번역 소프트웨어의 번역 품질이 크게 향상된다. 하지만 일정 규모의 기업 조직 사용자가 아닌 일반 사용자의 소규모 사용 시나리오에서는 사용자 사전의 효과보다 만드는 데 걸리는 시간과 노력이 더 크다. 그 이유는 사전 만드는 기술을 필요로 하는 사용자 지정 사전의 내용이 없을 경우 사전에 상호 이용을 위한 인프라가 없어서 번역의 양이 적기 때문인 것으로 보인다. 이러한 문제를 해결하기 위해 AAMT(아시아 태평양 기계 번역 협회)가 사용자 지정 사전을 공유할 수 있는 사양인 UPF을 만들었다. 그 후, 2006년부터 이후 모델인 UTX가 현재 개발 중이다.

 

부작용 및 사후 대책

통상적으로 위키백과, 나무위키 등과 같은 곳을 보면 다른 언어판 위키백과를 이용하여 한국어 위키백과에 문서를 만들게 되면 심심치 않게 기계 번역이 일어나는 경우도 있다. 그러나 기계 번역으로 만들어지게 되면 내용이나 문맥이 맞지 않게 되는 등 읽을 때 난해한 문제가 생길 수도 있다. 그럴 때에는 네이버나 다음의 어학사전을 이용하여 뜻풀이를 우선적으로 찾는 것이 1단계로 조치해야 효과가 있다. 차선책으로는 네이버 파파고 같은 번역기로 돌리게 될 때 틀린 문장이 나타나게 되면 이 문장을 가지고 이면지에 볼펜을 이용하여 적바림 한 뒤 문서를 생성시켜서 제대로 된 문장을 완성시키는 것이 물론 중요하다. 그러니까 기계 번역은 아예 하지 말아야 하는 것이 차선책이며, 부수된 내용으로만 가지고 확인해야 절충안이 성립된다.

(하지만 나는 정말 잘 쓰고 있다. 구글 번역기는 사실 잘 모르겠지만, 파파고의 경우는 여기까지 이렇게까지 기계 번역이 된다고?라고 놀랄 만큼 높은 수준에 와있다.

중고등학교 시절, 미래에는 없어질 직업군으로 통역사, 번역가를 본 적이 있으며 지금도 꾸준히 나오고 이와 같은 리스트에 올라오고 있는 직업군이다. 이전에는 말도 안 되며, 기계가 어떻게 언어의 전체를 다 이해할까 생각했는데 요즘에는 정말 없어질 수도 있겠다 싶기 때문이다.)

 

인접 분야와 학제적 연구

언어학은 연구 주제에서 문학, 철학, 인류학, 심리학, 인지과학 등 공유하는 부분이 있다. 언어를 연구하는 분야들은 서로 겹치는 부분들이 많기 때문에 어느 특정 학문 분야의 하위 분과로 분류하기 어려운 경우가 많다. 이러한 분야들은 흔히 학제적 연구라고 불린다. 이들은 언어학을 비롯한 여러 학문들 사이의 경계에 놓여 있으며 일부 분야는 언어에 관련된 것임에도 불구하고 언어학자들에 의해서는 거의 연구되지 않는 경우도 있다.

 

기호학. 사회언어학, 언어 되살리기, 수리언어학, 신경언어학, 심리언어학, 언어병리학 - 언어장애, 언어치료, 언어습득, 응용언어학 인류언어학, 인지언어학, 자연언어처리 : 음성처리, 음성인식, 음성합성, 화자인식, 기계번역, 전산언어학, 통계언어학, 언어지리학, 언어철학

기호학은 어떠한 의미가 만들어지고 소비되는 것에 대한 학문이다. 이를 위해 기호학자들은 기호가 발생하는 과정으로 기호 생성, 기호의 작용과정과 같은 기호작용, 기표화, 소통 등의 개념을 가지고 연구한다. 기호학은 언어의 구조와 그 의미를 연구한다는 의미에서 일반적으로 언어학 분야와 맞닿아 있지만, 언어학과 다르게 기호학은 비언어 기호 체계도 연구 대상으로 삼는다.

 

역사

기호학이라는 단어는 원래 존 로크의 《인간 이해에 관한 에세이》 (1690)에서 파생되었다. 여기 로크는 '표징', '징표' 등으로 번역되는 그리스어 단어인 세메이온이라는 단어에 기초로 하여 "semeiotike"라는 표현을 사용했다. 그러나 이 이후 기호학 연구가 실제로 일어나거나 제시된 적은 없었지만, 구조주의 언어학의 창시자 페르디낭 드 소쉬르의 《일반언어학 강의》(1916)에 의해 사실상 다시 제안되었다.

찰스 샌더스 퍼스의 관점은 언어적 또는 인위적인 수화와 수화 과정, 추론 방식, 조사 과정 전반에 대해 연구된 철학적 논리로 여겨진다. 퍼스 기호학은 기호, 물체, 해석자를 포함한 3차적이다. 피어스 기호학은 세 가지 요소 각각을 세 가지 하위 유형으로 세분화한다.

파리 기호학파는 서사를 연구하는 서사기호학을 더욱 발전시켰다.

여기에서 새로운 기호학 분류인 시각기호학과 정념기호학을 도출해 냈다.

또한 여기서 생물체들이 자신만의 기호 세상에서 적응하고 결과를 예측하는 것에 대한 연구인 생물기호학도 있다. 생물기호학은 언어 이전의 의미 형성, 생물학적 해석 과정, 기호 및 코드의 생성 및 의사소통 과정을 연구하는 기호학 및 생물학 분야다.

생물기호학은 생물학과 기호학의 발견을 통합하고 기호학이 내재적이고 본질적인 특징 중 하나인 생명에 대한 과학적 관점의 패러다임적 전환을 제안한다. 생물학의 규범적 관점에 도전하는 이 분야는 일반적으로 이론과 응용 생물기호학으로 나뉜다고 볼 수 있다.

생물 기호학의 통찰력은 인간-동물 연구, 인간-식물 연구 및 사이버 기호학을 포함한 인문학 및 사회 과학에서도 여러 분야에서 채택되었다.

연구 중인 기본 기호 유형에 따라 생물 기호학은 다음과 같이 나눌 수 있다.

식물 기호학은 세포 및 조직 수준에서 모든 유기체에서 발생한다. 식물 기호학에는 원핵생물 기호학, 정족수 감지 및 정족수 소광이라 말할 수 있는 박테리아 커뮤니티의 기호 매개 상호 작용이 포함된다.

동물 기호학은 신경근육계를 가진 유기체에서 발생하며 인간의 기호 학적 행동에 대한 연구인 인간 기호학도 포함한다.

 

반응형

'언어학' 카테고리의 다른 글

음성 변환과 합성, 자동 번역 및 번역 지원  (0) 2023.02.17
의미론과 화용론  (0) 2023.02.15
음성 변환  (0) 2023.02.15
담론과 자연언어  (0) 2023.02.14
수사학  (0) 2023.02.14

댓글