피벗 언어

Pivot language

피벗 언어(bridge language라고도 불리기도 함)는 여러 다른 언어 간의 번역 중간 언어로 사용되는 인공 또는 자연 언어입니다. 즉, A와 B의 어떤 언어 쌍 간에 번역하거나 A를 피벗 언어 P로 번역하거나 P에서 B로 번역하거나 하는 것입니다.피벗 언어를 사용하면 언어 조합의 수가 2차2) 2 - 2 가 아닌 (- { displaystyle이므로 지원되는 모든 언어의 조합에 번역자가 배치되는 것이 불필요합니다.rac – A와 B의 가능한 모든 조합에 대해 다른 번역자가 필요하지 않고 A와 피벗 언어 P(및 B와 피벗 P)만 알면 .

피벗 언어의 단점은 재전송의 각 단계에서 발생할 수 있는 오류와 모호성이 발생한다는 것입니다. 피벗 언어를 사용하려면 한 단계가 아닌 두 단계가 필요합니다.를 들어 에르난 코르테스가 메소아메리카 인디언들과 의사소통을 할 때, 그는 스페인어로 Geronimo de Aguilar에게 말을 걸었고, Geronimo de Aguilar는 Malintzin에게 마야어를 말했고, Gernimo de Aguilar는 현지인들에게 나후아틀어를 말했다.

영어, 프랑스어, 러시아어, 아랍어가 피벗 언어로 자주 사용됩니다.인터링구아는 국제회의에서 피벗 언어로 사용되어 왔으며 유럽연합[1]피벗 언어로 제안되어 왔다.에스페란토분산 언어 번역 프로젝트에서 피벗 언어로 제안되었으며, 에스페란토 웹사이트 Majstro.com에 있는 Majstro Tradukvortaro에서 이와 같이 사용되고 있습니다.Universal Networking Language는 피벗 언어로 사용하도록 특별히 설계된 인공 언어입니다.

컴퓨팅의 경우

또한 피벗 코딩은 컴퓨터 시스템의 일반적인 데이터 변환 방법입니다.예를 들어 인터넷 프로토콜, XML고급 언어는 컴퓨터 데이터의 피벗 부호화이며, 특정 컴퓨터 시스템의 내부 바이너리 형식으로 렌더링되는 경우가 많습니다.

유니코드는 기존의 다양한 주요 문자 인코딩들 간의 피벗 코딩으로 사용할 수 있도록 설계되었지만, 그 자체로 코딩으로서 널리 채택되어 이 사용은 중요하지 않았다.

기계번역중

현재의 통계기계번역(SMT) 시스템에서는 소스 언어 및 타깃 언어(t)에 병렬 말뭉치를 사용하여 양호한 결과를 얻을 수 있지만, 일부 언어에서는 양호한 병렬 말뭉치를 사용할 수 없습니다.피벗 언어(p)는, 기존의 병행 코퍼스의 전부 또는 일부가 아직 수중에 없는 2개의 언어간의 브리지를 가능하게 한다.

피벗 번역은 다른 코퍼라를 사용하여 전송되는 정보의 충실도가 떨어지기 때문에 문제가 될 수 있습니다.2개의 2개 국어 코퍼(s-p & p-t)를 사용하여 s-t 브릿지를 셋업하면 언어 데이터가 손실될 수밖에 없습니다.RBMT(Rule-Based Machine Translation)는 시스템이 이 정보를 복구하는 데 도움이 되기 때문에 시스템은 통계 정보뿐만 아니라 구조 언어 정보에도 의존하지 않습니다.

기계번역에서는 피벗 언어를 사용하기 위해 세 가지 기본 기술이 사용됩니다. (1) 소스와 피벗(s-p) 사이 및 피벗과 타깃(p-t) 사이에 병렬로 있는 구문에 초점을 맞춘 삼각 측량, (2) 소스 언어의 전체 문장을 피벗 언어로 변환한 다음 타깃 언어로 변환하는 전송, (3) 합성.ich는 시스템 트레이닝을 위해 자체 말뭉치를 구축합니다.

삼각측량법(구절표 곱셈이라고도 함)은 s-p와 p-t의 변환 대응과 어휘적 가중치 양쪽의 확률을 계산하여 새로운 s-t 구절표를 유도합니다.전달 방법(문장 변환 전략이라고도 함)은 단순히 확률론적 테스트(삼각 측량)를 사용하지 않고 s를 p로 변환한 다음 p를 t로 변환한다.합성 방법은 기존의 s의 말뭉치를 사용하며, 시스템이 자체 훈련을 위해 사용하는 자체 합성 말뭉치를 구축하려고 합니다.그런 다음 2개 국어 s-p 말뭉치를 합성하여 p-t 번역을 가능하게 한다.

SMT 시스템의 삼각 측량 방법과 전송 방법을 직접 비교한 결과, 삼각 측정이 전송보다 훨씬 더 나은 결과를 얻을 수 있었습니다.

세 가지 피벗 언어 기술은 모두 SMT 시스템의 성능을 향상시킵니다.그러나 합성 기법이 RBMT와 잘 맞지 않아 시스템 성능이 예상보다 낮습니다.하이브리드 SMT/RBMT 시스템은 불량 병렬 코퍼스에 의존하는 엄격한 SMT 시스템보다 우수한 번역 품질을 달성합니다.

RBMT 시스템의 핵심 역할은 이러한 유사성이 s-t의 SMT 모델에 포함된다는 점에서 s-p → p-t의 변환 과정에서 남은 공백을 메우는 데 도움이 된다는 것이다.

레퍼런스

  1. ^ 브레인스트럽, 토마스"언어학?"UE에 없습니다. [언어 사용?]EU에는 없습니다.인터링구아 파노라마, 2006년 제5호