하이브리드 머신 번역
Hybrid machine translation하이브리드 머신번역은 단일 머신번역 시스템 내에서 복수의 머신번역 접근법을 사용하는 것이 특징인 머신번역 방식이다.하이브리드 기계 번역 시스템을 개발하는 동기는 만족스러운 수준의 정확도를 달성하기 위한 어떤 단일 기술의 실패에서 기인한다.많은 하이브리드 기계 번역 시스템은 번역의 정확성을 향상시키는데 성공했으며, 하이브리드 방식을 채택한 인기 있는 기계 번역 시스템이 몇 가지 있다.
접근
멀티엔진
하이브리드 기계 번역에 대한 이 접근법은 여러 기계 번역 시스템을 병렬로 실행하는 것을 포함한다.모든 하위 시스템의 출력을 조합하여 최종 출력을 생성한다.가장 일반적으로 이러한 시스템은 통계 및 규칙 기반 변환 하위 시스템을 사용하지만,[1] 다른 조합은 탐구되었다.예를 들어, 카네기 멜론 대학의 연구원들은 사례 기반, 이전 기반, 지식 기반 및 통계적 번역 하위 시스템을 하나의 기계 번역 시스템으로 결합하는 데 어느 정도 성공했다.[2]
통계 규칙 생성
이 접근방식은 어휘 및 구문 규칙을 생성하기 위해 통계 데이터를 사용하는 것을 포함한다.그런 다음 입력은 규칙 기반 변환기처럼 이 규칙으로 처리된다.[1]이 접근방식은 훈련 말뭉치에서 그러한 규칙들을 추출하여 종합적이고 세분화된 언어 규칙들을 만드는 어렵고 시간이 많이 걸리는 작업을 피하려고 한다.이 접근방식은 여전히 정상적인 통계 기계 번역의 많은 문제들, 즉 번역의 정확성은 훈련 말뭉치 본문에 대한 입력 텍스트의 유사성에 크게 좌우될 것이다.그 결과, 이 기법은 도메인별 어플리케이션에서 가장 큰 성공을 거두었으며, 다수의 통계 기계 번역 시스템과 마찬가지로 도메인 적응에도 같은 어려움을 가지고 있다.[3]
멀티 패스
이 접근방식은 입력을 여러 번 연속적으로 처리하는 것을 포함한다.멀티패스 기계번역시스템에서 사용되는 가장 일반적인 기법은 규칙 기반의 기계번역시스템으로 입력을 사전 처리하는 것이다.규칙 기반 프리프로세서의 출력은 최종 출력을 생성하는 통계 기계 변환 시스템으로 전달된다.이 기법은 통계시스템이 고려해야 할 정보의 양을 제한하기 위해 사용되어 필요한 처리 능력을 현저히 감소시킨다.또한 규칙 기반 시스템이 언어에 대한 완전한 번역 시스템이 되어야 할 필요성을 제거하여 시스템 구축에 필요한 인간의 노력과 노동력의 양을 현저히 줄인다.[4]
신뢰 기반
이 접근방식은 대부분의 경우 하나의 변환 기술만 사용된다는 점에서 다른 하이브리드 접근방식과 다르다.2차번역 기술을 시도할 것인지 아니면 초기번역 출력을 진행할 것인지를 결정할 수 있는 각 번역문장에 대해 신뢰도 측정지표가 작성된다.SMT는 주의 메커니즘이 혼동될 때 NMT와 마찬가지로 복수의 반복 단어와 같은 일반적인 오류 패턴이 순서대로 나타날 때도 사용된다.