에코 억제 및 취소
Echo suppression and cancellation이 글은 검증을 위해 인용구가 추가로 필요하다. 및 – · · 책 · · (2011년 1월) (이 템플릿 과 시기 |
에코 억제와 에코 해제는 전화에서 에코가 생성되는 것을 방지하거나 이미 존재하는 후에 이를 제거함으로써 음성 품질을 향상시키기 위해 사용하는 방법이다. 에코 억제는 주관적인 오디오 품질을 향상시키는 것 외에도, 에코가 통신 네트워크를 통해 이동하는 것을 방지함으로써 침묵 억제를 통해 달성되는 용량을 증가시킨다. 에코 억제기는 1950년대에 통신용 인공위성의 최초 사용에 대응하여 개발되었다.
에코 억제 및 취소 방법은 일반적으로 AES(음향 에코 억제)와 AEC(음향 에코 취소)라고 하며, 보다 드물게 라인 에코 취소(LEC)라고 한다. 음향 에코(확성기가 마이크에 의해 반사되어 녹음되는 소리)와 라인 에코(예: 송신과 수신의 결합에 의해 야기되는 전기 충격) 등 독특한 특성을 가진 에코의 종류와 원인이 다양하기 때문에 이러한 용어들은 보다 정밀하다.ng선, 임피던스 불일치, 전기 반사 등 음향 에코보다 훨씬 작은 변화).[1] 그러나 실제로 모든 종류의 메아리를 치료하기 위해 동일한 기법을 사용하므로, 음향 에코 취소기는 음향 에코뿐만 아니라 라인 에코도 취소할 수 있다. 특히 AEC는 음향 에코, 라인 에코 또는 둘 다에 관계없이 일반적으로 에코 취소기를 지칭하는 데 사용된다.
에코 억제기와 에코 취소기는 말하는 개인이 자신의 목소리를 듣는 것을 방지하는 유사한 목표를 가지고 있지만, 그들이 사용하는 방법은 다르다.
- 에코 억제기는 음성 신호가 회로에서 한 방향으로 가는 것을 감지한 다음 다른 방향으로 신호를 음소거하거나 감쇠시키는 방식으로 작동한다. 보통 회로의 맨 끝에 있는 에코 억제기는 회로의 가까운 끝에서 오는 음성을 감지할 때 이 돌연변이를 일으킨다. 이 돌연변이는 화자가 맨 끝에서 돌아오는 그들 자신의 목소리를 듣지 못하게 한다.
- 에코 취소는 먼저 전송되거나 수신된 신호에서 약간의 지연과 함께 다시 나타나는 원래 전송 신호를 인식하는 것을 포함한다. 일단 메아리가 인식되면 전송되거나 수신된 신호에서 빼면 제거할 수 있다. 이 기법은 아날로그 회로에서도 구현될 수 있지만 일반적으로 디지털 신호 프로세서나 소프트웨어를 사용하여 디지털로 구현된다.[2]
ITU 표준 G.168과 P.340은 각각 디지털 및 PSTN 애플리케이션에서 에코 취소기에 대한 요건과 시험을 설명한다.
역사
전화통신에서 메아리는 얼마 후에 들은 사람의 목소리의 반사된 사본이다. 지연이 상당히 중요한 경우(몇백 밀리초 이상) 성가신 것으로 간주된다. 지연이 매우 작을 경우(10초 이하[3]) 그 현상을 시데톤이라고 한다. 지연이 50밀리초 전후로 약간 길면 인간은 뚜렷한 소리로서의 메아리를 들을 수 없고 대신 합창 효과를 들을 수 있다.[3]
전기 통신의 초기에는 에코 억제가 인간 이용자에 대한 echos의 거부감을 줄이기 위해 사용되었다. 한 사람이 다른 사람이 듣는 동안 말을 하고, 앞뒤로 말을 한다. 초음파 억제기는 어떤 것이 일차적인 방향인지 판단하여 그 채널이 앞으로 나아갈 수 있도록 한다. 역방향 채널에서는 신호가 에코라고 가정하여 어떤 신호도 차단하거나 억제하기 위해 감쇠를 배치한다. 억제기가 효과적으로 메아리를 다루지만, 이러한 접근방식은 여러 가지 문제로 이어지며, 이는 양 당사자가 통화하는 데 좌절감을 줄 수 있다.
- 이중 대화: 적어도 잠깐이라도 양측이 동시에 말하는 것은 대화에서 상당히 정상적인 일이다. 그러면 각 에코 억제기가 회로의 끝에서 나오는 음성 에너지를 감지하기 때문에, 그 효과는 보통 손실이 양방향으로 한 번에 삽입되어 양쪽을 효과적으로 차단한다. 이를 방지하기 위해 에코 억제기를 설정하여 근단 스피커와 원단 스피커가 모두 말을 할 때 손실(또는 더 작은 손실 삽입)을 삽입하지 못하도록 할 수 있다. 물론 이것은 메아리 억제기를 가지고 있는 일차적인 효과를 일시적으로 꺾는다.
- 클리핑: 초음파 억제기가 번갈아 가며 소실을 삽입하고 제거하기 때문에, 새로운 스피커가 말을 시작하면 그 스피커의 말에서 첫 음절을 잘라내는 약간의 지연이 종종 발생한다.
- 데드 세트: 통화 중인 원앙 파티가 시끄러운 환경에 있다면 원앙 스피커는 원앙 스피커가 말을 하는 동안 그 배경 소음을 듣게 되지만, 원앙 스피커가 말을 시작하면 에코 억제기가 이 배경 소음을 억제하게 된다. 갑자기 배경 잡음이 없어져 근거리 사용자는 줄이 끊긴 듯한 인상을 준다.
이에 대응하여 벨 연구소는 1960년대 초에 에코 취소기 이론을 발전시켰고,[4][5] 그 결과 1960년대 후반에는 실험실 에코 취소기가, 1980년대에는 상업용 에코 취소기가 생겨났다.[6] 메아리 취소기는 말하는 사람의 신호에서 메아리 추정치를 생성하여 작동하고, 돌아오는 경로에서 그 추정치를 뺀다. 이 기법에는 에코를 효과적으로 취소할 수 있을 정도로 정확한 신호를 생성하기 위한 적응형 필터가 필요한데, 도중에 여러 종류의 열화로 인해 에코가 원본과 다를 수 있다. AT&T Bell Labs의[5] 발명은 에코 취소 알고리즘을 개선하고 연마했다. 모든 에코 취소 프로세스와 마찬가지로, 이러한 첫 번째 알고리즘은 불가피하게 전송 경로에 다시 진입할 신호를 예상하여 이를 취소하도록 설계되었다.
디지털 신호 처리의 빠른 발전은 에코 취소기를 더 작고 비용 효율적으로 만들 수 있게 했다. 1990년대에 에코 취소기는 독립형 기기가 아닌 음성 스위치(Northern Telecom DMS-250) 내에서 최초로 구현되었다. 에코 취소를 스위치에 직접 통합하는 것은 에코 취소기를 통화별로 안정적으로 켜거나 끌 수 있다는 것을 의미했으며, 음성 및 데이터 통화에 대해 별도의 트렁크 그룹이 필요하지 않았다. 오늘날의 전화 기술은 종종 소프트웨어 음성 엔진을 통해 소형 또는 휴대용 통신장치에 에코 취소기를 채택하는데, 이는 음향 반향 또는 원단 PSTN 게이트웨이 시스템에 의해 도입된 잔류 반향의 취소를 제공한다. 그러한 시스템은 일반적으로 최대 64밀리초 지연으로 에코 반사를 취소한다.
작전
에코 취소 프로세스는 다음과 같이 진행된다.
- 원거리 신호가 시스템에 전달된다.
- 원거리 신호가 재현된다.
- 원거리 신호는 여과되고 지연되어 근거리 신호와 유사하다.
- 필터링된 원단 신호는 근단 신호에서 감산된다.
- 결과 신호는 직접 또는 반향된 소리를 제외한 방에 존재하는 소리를 나타낸다.
에코 취소기의 일차적인 어려움은 결과 근거리 신호와 유사하게 원거리 신호에 적용할 필터링의 특성을 결정하는 것이다. 필터는 본질적으로 스피커, 마이크 그리고 방의 음향 속성의 모델이다. 에코 취소기는 일반적으로 근거리 스피커와 마이크의 특성을 미리 알 수 없기 때문에 적응력이 있어야 한다. 근사실의 음향 속성도 일반적으로 사전에 알려져 있지 않으며, 변경될 수 있다(예: 스피커에 비해 마이크를 이동하거나 개인이 방청 반사에 변화를 일으키는 경우).[2][7] 원단 신호를 자극으로 사용함으로써 현대 시스템은 적응형 필터를 사용하며 약 200ms 내에 55dB의 취소를 제공하지 않는 것에서 수렴할 수 있다.[citation needed]
최근까지 에코 취소는 전화 회로의 음성 대역폭에만 적용하면 되었다. PSTN 호출은 인간의 음성 정보화에 필요한 범위인 300Hz에서 3kHz 사이의 주파수를 전송한다. 화상회의는 전체 대역폭 오디오가 사용되는 한 영역이다. 이 경우 에코취소를 실시하기 위해 전문화된 제품을 채용한다.
에코 억제는 알려진 한계를 가지고 있기 때문에 이상적인 상황에서는 에코 취소만 사용될 것이다. 그러나 이는 많은 애플리케이션, 특히 오랜 지연과 미미한 처리량을 가진 네트워크의 소프트웨어 전화에서 불충분하다. 여기서 에코 취소와 억제가 함께 작용하여 허용 가능한 성과를 달성할 수 있다.
수량화 에코
에코를 에코 리턴 손실(ERL)로 측정한다. 이것은 데시벨로 표현된 오리지널의 비율이고 메아리다.[8] 값이 높으면 메아리가 매우 약하다는 뜻이고, 값이 낮으면 메아리가 매우 강하다는 뜻이다. 음은 메아리가 원래 신호보다 강함을 나타내며, 이를 선택하지 않으면 오디오 피드백이 발생하게 된다.
에코 취소기의 성능은 에코 취소기에 의해 적용되는 추가 신호 손실량인 에코 리턴 손실 강화(ERLE)로 측정된다.[3][9] 대부분의 에코 취소자는 18-35dB ERLE를 적용할 수 있다.
에코(ACOM)의 총 신호 손실량은 ERL과 ERLE의 합이다.[9][10]
현재 용도
메아리의 출처는 다음과 같은 일상적인 환경에서 발견된다.
- 핸즈프리 차량 전화 시스템
- 스피커폰 모드의 표준 전화기 또는 휴대폰
- 전용 독립형 스피커폰
- 테이블 위에 천장 스피커 및 마이크를 사용하는 회의실 시스템 설치
- 라우드스피커의 진동이 핸드셋 케이스를 통해 마이크로 전달되는 물리적 커플링
이러한 경우, 확성기에서 나오는 소리는 거의 변하지 않고 마이크에 들어온다. 메아리 취소의 어려움은 주변 공간에 의한 원음 변경에서 비롯된다. 이러한 변화에는 소프트 가구에 의해 흡수되는 특정 주파수와 다양한 강도로 다양한 주파수의 반사가 포함될 수 있다.
AEC를 구현하려면 엔지니어링 전문지식과 빠른 프로세서가 필요하며, 대개 DSP(디지털 신호 프로세서)의 형태로, 이러한 처리 능력 비용은 프리미엄이 붙을 수 있지만, 많은 임베디드 시스템은 완전한 기능을 갖춘 AEC를 가지고 있다.
입력을 위해 음성을 받아들이는 스마트 스피커와 대화형 음성 응답 시스템은 AEC를 사용하는 반면 음성 프롬프트는 시스템 자체의 음성 인식이 반향된 프롬프트와 다른 출력을 잘못 인식하지 않도록 하기 위해 재생된다.
모뎀
표준 전화선은 오디오를 송수신하기 위해 동일한 한 쌍의 전선을 사용하며, 이는 송신 신호의 소량을 반사하는 결과를 낳는다. 이것은 스피커에게 자신의 목소리가 시스템을 통해 만들어지고 있다는 신호를 제공하기 때문에 전화 통화를 하는 사람들에게 유용하다. 그러나 이러한 반사 신호는 모뎀에 문제를 일으키는데, 모뎀은 원격 모뎀과 신호를 구별할 수 없다.
이러한 이유로, 이전의 전화 접속 모뎀은 신호 주파수를 분할하여 양쪽 끝의 장치들이 서로 다른 톤을 사용함으로써 각자가 전송에 사용하던 주파수 범위의 어떤 신호도 무시할 수 있게 했다. 그러나, 이것은 양쪽이 사용할 수 있는 대역폭의 양을 줄였다.
에코 취소는 이 문제를 완화시켰다. 통화 설정 및 협상 기간 동안 두 모뎀 모두 일련의 고유한 음색을 전송한 다음 전화 시스템을 통해 돌아오도록 청취한다. 그들은 총 지연 시간을 측정한 후 같은 기간 동안 지연 라인을 구성한다. 연결이 완료되면 정상적으로 전화선으로 신호를 보내지만, 지연선으로도 신호를 보낸다. 그들의 신호가 다시 반사되면 지연선에서 나오는 반전 신호와 섞여 메아리가 상쇄된다. 이로써 두 모뎀은 모두 가용한 전체 주파수를 사용할 수 있게 되어 가능한 속도가 두 배로 빨라졌다.
에코 취소 역시 많은 통신사가 회선 자체에 적용하고 있어 신호 개선보다는 데이터 손상의 원인이 될 수 있다. 일부 전화 스위치 또는 변환기(아날로그 터미널 어댑터 등)는 ITU-T 권장사항 G.164 또는 G.165에 따라 그러한 호출과 관련된 2100 또는 2225Hz 응답음을 감지할 때 에코 억제 또는 에코 취소를 비활성화한다.
ISDN과 DSL 모뎀은 표준 트위스트 페어 전화선을 통해 음성대역 이상의 주파수에서 작동하며 동시에 양방향 데이터 통신이 가능하도록 자동 에코 취소를 활용한다. 전송 신호가 디지털 비트 스트림이기 때문에 적응형 필터를 구현하는 데 있어 계산 복잡성은 음성 에코 취소와 비교하여 훨씬 감소한다. 필터의 모든 탭마다 곱하기 및 추가 작업 대신 추가만 하면 된다. RAM 조회 테이블 기반 에코 취소 체계는[11][12] 에코 추정치를 얻기 위해 송신 비트 스트림이 잘린 메모리를 간단히 처리함으로써 추가 작업까지 제거한다. 반도체 기술의 진보와 함께 이제는 디지털 신호 처리기(DSP) 기법으로 일반적으로 구현되고 있다.
일부 모뎀은 별도의 송수신 주파수를 사용하거나 송신과 수신을 위해 별도의 시간 간격을 할당하여 에코 취소의 필요성을 없앤다. 전화 케이블의 원래 설계 한계를 초과하는 높은 주파수는 브리지 탭과 불완전한 임피던스 매칭으로 인해 상당한 감쇠 왜곡을 겪는다. 에코 취소로 교정할 수 없는 깊고 좁은 주파수 간격이 종종 발생한다. 이러한 것들은 연결 협상 중에 감지되고 매핑된다.
참고 항목
참조
- ^ "Octasic: Voice Quality Enhancement & Echo Cancellation". Archived from the original on 2014-08-21. Retrieved 14 April 2014.
- ^ a b Eneroth, Peter (2001). Stereophonic Acoustic Echo Cancellation: Theory and Implementation (PDF) (Thesis). Lund University. ISBN 91-7874-110-6. ISSN 1402-8662. Retrieved 2015-06-25.
- ^ a b c "Echo in Voice over IP Systems". Retrieved 2 July 2014.
- ^ Sondhi, Man Mohan (March 1967). "An adaptive echo canceler" (PDF). Bell System Technical Journal. 46 (3): 497–511. doi:10.1002/j.1538-7305.1967.tb04231.x. Archived from the original (PDF) on 2014-04-16. Retrieved 14 April 2014.
- ^ a b US 3500000
- ^ Murano, Kazuo; Unagami, Shigeyuki; Amano, Fumio (January 1990). "Echo Cancellation and Applications" (PDF). IEEE Communications Magazine. 28 (1): 49–55. doi:10.1109/35.46671. ISSN 0163-6804. S2CID 897792. Retrieved 14 April 2014.
- ^ Åhgren, Per (November 2005). "Acoustic Echo Cancellation and Doubletalk Detection Using Estimated Loudspeaker Impulse Responses" (PDF). IEEE Transactions on Speech and Audio Processing. 13 (6): 1231–1237. CiteSeerX 10.1.1.530.4556. doi:10.1109/TSA.2005.851995. S2CID 2575877.
- ^ "What is Echo Return Loss (ERL) and how does it affect voice quality?". Archived from the original on 2015-06-26.
- ^ a b "Echo Analysis for Voice over IP". Cisco Systems. Retrieved 2 July 2014.
- ^ Kosanovic, Bogdan (2002-04-11). "Echo Cancellation Part 1: The Basics and Acoustic Echo Cancellation". EE Times. Retrieved 7 July 2014.
- ^ Holte, N.; Stueflotten, S. (1981). "A New Digital Echo Canceler for Two-Wire Subscriber Lines". IEEE Transactions on Communications. 29 (11): 1573–1581. doi:10.1109/TCOM.1981.1094923. ISSN 1558-0857.
- ^ 미국 특허 4,237,463 [1], "방향 연결기", 1978-10-20 발행
외부 링크
- "Echo cancellation". International Engineering Consortium. Archived from the original on 2007-03-08.
- "Echo basics tutorial". Ditech Networks. Archived from the original on 2011-07-10.
- "Q-Sys Acoustic Echo Cancellation" (PDF). QSC Audio Products. Retrieved 2016-07-28.