오디오 신호 처리
Audio signal processing오디오 신호 처리는 오디오 신호의 전자적 조작과 관련된 신호 처리의 하위 필드입니다.오디오 신호는 음파를 전자적으로 표현한 것입니다. 즉, 압축과 희박화로 구성된 공기를 통과하는 종파입니다.오디오 신호에 포함되는 에너지는 일반적으로 데시벨 단위로 측정됩니다.오디오 신호는 디지털 형식 또는 아날로그 형식 중 하나로 표현될 수 있으므로 어느 영역에서나 처리가 발생할 수 있다.아날로그 프로세서는 전기 신호로 직접 동작하는 반면 디지털 프로세서는 디지털 표현으로 수학적으로 동작합니다.
역사
오디오 신호 처리의 동기는 20세기 초에 오디오 신호의 전송과 저장을 가능하게 하는 전화, 축음기, 라디오와 같은 발명품과 함께 시작되었다.스튜디오에서 송신기로의 [1]링크에 많은 문제가 있었기 때문에, 오디오 처리는 초기 라디오 방송에 필요했습니다.신호 처리 이론과 오디오에 대한 적용은 주로 20세기 중반 벨 연구소에서 개발되었습니다.클로드 섀넌과 해리 나이키스트는 통신 이론, 샘플링 이론 및 펄스 부호 변조(PCM)에 대한 초기 연구를 통해 이 분야의 기초를 닦았습니다.1957년, 맥스 매튜스는 컴퓨터에서 오디오를 합성하여 컴퓨터 음악을 탄생시킨 최초의 사람이 되었다.
디지털 오디오 코딩 및 오디오 데이터 압축의 주요 발전에는 C에 의한 Differential Pulse-Code Modulation(DPCM; 차분 펄스 코드 변조)이 있습니다. 1950년 [2]벨 연구소의 Chapin Cutler,[3] 1966년 이타쿠라 후미타다(나고야 대학)와 사이토 슈조(일본 전신 전화)의 선형 예측 부호화(LPC), P의 적응형 DPCM(ADPCM).Cummiskey, Nikil S. Jayant, 그리고 James L. 1973년 [4][5]Bell Labs의 Flanagan, [6]1974년 Nasir Ahmed, T. Natarajan 및 K. Rao의 이산 코사인 변환(DCT) 코드화, Bradley 대학의 A. W. Johnson 및 B. Bradley 대학의 J. P. Princen의 수정 이산 코사인 변환(MDCT) 코드화.LPC는 지각 코딩의 기초이며 음성 [8]코딩에 널리 사용되는 반면, MDCT 코딩은 MP3 및 Advanced Audio Coding(AAC;[10] 어드밴스드 오디오 코딩)과[9] 같은 최신 오디오 코딩 형식에서 널리 사용됩니다.
아날로그 신호
아날로그 오디오 신호는 공기 중의 음파와 유사한 전압 또는 전류로 표시되는 연속 신호입니다.아날로그 신호 처리에는 전기 회로를 통해 전압이나 전류 또는 전하를 변경함으로써 연속 신호를 물리적으로 변경하는 작업이 포함됩니다.
역사적으로 디지털 기술이 널리 보급되기 전에는 아날로그가 신호를 조작하는 유일한 방법이었다.그 이후로 컴퓨터와 소프트웨어가 점점 더 능력 있고 저렴해지면서 디지털 신호 처리가 선택되는 방법이 되었습니다.그러나 음악 애플리케이션에서는 아날로그 기술이 디지털 필터로는 복제하기 어려운 비선형 응답을 생성하는 경우가 많기 때문에 여전히 바람직한 경우가 많습니다.
디지털 신호
디지털 표현은 오디오 파형을 일련의 기호(일반적으로 이진수)로 나타냅니다.이를 통해 디지털 신호 프로세서, 마이크로프로세서 및 범용 컴퓨터와 같은 디지털 회로를 이용한 신호 처리가 가능합니다.대부분의 최신 오디오 시스템은 디지털 신호 처리 [11]기술이 아날로그 도메인 신호 처리보다 훨씬 강력하고 효율적이기 때문에 디지털 방식을 사용합니다.
적용들
처리방법 및 적용영역은 기억, 데이터 압축, 음악정보 검색, 음성처리, 현지화, 음향검출, 송신, 노이즈 캔슬레이션, 음향지문, 음향인식, 합성 및 강화(예를 들어 균등화, 필터링, 레벨압축, 에코 및 리버브 제거 또는 부가)를 포함한다.등)을 클릭합니다.
오디오 방송
오디오 신호 처리는 오디오 신호의 충실도를 높이거나 대역폭 또는 지연을 최적화하기 위해 오디오 신호를 브로드캐스트할 때 사용됩니다.이 도메인에서는 가장 중요한 오디오 처리가 송신기 직전에 이루어집니다.여기서 오디오 프로세서는 과잉변조를 방지하거나 최소화하고 비선형 송신기(중파 및 단파 방송의 잠재적 문제)를 보상하며 전체적인 음량을 원하는 수준으로 조정해야 합니다.
액티브 노이즈 컨트롤
액티브 노이즈 컨트롤은 불필요한 소리를 줄이기 위해 설계된 기술입니다.불필요한 노이즈와 동일하지만 극성은 반대인 신호를 생성함으로써 파괴적인 간섭으로 인해 두 신호가 상쇄됩니다.
오디오 합성
오디오 합성은 오디오 신호의 전자 생성입니다.이것을 실현하는 악기는 신시사이저라고 불립니다.신시사이저는 소리를 흉내내거나 새로운 소리를 낼 수 있다.음성 합성은 음성 합성을 사용하여 인간의 음성을 생성하는데도 사용됩니다.
오디오 효과
오디오 효과는 악기나 다른 오디오 소스의 소리를 변화시킵니다.일반적인 효과로는 일렉트릭 블루스 및 록 음악에서 종종 전기 기타와 함께 사용되는 왜곡, 음량에 영향을 미치는 볼륨 페달 및 압축기 등의 동적 효과, 주파수 범위를 변경하는 와와 페달 및 그래픽 이퀄라이저 등의 필터, 코러스, 플레인저 및 페이저 등의 변조 효과, 피치 효과 등이 있습니다.h 시프터(h shifters) 및 시간 효과(reverbase나 delay 등)는 에코 사운드를 생성하고 다른 공간의 사운드를 에뮬레이트합니다.
음악가, 오디오 엔지니어 및 음반 제작자는 라이브 공연 중 또는 스튜디오에서 이펙트 유닛을 사용합니다.일반적으로 일렉트릭 기타, 베이스 기타, 일렉트로닉 키보드 또는 일렉트릭 피아노가 사용됩니다.이펙트는 전기악기나 전자악기에 가장 많이 사용되지만 음향악기, 드럼, [12][13]보컬 등 모든 오디오 소스에 사용할 수 있습니다.
컴퓨터 오디션
컴퓨터 오디션(CA) 또는 머신 리스닝은 머신에 [14][15]의한 오디오 이해에 관한 알고리즘과 시스템의 일반적인 연구 분야입니다.기계가 "듣는" 것이 의미하는 바는 매우 광범위하고 다소 모호하기 때문에, 컴퓨터 오디션은 원래 특정한 문제를 다루거나 구체적인 응용 분야를 염두에 둔 몇 가지 분야를 하나로 모으려고 시도합니다.Technology Review에서 인터뷰한 엔지니어 Paris Smargdis는 이 시스템에 대해 말합니다.-"실내로 이동하는 사람의 위치를 파악하고, 곧 고장날 경우를 대비해 기계를 감시하거나,[16] 교통 카메라를 작동시켜 사고를 기록하는 소프트웨어입니다."
인간 오디션 모델에서 영감을 받아 CA는 컴퓨터에 의한 오디오 및 음악 신호에 대한 지능적인 작업을 수행하기 위해 표현, 변환, 그룹화, 음악 지식의 사용 및 일반적인 소리 의미론을 다룬다.기술적으로 이것은 음악 지식 [17][18]표현을 위한 보다 전통적인 인공지능 방법뿐만 아니라 신호 처리, 청각 모델링, 음악 지각 및 인지, 패턴 인식 및 기계 학습 분야의 방법의 조합을 요구한다.「 」를 참조해 주세요.
레퍼런스
- ^ Atti, Andreas Spanias, Ted Painter, Venkatraman (2006). Audio signal processing and coding ([Online-Ausg.] ed.). Hoboken, NJ: John Wiley & Sons. p. 464. ISBN 0-471-79147-4.
- ^ 미국 특허 2605361, C.Chapin Cutler, "통신 신호의 차분 양자화", 1952-07-29 발행
- ^ Gray, Robert M. (2010). "A History of Realtime Digital Speech on Packet Networks: Part II of Linear Predictive Coding and the Internet Protocol" (PDF). Found. Trends Signal Process. 3 (4): 203–303. doi:10.1561/2000000036. ISSN 1932-8346.
- ^ P. Cummiskey, Nikil S. Jayant 및 J. L. Flanagan, "Differential PCM Coding of Speech", Bell Syst. Tech. J., 제52권, 1105페이지 - 1118, 1973년 9월
- ^ Cummiskey, P.; Jayant, Nikil S.; Flanagan, J. L. (1973). "Adaptive quantization in differential PCM coding of speech". The Bell System Technical Journal. 52 (7): 1105–1118. doi:10.1002/j.1538-7305.1973.tb02007.x. ISSN 0005-8580.
- ^ Nasir Ahmed; T. Natarajan; Kamisetty Ramamohan Rao (January 1974). "Discrete Cosine Transform" (PDF). IEEE Transactions on Computers. C-23 (1): 90–93. doi:10.1109/T-C.1974.223784.
- ^ J. P. Princen, A. W. Johnson und A. B. Bradley: 시간 도메인 에일리어싱 취소에 근거한 필터 뱅크 설계를 사용한 서브밴드/변환 부호화, IEEE Pro.국제 음향, 음성, 신호 처리 회의(ICASSP), 2161-2164, 1987.
- ^ Schroeder, Manfred R. (2014). "Bell Laboratories". Acoustics, Information, and Communication: Memorial Volume in Honor of Manfred R. Schroeder. Springer. p. 388. ISBN 9783319056609.
- ^ Guckert, John (Spring 2012). "The Use of FFT and MDCT in MP3 Audio Compression" (PDF). University of Utah. Retrieved 14 July 2019.
- ^ Brandenburg, Karlheinz (1999). "MP3 and AAC Explained" (PDF). Archived (PDF) from the original on 2017-02-13.
- ^ Zölzer, Udo (1997). Digital Audio Signal Processing. John Wiley and Sons. ISBN 0-471-97226-6.
- ^ Horne, Greg (2000). Complete Acoustic Guitar Method: Mastering Acoustic Guitar c. Alfred Music. p. 92. ISBN 9781457415043.
- ^ Yakabuski, Jim (2001). Professional Sound Reinforcement Techniques: Tips and Tricks of a Concert Sound Engineer. Hal Leonard. p. 139. ISBN 9781931140065.
- ^ "Machine Audition: Principles, Algorithms and Systems".
- ^ "Machine Audition: Principles, Algorithms and Systems" (PDF).
- ^ Paris Smaragdis는 컴퓨터에 좀 더 생생한 음악을 연주하는 법을 가르쳤다.
- ^ Tanguiane (Tangian), Andranick (1993). Artificial Perception and Music Recognition. Lecture Notes in Artificial Intelligence. Vol. 746. Berlin-Heidelberg: Springer. ISBN 978-3-540-57394-4.
- ^ Tanguiane (Tanguiane), Andranick (1994). "A principle of correlativity of perception and its application to music recognition". Music Perception. 11 (4): 465–502. doi:10.2307/40285634.
추가 정보
- Rocchesso, Davide (March 20, 2003). Introduction to Sound Processing (PDF).
- Wilmering, Thomas; Moffat, David; Milo, Alessia; Sandler, Mark B. (2020). "A History of Audio Effects". Applied Sciences. 10 (3): 791. doi:10.3390/app10030791.