문자 변환(음악)

Transcription (music)
J.S. 바흐의 기타용 키보드 곡입니다.

음악에서, 문자 변환은 재즈 즉흥곡이나 비디오 게임 사운드트랙과 같이, 이전에 주목받지 못하거나/또는 인기 없는 음악이나 음성에 주목하는 연습이다.음악가가 녹음으로 악보를 만드는 일을 맡아서 악보를 구성하는 음표를 악보 표기로 적으면, 그 녹음을 음악적으로 옮겨 적었다고 한다.문자 변환은 또한 독주나 앙상블 중 하나의 음악을 원래 의도했던 다른 악기나 다른 악기를 위해 다시 쓰는 것을 의미할 수도 있다.프란츠 리스트의 독주 피아노용으로 녹음된 베토벤 교향곡이 그 예입니다.이런 의미에서 전사를 배열이라고 부르기도 하는데, 엄밀히 말하면 전사는 충실한 적응이지만 배열은 원곡의 중요한 측면을 변화시킨다.

음악 전사의 또 다른 예로는 벨라 바르토크와 랄프윌리엄스가 각각 헝가리와 영국의 민족 민속음악을 수집한 것과 같은 민속음악의 구전 전통에 대한 민족음악학적 표기법을 포함한다.프랑스 작곡가 올리비에 메시앙은 야생에서 새소리를 녹음했고, 그의 많은 작곡곡들, 예를 들어 그의 솔로 피아노용 카탈로그 드와소에 그것을 포함시켰다.이 성질의 문자 변환에는 스케일도 인식과 고조파 분석이 포함됩니다.둘 다 상대 피치 또는 완전 피치가 필요합니다.

대중음악과 록에는 두 가지 형태의 표기가 있다.개별 연주자들은 음표 대 음표 기타 솔로나 다른 멜로디 라인을 따라 합니다.또한, 음악 출판사들은 기타 솔로와 베이스 라인의 전체 음반을 번역하여 제본된 책으로 판매합니다.음악출판사도 대중음악의 PVG(피아노/보컬/기타) 전사를 멜로디 라인이 전사된 후 녹음 반주를 피아노 파트로 편곡한다.PVG 라벨의 기타 측면은 멜로디 위에 써진 기타 코드를 통해 달성됩니다.멜로디 아래에 가사도 포함되어 있습니다.

적응.

일부 작곡가들은 초기 작곡가의 작품과 "동일한" 버전을 만들면서 다른 작곡가에 경의를 표하고, 기악의 차이에서 비롯된 완전히 새로운 소리를 사용함으로써 그들 자신의 창의성을 더했다.이것의 가장 널리 알려진 예는 무시르그스키의 피아노 곡인 전시회의 그림들의 오케스트라 편곡이다.베베른은 바흐의 주제와 멜로디의 다른 하위 모티브를 연주하기 위해 바흐의 작품 구조를 분석하기 위해 바흐의 6부작 리커 오케스트라를 위해 그의 전사를 사용했다.

이 형식을 표기하면, 신곡이 본래 새로운 매체를 위해 작곡된 것처럼 보이도록 전문 작곡가의 기술력을 총동원하면서 원음을 동시에 흉내낼 수 있다.그러나 일부 표기 및 배열은 순전히 실용적이거나 맥락적인 이유로 행해졌다.예를 들어, 모차르트의 시대에, 그의 인기 있는 오페라의 서곡과 노래는 단지 그러한 앙상블이 공공장소에서 인기 있는 엔터테인먼트를 제공하는 일반적인 방법이었기 때문에 작은 바람 합주용으로 옮겨졌다.모차르트는 자신의 오페라 ' 지오반니'에서 자신의 오페라 '피가로결혼'의 아리아를 포함해 다른 오페라의 작은 바람 합주곡 몇 개를 옮겨 썼다.보다 현대적인 예는 발레 리허설에서 사용될 의식의 네 손 피아노를 위한 스트라빈스키의 필사본이다.오늘날 카페나 레스토랑에서 연주하는 음악가들은 종종 더 큰 그룹의 악기를 위해 쓰여진 곡들을 옮겨 쓰거나 편곡하여 연주할 것이다.

이러한 유형의 다른 표기 예로는 바흐의 4악기 협주곡의 4악기와 오케스트라를 위한 편곡, 모차르트의 현악 3중주곡의 바흐 악곡의 일부 편곡, 베토벤현악 4중주곡, 피아노와 그의 듀엣곡의 편곡 등이 있다.피아노 협주곡으로서의 그의 바이올린 협주곡의 연주, 베토벤 교향곡을 포함한 많은 작곡가의 작품을 편곡한 프란츠 리스트의 피아노 연주, 차이코프스키의 4개의 모차르트 피아노 곡을 "모차르티아나"라고 불리는 오케스트라 모음곡으로 편곡, 말러슈만 교향곡의 재연주, 그리고 쇤베르크의 오케스트라 편곡.f 브람스의 피아노 5중주곡과 바흐의 "St.앤'의 서곡과 오르간은 푸가.

피아노가 대중 악기가 된 이후 오케스트라나 실내악 앙상블을 위한 피아노의 전사와 편곡으로 큰 문학이 생겨났다.이것은 때때로 "피아노 리덕션"이라고 불리기도 하는데, 왜냐하면 오케스트라 곡에는 동시에 연주되는 20여 개의 개별적인 악기 파트가 있을 수 있기 때문이다.조지 G에 대한 다른 편곡과 같이 한 명의 피아니스트(또는 한 두 명의 피아니스트)가 있어야 하기 때문이다.어슈윈랩소디 인 블루)는 연주할 수 있다.

피아노의 축소는 합창곡에 대한 오케스트라 반주를 리허설이나 키보드만으로 연주할 목적으로 하는 경우가 많다.

많은 오케스트라 작품들이 콘서트 밴드를 위해 옮겨졌다.

전사 보조 도구

표기법 소프트웨어

데스크톱 퍼블리싱의 등장 이후 음악가들은 사용자의 음표에 대한 정신적 분석을 받은 후 이러한 음표를 개인 인쇄 또는 악보 전문 출판을 위해 표준 음악 표기로 저장 및 포맷할 수 있는 음악 표기 소프트웨어를 얻을 수 있게 되었습니다.일부 표기법 소프트웨어는 수동 노트 입력 대신 표준 MIDI 파일(SMF) 또는 MIDI 성능을 입력으로 받아들일 수 있습니다.이러한 표기법 애플리케이션은 EPS, PNG, SVG 등의 다양한 형식으로 점수를 내보낼 수 있습니다.소프트웨어에는 검증용 어플리케이션에 의해 사용자의 악보를 큰 소리로 재생할 수 있는 사운드 라이브러리가 포함되어 있는 경우가 많습니다.

저속 소프트웨어

디지털 전사 보조 장치의 발명 이전에, 음악가들은 더 느리고 소화가 잘 되는 속도로 멜로디 선과 코드를 들을 수 있도록 음반이나 테이프 녹음을 늦췄습니다.이 접근법의 문제점은 음높이도 바뀌기 때문에 일단 한 곡을 옮겨 적으면 올바른 키로 옮겨야 한다는 것입니다.음악의 음정을 바꾸지 않고 음악의 템포를 늦추도록 설계된 소프트웨어는 음악을 번역할 때 피치, 멜로디, 코드, 리듬 및 가사를 인식하는 데 매우 유용합니다.그러나 레코드 플레이어의 느린 효과와는 달리 음의 음높이와 원래 옥타브는 그대로 유지되며 음높이가 내려가지 않습니다.이 기술은 많은 무료 소프트웨어 애플리케이션에서 사용할 수 있을 정도로 단순합니다.

소프트웨어는 보통 이를 위해 2단계 프로세스를 거칩니다.우선, 오디오 파일을 원래의 파일보다 낮은 샘플링 레이트로 재생한다.이것은 느린 속도로 테이프나 비닐 레코드를 재생하는 것과 같은 효과가 있습니다.즉, 음높이가 낮아져 마치 다른 키에 있는 것처럼 들릴 수 있습니다.두 번째 단계는 Digital Signal Processing(DSP; 디지털 신호 처리)사용하여 음높이를 원래 음높이 또는 음악 키로 되돌리는 것입니다.

피치 추적 소프트웨어

"자동 음악 문자 변환" 섹션에서 언급했듯이, 일부 상용 소프트웨어는 폴리포닉 음악 레코딩에서 지배적인 멜로디의 피치를 대략 추적할 수 있습니다.노트 스캔은 정확하지 않으며 사용자가 직접 편집한 후 전용 파일 형식 또는 표준 MIDI 파일 형식으로 파일에 저장해야 하는 경우가 많습니다.일부 피치 추적 소프트웨어에서는 오디오 재생 중에 스캔한 노트 목록을 애니메이션으로 만들 수도 있습니다.

자동 음악 변환

"자동 음악 문자 변환"이라는 용어는 오디오 연구자인 제임스 A에 의해 처음 사용되었습니다.1977년 무어르, 마틴 피시잘스키, 버나드 갤러.디지털 오디오 공학에 대한 그들의 지식으로, 이 연구원들은 컴퓨터가 타악기의 리드미컬한 억양과 함께 멜로디 라인과 코드 패턴의 음높이를 감지할 수 있도록 음악의 디지털 녹음을 분석하도록 프로그램될 수 있다고 믿었다.자동 전사의 작업은 두 가지 개별적인 활동과 관련이 있습니다: 악곡의 분석과 그 [1]분석에서 악보를 출력하는 것입니다.

이것은 단순한 목표가 아니라 적어도 앞으로 30년 동안 학술 연구를 장려할 목표였다.음성과 음악의 밀접한 과학적 관계 때문에, 보다 재정적으로 자원화된 음성 인식 기술을 지향하는 많은 학술적, 상업적 연구가 음악 인식 기술에 대한 연구에 재활용될 것이다.많은 음악가들과 교육자들은 수동으로 전사를 하는 것이 발전하는 음악가들을 위한 귀중한 연습이라고 주장하지만, 자동 전사를 하는 동기는 악보의 동기와 같다: 직관적인 전사 기술이 없는 음악가들은 그들이 그만둘 수 있도록 악보나 화음 차트를 찾을 것이다.노래하는 법을 배웁니다.현재 진행 중인 이 연구에 의해 만들어진 도구 모음은 음악가들에게 큰 도움이 될 수 있다.대부분의 녹음된 음악은 악보를 이용할 수 없기 때문에, 자동 전사 장치는 악보에서는 이용할 수 없는 문자 전사를 제공할 수도 있다.지금까지 James Moorer의 자동 음악 문자 변환 정의를 완전히 충족시킬 수 있는 소프트웨어 애플리케이션은 없습니다.그러나, 자동 음악 문자 변환의 추구에 의해, 수동 문자 변환에 도움이 되는 많은 소프트웨어 애플리케이션이 생성되고 있습니다.어떤 사람들은 원래의 음정과 옥타브를 유지하면서 음악을 느리게 할 수 있고, 어떤 사람들은 멜로디의 음조를 추적할 수 있고, 어떤 사람들은 코드 변화를 추적할 수 있고, 다른 사람들은 음악의 비트를 추적할 수 있다.

자동 문자 변환은 기본적으로 수행된 노트의 피치와 지속 시간을 식별하는 것과 관련이 있습니다.여기에는 음높이를 추적하고 음표 온셋을 식별해야 합니다.이러한 물리적 측정값을 캡처한 후 이 정보는 전통적인 음악 표기법, 즉 악보에 매핑됩니다.

디지털 신호 프로세싱은 소프트웨어 엔지니어에게 음고(선율 악기의 노트 검출) 및 비음음의 에너지 함량(타악기의 검출) 측면에서 디지털 녹음을 분석하는 데 필요한 도구와 알고리즘을 제공하는 공학 분야입니다.음악 레코딩은 소정의 레코딩 레이트로 샘플링되어 그 주파수 데이터는 임의의 디지털 파형 포맷으로 컴퓨터에 격납된다.이러한 형식은 디지털 샘플링으로 소리를 나타냅니다.

피치 검출

피치 검출은 종종 음악에서 멜로디를 구성하는 개별 음표 또는 코드의 음표를 검출하는 것입니다.피아노에서 하나의 키를 누를 때, 우리가 듣는 것은 단지 하나소리 진동 주파수가 아니라 수학적으로 관련된 다른 주파수에서 발생하는 여러 소리 진동의 복합체이다.서로 다른 주파수에서 이 진동 복합체의 요소를 고조파 또는 부분파라고 합니다.

예를 들어 피아노에서 Middle C 키를 누르면 복합 고조파의 개별 주파수기본 주파수로 261.6Hz에서 시작되며, 523Hz는 제2 고조파, 785Hz는 제3 고조파, 1046Hz는 제4 고조파 등이 됩니다.이후 고조파는 기본 주파수 261.6Hz의 정수 배수입니다(예: 2 x 261.6 = 523, 3 x 261.6 = 785, 4 x 261.6 = 1046).음표를 실제로 재생성하는 데 필요한 고조파는 8개 정도이지만, 이 수학 계열의 고조파의 총 수는 클 수 있습니다. 고조파의 숫자가 높을수록 고조파의 크기와 기여도는 약해집니다.직감과는 달리, 가장 낮은 수준의 음악 녹음은 개인의 음표 집합이 아니라, 실제로 개인의 조화 집합이다.그렇기 때문에 서로 다른 악기 모음과 할당된 음표로 매우 유사한 사운드의 녹음을 생성할 수 있다.녹음의 전체 하모닉이 어느 정도 재현되는 한 어떤 악기와 음표가 사용되었는지는 중요하지 않습니다.

음표 검출의 첫 번째 단계는 사운드 파일의 디지털 데이터를 시간 영역에서 주파수 영역으로 변환하는 것으로, 시간이 지남에 따라 다양한 주파수를 측정할 수 있습니다.주파수 영역에서 오디오 녹음의 그래픽 이미지는 스펙트로그램 또는 초음파라고 불립니다.음표는 다양한 고조파의 복합체로서 수직으로 배치된 빗처럼 스펙트로그램에 나타나며 빗의 개별 톱니가 다양한 고조파와 다른 주파수 값을 나타낸다.푸리에 변환은 사운드 파일의 디지털 데이터로 스펙트로그램을 만드는 데 사용되는 수학적 절차입니다.

많은 음표 검출 알고리즘의 작업은 개별 음표에 의해 야기되는 그러한 빗살 패턴(조화파 합성물)의 발생을 스펙트럼그램에서 검색하는 것이다.음표의 특정 빗살 모양의 고조파 패턴이 검출되면 스펙트럼 상의 빗살 패턴의 수직 위치에 따라 음표의 피치를 측정할 수 있습니다.

기본적으로 음고 검출 알고리즘에 대한 매우 다른 요구를 만들어 내는 두 가지 종류의 음악이 있습니다: 모노포닉 음악과 폴리포닉 음악입니다.모노포닉 음악은 한 악기가 한 번에 한 음만 연주하는 악곡이고, 폴리포닉 음악은 여러 악기와 보컬을 동시에 연주할 수 있다.모노포닉 녹음의 음고 감지는 비교적 간단한 작업이었고, 그 기술은 1970년대에 기타 튜너의 발명을 가능하게 했다.그러나, 폴리포닉 음악의 음고 검출은, 각 음의 복수 고조파에 의해서 발생하는 다수의 겹치는 빗살 패턴으로 인해, 스펙트럼의 이미지가 흐릿한 구름처럼 보이기 때문에, 훨씬 더 어려운 작업이 됩니다.

음높이 검출의 또 다른 방법은 1970년대에[2] Martin Piszczalski에 의해 Bernard Galler와 함께 발명되었고 그 이후로 [3]널리 받아들여지고 있다.모노포닉 음악을 타깃으로 하고 있습니다.이 방법의 핵심은 사람[4]귀로 음높이를 결정하는 방법입니다.이 과정은 주어진 순간에 가장 큰 고조파 중 몇 개만 발견함으로써 인간 내이의 생물학을 대략적으로 모방하려고 시도합니다.발견된 작은 고조파 세트를 가능한 모든 피치의 고조파 세트와 비교하여 특정 고조파 세트가 주어질 수 있는 가장 개연성이 높은 피치를 가정합니다.

지금까지, 다성 녹음의 완전한 음표 검출은 오디오 엔지니어에게 수수께끼로 남아 있습니다.다만, 멜로디나 베이스 라인과 같은 다성 녹음의 음표 일부를 부분적으로 검출할 수 있는 알고리즘을 개발함으로써, 계속 진보하고 있습니다.

비트 검출

비트 트래킹은 음악에서 인식되는 펄스 사이의 반복 시간 간격을 결정하는 것입니다.비트는 또한 음악에 맞춰 '발 두드리기' 또는 '손뼉치기'로 묘사될 수 있다.박자는 종종 음악 작품의 시간에 맞춰 예측 가능한 기본 단위이며, 공연 중에 약간만 달라질 수 있습니다.노래는 빠른지 느린지 음악의 템포를 결정할 때 BPM(Beats Per Minute)에 따라 자주 측정됩니다.

비트의 시간 간격의 단순한 부분인 비트에서 음이 시작되는 경우가 많기 때문에 비트 추적 소프트웨어는 조잡하게 검출되었을 수 있는 노트 온셋을 더 잘 해결할 수 있습니다.비트 트래킹은 종종 타악기 탐지의 첫 번째 단계입니다.

대부분의 인간이 할 수 있는 '발 두드리기'의 직관적인 특성에도 불구하고, 그러한 박자를 감지하는 알고리즘을 개발하는 것은 어렵다.현재의 비트 검출용 소프트웨어 알고리즘의 대부분은 비트/분(beats-per-minute)에 대해 그룹 경합 가설을 사용합니다.알고리즘은 음악의 풋탭에 대략 대응하는 볼륨의 국소 피크를 점진적으로 찾아 해결합니다.

자동 음악 변환 기능

음악을 자동으로 변환하려면 몇 가지 문제를 해결해야 합니다.

1. 메모는 인식해야 합니다.일반적으로 시간 영역에서 빈도 영역으로 변경합니다.이는 푸리에 변환을 통해 달성할 수 있습니다.이를 위한 컴퓨터 알고리즘이 일반적입니다.고속 푸리에 변환 알고리즘은 신호의 주파수 내용을 계산하여 음악 발췌를 처리하는 데 유용합니다.

2. 박자와 템포를 검출할 필요가 있다(박자 검출) - 이것은 어렵고 다방면에 걸친 문제입니다.[5]

코스탄티니 등에 제안된 방법.2009년은[6] 노트 이벤트와 그 주요 특징인 공격 순간, 피치 및 마지막 순간에 초점을 맞춥니다.개시 검출은 오디오 신호의 바이너리 시간 주파수 표현을 이용합니다.주의 분류 및 오프셋 검출은 고정 Q 변환(CQT) 및 지원 벡터 머신(SVM)에 근거하고 있습니다.퍼블릭 도메인 악보 컬렉션은 여기서 찾을 수 있습니다.[1]

이는 결국 인간이 멜로디라고 부르는 것에 대응하는 연속적인 시변 선인 "피치 등고선"으로 이어진다.다음 단계는 이 연속적인 멜로디 스트림을 분할하여 각 음의 시작과 끝을 식별하는 것입니다.그 후, 각 「노트 단위」는 물리적인 용어(예를 들면 442Hz, .52초)로 표현된다.마지막 단계는 이러한 물리적 정보를 각 음표(예: A4, 1/4 음표)에 대해 익숙한 음악 주석과 같은 용어로 매핑하는 것입니다.

자동 음악 변환 뒤에 있는 상세한 컴퓨터 절차

실제 컴퓨터 처리의 관점에서 주요 단계는 1) 연주된 아날로그 음악을 디지털화하고 2) 연속적인 단기 고속 푸리에 변환(FFT)을 수행하여 시간 가변 스펙트럼을 얻고 3) 각 스펙트럼의 피크를 식별하며, 4) 가장 강력한 개별 피치 후보를 연결하는 것이다.가장 가능성이 높은 시간 간격, 피치 윤곽, 6) 이 물리적 데이터를 가장 가까운 음악 간격 용어로 매핑합니다.1970년대에 Piszzzzalski에 의해 시작된 이러한 근본적인 단계는 자동 음악 전사의 기초가 되었다.[2]

이 과정에서 가장 논란이 많고 어려운 단계는 [7]음정을 감지하는 것이다.가장 성공적인 피치 방식은 시간 영역이 아닌 주파수 영역에서 작동합니다.시간 영역 방법이 제안되었지만, 일반적으로 잔향 방에서 연주되는 실제 악기에 대해서는 분석될 수 있다.

피시즈잘스키가[4] 발명한 피치 검출법은 인간의 청력을 모방한 것이다.그것은 인간의 듣기에서 특정 부분만 어떻게 함께 "융합"하는지를 따라간다.이것들은 한 음의 인식만을 만들어 내는 세트입니다.융접은 2개의 파셜이 완벽한 고조파 쌍의 1.5% 이내일 때만 발생합니다(즉, 주파수는 1:2, 5:8 등 낮은 정수 쌍의 세트와 유사합니다).인간이 단 하나의 음조로 듣기 위해서는 모든 파트에서 거의 조화로운 일치가 필요합니다.

「 」를 참조해 주세요.

레퍼런스

  1. ^ Eric David Sheirr(1998년 10월): "음악 지각 시스템", Massachusetts Institute of Technology Press, 페이지 24.
  2. ^ a b Martin Piszczalski (January 1, 1986). "A Computational model of music transcription, PhD. Thesis". University of Michigan.{{cite web}}: CS1 유지보수: 날짜 및 연도(링크)
  3. ^ David Gerhard (October 15, 1997). "Computer music analysis". Simon Fraser University.
  4. ^ a b Martin Piszczalski & Bernard Galler (December 1, 1979). "Predicting musical pitch from component frequency ratios". Journal of the Acoustical Society of America. Archived from the original on September 4, 2013.
  5. ^ Simon Dixon (May 16, 2001). "Automatic Extraction of Tempo and Beat from Expressive Performances" (PDF). CiteSeer.IST. Retrieved October 8, 2009.
  6. ^ Giovanni Costantini; Renzo Perfetti; Massimiliano Todisco (September 2009). "Event based transcription system for polyphonic piano music" (PDF). Signal Processing. 89 (9): 1798–1811. doi:10.1016/j.sigpro.2009.03.024. hdl:2108/29990.
  7. ^ David Gerhard (November 1, 2003). "Pitch extraction and fundamental frequency: history and current techniques" (PDF). University of Regina. Retrieved May 3, 2017.