레지스터 할당
Register allocation컴파일러 최적화에서 레지스터 할당은 제한된 수의 프로세서 레지스터에 로컬 자동 변수와 식 결과를 할당하는 프로세스입니다.
레지스터 할당은 기본 블록(로컬 레지스터 할당), 함수/프로시저 전체(글로벌 레지스터 할당) 또는 콜그래프를 통해 횡단된 함수 경계(프로시저 간 레지스터 할당)에서 발생할 수 있습니다.함수/프로시저별로 실행되면 호출 규약에 따라 각 콜사이트 주위에 저장/복원 삽입이 필요할 수 있습니다.
맥락
원칙
아키텍처 | 32비트 | 64비트 |
---|---|---|
팔 | 15 | 31 |
인텔 x86 | 8 | 16 |
MIPS | 32 | 32 |
전원/전원PC | 32 | 32 |
RISC-V | 16/32 | 32 |
SPARC | 31 | 31 |
많은 프로그래밍 언어에서 프로그래머는 임의의 수의 변수를 사용할 수 있습니다.컴퓨터는 CPU의 레지스터를 빠르게 읽고 쓸 수 있기 때문에 CPU의 [1]레지스터에 더 많은 변수가 있을 때 컴퓨터 프로그램이 더 빨리 실행된다.또, 경우에 따라서는, 레지스터에 액세스 하는 코드가 보다 콤팩트하기 때문에, 코드의 사이즈가 작아져, 메모리보다 레지스터를 사용하면, 보다 고속으로 취득할 수 있습니다.다만, 레지스터의 수는 한정되어 있습니다.따라서 컴파일러는 코드를 기계어로 변환할 때 CPU [2][3]내의 제한된 수의 레지스터에 변수를 할당하는 방법을 결정해야 합니다.
모든 변수가 동시에 사용(또는 "라이브")되는 것은 아니기 때문에 프로그램의 수명 동안 주어진 레지스터를 사용하여 다른 변수를 보유할 수 있습니다.그러나 동시에 사용 중인 두 변수를 동일한 레지스터에 할당하려면 변수 중 하나가 손상되어야 합니다.모든 변수를 저장할 수 있는 레지스터가 충분하지 않은 경우 일부 변수는 RAM으로 이동하거나 RAM에서 이동할 수 있습니다.이 프로세스를 레지스터의 「[4]스필링」이라고 부릅니다.프로그램의 수명 동안 변수는 유출되거나 레지스터에 저장될 수 있습니다. 이 변수는 "분할"[5]로 간주됩니다.RAM에 액세스하는 것은 레지스터에 액세스하는 것보다 훨씬 느리기 때문에 컴파일된 프로그램의 실행 속도가 느립니다.따라서 최적화 컴파일러는 가능한 한 많은 변수를 레지스터에 할당하는 것을 목표로 합니다.높은 "등록 압력"은 더 많은 유출과 재장전이 필요하다는 것을 의미하는 기술 용어이며, Braun 등에 의해 "명령에서 동시에 활성 변수의 수"[7]로 정의됩니다.
또한 일부 컴퓨터 설계는 자주 액세스하는 레지스터를 캐시합니다.따라서 프로그램은 같은 레지스터를 소스와 수신처에 할당함으로써 더욱 최적화될 수 있습니다.move
가능한 한 지시해 주세요.이는 컴파일러가 정적 Single-Assignment Form(SSA; 단일 할당 형식) 등의 중간 표현을 사용하는 경우 특히 중요합니다.특히 SSA가 완전히 최적화되지 않은 경우 인위적으로 추가 생성될 수 있습니다.move
지침들.
레지스터 할당 구성 요소
따라서 레지스터 할당은 런타임에 변수를 저장할 위치(즉 레지스터 내부 또는 외부)를 선택하는 것으로 구성됩니다.변수가 레지스터에 저장될 경우 할당자는 이 변수가 저장될 레지스터를 결정해야 합니다.결국 변수가 같은 장소에 머무는 기간을 결정하는 것도 과제입니다.
레지스터 할당자는 선택한 할당 전략을 무시하고 일련의 핵심 액션에 의존하여 이러한 과제를 해결할 수 있습니다.이러한 액션은, 몇개의 [8]다른 카테고리로 수집할 수 있습니다.
- 삽입 이동
- 이 동작은 레지스터 간의 이동 명령 수를 증가시키는 것으로 구성됩니다. 즉, 변수가 수명 동안 하나의 레지스터가 아닌 다른 레지스터에 존재하도록 합니다.이 문제는 라이브 범위 분할 접근법에서 발생합니다.
- 흘리다
- 이 동작은 [9]레지스터가 아닌 메모리에 변수를 저장하는 것으로 구성됩니다.
- 과제
- 이 액션은 레지스터를 [10]변수에 할당하는 것으로 구성됩니다.
- 통합
- 이 액션은 레지스터 간의 이동 수를 제한하여 명령의 총 수를 제한합니다.예를 들어, 다양한 메서드에 걸쳐 라이브로 변수를 식별하고 전체 [9]수명 동안 하나의 레지스터에 저장합니다.
많은 레지스터 할당 방식은 하나 이상의 특정 범주의 작업에 최적화됩니다.
레지스터 할당에서 자주 발생하는 문제
레지스터 할당은 다양한 레지스터 할당 접근법에 의해 해결(또는 회피)될 수 있는 몇 가지 문제를 일으킵니다.가장 일반적인 문제의 3가지를 다음에 나타냅니다.
- 앨리어싱
- 아키텍처에 따라서는 어떤 레지스터에 값을 할당하면 다른 레지스터의 값에 영향을 줄 수 있습니다.이것을 에일리어스라고 부릅니다.예를 들어 x86 아키텍처에는 4개의 범용 32비트 레지스터가 있으며 16비트 [11]또는 8비트 레지스터로도 사용할 수 있습니다.이 경우 eax 레지스터에 32비트 값을 할당하면 al 레지스터의 값에 영향을 미칩니다.
- 프리컬러링
- 이 문제는 일부 변수를 특정 레지스터에 강제로 할당하는 행위입니다.예를 들어, Power에서PC 콜 규칙, 파라미터는 일반적으로 R3-R10으로 전달되며 반환값은 R3으로 전달됩니다.[12]
- NP 문제
- Chaitin 등은 레지스터 할당이 NP-완전한 문제임을 보여주었다.그들은 임의의 그래프에 대해 프로그램에 대한 레지스터 할당(노드를 나타내는 레지스터와 사용 가능한 색상을 나타내는 머신 레지스터를 포함)이 원래 그래프에 대한 색상이 되도록 프로그램을 구성할 수 있다는 것을 보여줌으로써 그래프 색칠 문제를 레지스터 할당 문제로 줄인다.Graph Coloring은 NP-Hard 문제이고 Register Allocation은 NP이기 때문에 [13]이는 문제의 NP 완전성을 증명합니다.
할당 기술 등록
레지스터 할당은 기본 코드 블록에 걸쳐 발생할 수 있다: "로컬"이라고 하며,[14] Horwitz 등에 의해 처음 언급되었다.기본 블록에는 브런치가 포함되어 있지 않기 때문에 레지스터 할당에서의 제어 흐름 그래프 머지 포인트의 관리에는 시간이 걸리는 [15]조작이[clarification needed] 나타나기 때문에 할당 프로세스는 고속이라고 생각됩니다.그러나 이 접근법은 전체 컴파일 유닛(예를 들어 [16]방법 또는 절차)에서 작동하는 "글로벌" 접근법만큼 최적화된 코드를 생성하지 못할 것으로 생각된다.
그래프 색상 할당
그래프 색상 할당은 레지스터 [17][18]할당을 해결하기 위한 주요 접근 방식입니다.그것은 Chaitin [4]등에 의해 처음 제안되었다.이 접근법에서는 그래프 내의 노드는 레지스터 할당 후보인 라이브 범위(변수, 임시, 가상/심볼릭레지스터)를 나타냅니다.에지는 간섭하는 라이브 범위, 즉 하나 이상의 프로그램 포인트에서 동시에 라이브인 라이브 범위를 연결합니다.그 후 레지스터 할당은 에지로 연결된 두 노드가 동일한 [19]색상을 받지 않도록 노드에 색상(레지스터)이 할당되는 그래프 색칠 문제로 감소합니다.
라이브스 분석을 사용하여 간섭 그래프를 작성할 수 있습니다.노드가 프로그램의 변수인 무방향 그래프인 간섭 그래프는 동일한 [20]레지스터에 할당할 수 없는 변수를 모델링하는 데 사용됩니다.
원칙
Chaitin 스타일의 그래프 색상 레지스터 할당기의 주요 단계는 다음과 같습니다.[18]
- Renumber: 소스 프로그램에서 라이브 범위 정보를 검색합니다.
- 빌드: 간섭 그래프를 빌드합니다.
- 병합: 복사 명령과 관련된 비간섭 변수의 라이브 범위를 병합합니다.
- 유출 비용: 각 변수의 유출 비용을 계산합니다.이것은 변수를 메모리에 매핑하는 것이 최종 프로그램의 속도에 미치는 영향을 평가합니다.
- 심플화: 추론 그래프에 노드의 순서를 작성합니다.
- 스필 코드: 스필 명령을 삽입합니다. 즉, 레지스터와 메모리 사이의 값을 이동시키기 위해 로드 및 저장하십시오.
- : 각 변수에 레지스터를 할당합니다.
단점 및 추가 개선점
그래프 색상 할당에는 세 가지 주요 단점이 있습니다.우선, 어떤 변수가 유출될지를 결정하기 위해 NP-완전 문제인 그래프 색칠에 의존합니다.최소 색채 그래프를 찾는 것은 실제로 NP-완전한 문제입니다.[21]둘째, 라이브 레인지 분할을 사용하지 않는 한 제거된 변수는 모든 곳에 유출됩니다. 저장(각각 로드) 명령은 가능한 한 빨리(각각 늦게) 삽입됩니다. 즉, (각각 사용 전) 변수 정의 직후에 삽입됩니다.셋째, 유출되지 않은 변수는 수명 [22]내내 동일한 레지스터에 보관됩니다.
한편, 1개의 레지스터명은 복수의 레지스터 클래스에 표시되는 경우가 있습니다.여기서 클래스는 특정 역할로 교환 가능한 레지스터 이름의 세트입니다.그 후 여러 레지스터 이름이 [23]단일 하드웨어 레지스터의 에일리어스일 수 있습니다.마지막으로, 그래프 색칠은 레지스터를 할당하기 위한 공격적인 기술이지만, 라이브 [24]범위 수에서 2차인 최악의 경우 크기를 가질 수 있는 간섭 그래프를 사용하기 때문에 계산 비용이 많이 듭니다.그래프 컬러 레지스터 할당의 전통적인 공식은 중복되지 않는 범용 레지스터의 단일 뱅크를 암시적으로 가정하며 중복 레지스터 쌍, 특수 목적 레지스터 및 다중 레지스터 [25]뱅크와 같은 불규칙한 아키텍처 특징을 처리하지 않습니다.
브릭스 외 연구진은 차이틴 스타일의 그래프 컬러링 접근법의 이후 개선점을 발견했다.: 이것은 보수적 결합이라고 불립니다.이 개선으로 두 라이브 범위를 병합할 수 있는 시기를 결정하는 기준이 추가됩니다.주로, 비간섭 요구사항 외에도, 두 변수가 병합되어 추가 유출이 발생하지 않는 경우에만 병합할 수 있다.Briggs et al.는 Chaitin의 작품에 편향된 색채의 두 번째 개선점을 도입했다.편향된 색상은 그래프 색상의 동일한 색상을 복사와 [18]관련된 라이브 범위에 할당하려고 합니다.
선형 스캔
선형 스캔은 또 다른 글로벌 레지스터 할당 방법입니다.1999년 [26]폴레토 등에 의해 처음 제안되었다.이 방법에서는 코드는 그래프로 변환되지 않습니다.대신 모든 변수가 선형 스캔되어 라이브 범위를 결정합니다(구간으로 표시됨).모든 변수의 활성 범위를 파악한 후, 간격은 시간순으로 횡단됩니다.이 트래버설은 라이브 범위가 간섭하는 변수를 식별하는 데 도움이 될 수 있지만 간섭 그래프는 작성되지 않고 변수가 과도한 방식으로 [24]할당됩니다.
이 접근법의 동기는 속도입니다. 생성된 코드의 실행 시간이 아니라 코드 생성에 소요된 시간 측면에서입니다.일반적으로 표준 그래프 컬러링 접근법은 품질 코드를 생성하지만 2차 [29]비용을 갖는 사용된 그래프 컬러링 알고리즘의 상당한 [27][28]오버헤드가 있다.이 기능으로 인해 리니어 스캔은 현재 Hotspot 클라이언트 컴파일러, V8 및 Jikes RVM과 [5]같은 여러 JIT 컴파일러에서 사용되는 접근 방식입니다.Hotspot 서버 컴파일러는 상위 코드에 그래프 색상을 사용합니다.[30]
유사 코드
이것은 Poletto [31]등이 최초로 제안한 알고리즘에 대해 설명합니다.
- R은 사용 가능한 레지스터의 수입니다.
- active는 현재 포인트와 겹치는 라이브인터벌의 리스트로 엔드 포인트 증가순으로 정렬되어 레지스터에 배치됩니다.
Linear Scan Register(선형 스캔 레지스터)각 라이브 간격 i에 대해 할당 활성 ← {}, 길이(액티브) = R이면 시작 지점을 늘리는 순서대로 ExpireOldIntervals(i)를 수행한 다음 SpillAt를 수행합니다.간격(i) else register[i] ← 활성 상태의 각 간격 j에 대해 끝점 ExpireOldIntervals(i)를 늘려 정렬된 빈 레지스터 풀에서 제거된 레지스터를 활성에 추가합니다. 끝점 j가 [j] point 시작점[i]인 경우 해당 레지스터에서 제거 j를 po로 반환합니다.프리 레지스터의 spillAt ol끝점[interval] > 끝점[i]인 경우 간격(i) 스필 ← 활성 상태에서의 마지막 간격[i] ← 등록 [interval] 위치[interval] ← 활성 상태 추가 i에서 활성 상태로의 스필 제거(다른 끝점 위치[i] ← 새 스택 위치)
단점 및 추가 개선점
그러나 선형 스캔에는 두 가지 주요 단점이 있습니다.첫째, 욕심 많은 측면 때문에 평생의 구멍, 즉 "변수 값이 필요하지 않은 범위"[32][33]를 고려하지 않습니다.또한 유출된 변수는 평생 유출된 상태로 유지됩니다.
폴레토의 선형 스캔 알고리즘에 대한 많은 다른 연구들이 뒤따랐다.예를 들어, Traub 등은 더 나은 [34][35]품질의 코드를 생성하는 것을 목표로 하는 second-chance binpacking이라고 불리는 알고리즘을 제안했다.이 접근법에서는 유출된 변수는 표준 선형 스캔 알고리즘에서 사용되는 것과 다른 휴리스틱을 사용하여 나중에 레지스터에 저장할 수 있습니다.알고리즘은 라이브 간격을 사용하는 대신 라이브 범위를 사용합니다.즉, 범위를 흘려야 할 경우 이 변수에 대응하는 다른 범위를 모두 흘릴 필요는 없습니다.
또한 선형 스캔 할당은 SSA 형식을 활용하도록 조정되었습니다. 이 중간 표현의 속성은 할당 알고리즘을 단순화하고 수명 [36]홀을 직접 계산할 수 있도록 합니다.첫째, 수명 간격을 구축하기 위한 데이터 흐름 그래프 분석에 소요되는 시간이 단축됩니다. 즉, 변수가 [37]고유하기 때문입니다.따라서 새로운 할당이 새로운 라이브 [38][39]간격에 대응하므로 라이브 간격이 짧아집니다.모델링 간격과 활성 구멍을 피하기 위해 Rogers는 [40]명령의 80%에 대한 간격을 성공적으로 제거하는 future-active 집합이라고 불리는 단순화를 보여주었습니다.
재물질화
최적의 레지스터 할당 문제는 NP-complete입니다.그 결과 컴파일러는 휴리스틱 기법을 사용하여 솔루션을 근사합니다.
Chaitin 등은 스필 코드의 품질을 개선하기 위한 몇 가지 아이디어를 논의한다.그들은 특정 값은 하나의 명령으로 재계산할 수 있으며 필요한 피연산자는 항상 계산에 사용할 수 있다고 지적한다.이들은 이러한 예외값을 "never-kill"이라고 부르며 이러한 값을 흘려보내고 새로고침하지 말고 다시 계산해야 한다는 점에 유의합니다.또한, 원하는 레지스터에 [41]직접 재계산함으로써 절대 삭제되지 않은 값의 비콜리지를 제거할 수 있다는 점에 유의하십시오.
이러한 기술을 재물질화라고 합니다.실무상 재실현 기회는 다음과 같다.
- 정수 상수의 즉시 부하 및 일부 기계에서는 부동소수점 상수
- 프레임 포인터 또는 정적 데이터 영역에서 일정한 오프셋을 계산합니다.
- 디스플레이에서 [41]로컬이 아닌 프레임 포인터를 로드합니다.
브릭스 등Chaitin의 작업을 확장하여 복잡하고 다치화된 라이브 범위를 위한 재실현 기회를 활용합니다.이들은 각 값에 할당자가 올바르게 처리할 수 있도록 충분한 정보를 태그 붙여야 한다는 것을 발견했습니다.Briggs의 접근방식은 다음과 같다. 먼저 각 활성 범위를 성분 값으로 분할한 후 각 값에 재물질화 태그를 전파하고 동일한 [41]태그를 가진 연결된 값에서 새로운 활성 범위를 형성한다.
통합
레지스터 할당의 맥락에서 병합은 변수에서 변수로의 이동 작업을 병합하는 작업입니다. 이러한 두 변수를 동일한 위치에 할당함으로써 이 작업을 병합하는 작업입니다.간섭 그래프가 작성된 후 병합 작업이 수행됩니다.두 노드가 병합되면 복사 작업이 [42]불필요해지면 동일한 색상을 가져와 동일한 레지스터에 할당해야 합니다.
병합을 수행하면 간섭 그래프의 [9]색상에 긍정적인 영향과 부정적인 영향을 모두 미칠 수 있습니다.예를 들어, 병합이 그래프 추론 색채성에 미칠 수 있는 부정적인 영향 중 하나는 두 노드가 병합되는 경우이며, 결과 노드는 [9]병합되는 에지 결합을 가집니다.추론 그래프 색채성에 대한 결합의 긍정적인 영향은 예를 들어 노드가 결합되는 두 노드를 간섭할 때 노드의 정도가 하나 감소하여 간섭 [43]그래프의 전체 색채성을 향상시킨다.
몇 가지 통합 휴리스틱을 사용할 [44]수 있습니다.
- 적극적인 통합
- Chaitin 오리지널 레지스터 할당자에 의해 처음 소개되었습니다.이 경험적 접근법은 간섭이 없는 복사 관련 [45]노드를 병합하는 것을 목적으로 합니다.카피 제거의 관점에서는, 이 휴리스틱이 최고의 [46]결과를 가져옵니다.반면에, 공격적인 결합은 추론 그래프의 [43]색채화에 영향을 미칠 수 있다.
- 보수당 통합
- 주로 적극적인 병합과 동일한 경험적 접근법을 사용하지만 간섭 [47]그래프의 색채를 손상시키지 않는 경우에만 이동을 병합합니다.
- 반복된 병합
- 그래프의 [48]색채성을 유지하면서 한 번에 하나의 특정 이동을 제거합니다.
- 최적의 통합
- 공격적인 결합을 기반으로 하지만 추론 그래프 색채가 손상되면 가능한 [49]한 적은 수의 이동을 포기합니다.
혼재된 접근법
하이브리드 할당
일부 다른 레지스터 할당 접근법은 레지스터 사용을 최적화하기 위한 하나의 기술로 제한되지 않습니다.예를 들어 Cavazos et.al은 선형 스캔과 그래프 컬러링 알고리즘을 [50]모두 사용할 수 있는 솔루션을 제안했습니다.이 접근방식에서는 어느 하나의 솔루션과 다른 솔루션 중 하나를 동적으로 결정합니다.첫째, 머신러닝 알고리즘은 "오프라인"으로, 즉 런타임에 사용되지 않는 것으로, 어느 할당 알고리즘을 사용할 필요가 있는지를 결정하는 휴리스틱 함수를 구축하기 위해서 사용됩니다.그런 다음 경험적 함수는 런타임에 사용됩니다. 코드 동작에 따라 할당자는 사용 가능한 [51]두 알고리즘 중 하나를 선택할 수 있습니다.
트레이스 레지스터 할당은 Eisl 등에 의해 개발된 최신 접근법입니다.[3][5]이 기술은 할당을 로컬로 처리합니다.이 기술은 동적 프로파일링 데이터에 의존하여 특정 제어 흐름 그래프에서 가장 자주 사용되는 브랜치를 결정합니다.그런 다음 가장 많이 사용되는 분기에 대해 병합 지점이 무시되는 일련의 "추적"(즉, 코드 세그먼트)을 추론합니다.그런 다음 각 트레이스는 할당자에 의해 독립적으로 처리됩니다.다른 [52]트레이스간에 다른 레지스터 할당 알고리즘을 사용할 수 있기 때문에, 이 어프로치는 하이브리드로 간주할 수 있습니다.
분할 할당
분할 할당은 다른 접근 방식을 조합하는 또 다른 레지스터 할당 기법이며, 일반적으로는 반대라고 간주됩니다.예를 들어 첫 번째 휴리스틱 구축 단계가 오프라인으로 실행되고 휴리스틱 사용이 온라인으로 이루어지기 [24]때문에 하이브리드 할당 기술은 분할된 것으로 간주할 수 있다.같은 방법으로 B.Diouf 등은 오프라인 및 온라인 동작, 즉 정적 및 동적 [53][54]컴파일에 의존하는 할당 기술을 제안했다.오프라인 단계에서는 먼저 정수 선형 프로그래밍을 사용하여 최적의 스필 세트가 수집됩니다.다음으로 라이브 범위에 주석을 붙입니다.compressAnnotation
이전에 식별된 최적 유출 세트에 의존하는 알고리즘.이후 오프라인 [55]단계에서 수집된 데이터에 기초하여 온라인 단계에서 레지스터 할당을 실시한다.
2007년, Bouchez 외 연구진은 레지스터 할당을 다른 단계로 분할할 것을 제안했습니다.한 단계는 흘리기 전용이고 다른 단계는 컬러링 [56]및 결합 전용입니다.
다른 기술 간의 비교
하나의 레지스터 할당 기법과 다른 레지스터 할당 기법의 성능을 평가하기 위해 여러 메트릭이 사용되었습니다.레지스터 할당은 일반적으로 코드 품질(즉, 빠르게 실행되는 코드)과 분석 오버헤드(즉, 최적화된 레지스터 할당으로 코드를 생성하기 위해 소스 코드를 분석하는 데 소요된 시간) 간의 트레이드오프를 처리해야 합니다.이러한 관점에서 생성된 코드의 실행 시간과 라이브스 분석에 소요되는 시간은 서로 다른 기술을 [57]비교하기 위한 관련 지표이다.
관련 메트릭이 선택되면 실제 응용 프로그램의 동작을 반영하거나 알고리즘이 대처하고자 하는 특정 문제에 관련됨으로써 메트릭이 적용되는 코드를 사용할 수 있고 문제와 관련되어야 합니다.레지스터 할당에 관한 최신 기사에서는 특히 Dacapo 벤치마크 [58]스위트를 사용합니다.
「 」를 참조해 주세요.
- 스트라러 번호 식 [59]트리를 평가하는 데 필요한 최소 레지스터 수입니다.
- 레지스터(키워드), C 및 C++의 힌트로서 변수를 레지스터에 배치한다.
레퍼런스
- ^ 디첼 & 맥렐란 1982 페이지 48
- ^ Runeson & Nyström 2003, 페이지 242.
- ^ a b Eisl et al. 2016, 페이지 14:1
- ^ a b Chaitin et al. 1981, 페이지 47
- ^ a b c Eisl et al. 2016, 페이지 1
- ^ "Latency Comparison Numbers in computer/network". blog.morizyun.com. 6 January 2018. Retrieved 2019-01-08.
- ^ Braun & Hack 2009, 페이지 174
- ^ Koes & Goldstein 2009, 페이지 21
- ^ a b c d Bouchez, Darte & Rastello 2007b, 페이지 103.
- ^ 콜롬비아, Brandner & Darte 2011, 페이지 26
- ^ "Intel® 64 and IA-32 Architectures Software Developer's Manual, Section 3.4.1" (PDF). Intel. May 2019. Archived from the original (PDF) on 2019-05-25.
- ^ "32-bit PowerPC function calling conventions".
- ^ Bouchez, Darte & Rastello 2006, 페이지 4.
- ^ Horwitz et al. 1966, 43페이지
- ^ 패러치 & 리베라토어 1998, 566페이지
- ^ Eisl et al. 2017, 페이지 92
- ^ Eisl, Leopoldseder & Mössenböck 2018, 페이지 1
- ^ a b c Briggs, Cooper & Torczon 1992, 316페이지
- ^ 폴레토 & 사르카 1999, 페이지 896
- ^ Runeson & Nyström 2003, 페이지 241.
- ^ 1975권, 618-619페이지.
- ^ 콜롬비아, Brandner & Darte 2011, 페이지 1
- ^ 스미스, 램지 & 할로웨이 2004, 페이지 277
- ^ a b c Cavazos, Moss & O'Boyle 2006, 페이지 124.
- ^ Runeson & Nyström 2003, 페이지 240
- ^ 폴레토 & 사르카 1999, 페이지 895
- ^ 폴레토 & 사르카 1999, 페이지 902
- ^ Wimmer & Mössenböck 2005, 페이지 132.
- ^ 요한슨 & 사고나스 2002, 페이지 102
- ^ Palenczy, Vick & Click 2001, 페이지 1. 오류: : 도움말
- ^ 폴레토 & 사르카 1999, 페이지 899
- ^ Eisl et al. 2016, 페이지 2
- ^ Traub, Holloway & Smith 1998, 페이지 143.
- ^ Traub, Holloway & Smith 1998, 페이지 141.
- ^ 폴레토 & 사르카 1999, 페이지 897
- ^ Wimmer & Franz 2010, 페이지 170
- ^ Mössenböck & Feiffer 2002, 페이지 234.
- ^ Mössenböck & Feiffer 2002, 페이지 233.
- ^ Mössenböck & Feiffer 2002, 페이지 229.
- ^ 로저스 2020
- ^ a b c Briggs, Cooper & Torczon 1992, 313페이지
- ^ 1982년 차이틴, 페이지 90
- ^ a b 안철수 & 백 2009, 페이지 7
- ^ Park & Moon 2004, 페이지 736.
- ^ 1982년 Chaitin, 99페이지
- ^ Park & Moon 2004, 페이지 738.
- ^ Briggs, Cooper & Torczon 1994, 페이지 433
- ^ 조지 & 아펠 1996, 페이지 212
- ^ Park & Moon 2004, 페이지 741.
- ^ Eisl et al. 2017, 페이지 11
- ^ Cavazos, Moss & O'Boyle 2006, 페이지 124-127.
- ^ Eisl et al. 2016, 페이지 4
- ^ Diouf et al. 2010, 페이지 66
- ^ Cohen & Rohou 2010, 페이지 1
- ^ Diouf et al. 2010, 페이지 72
- ^ Bouchez, Darte & Rastello 2007a, 페이지 1
- ^ 폴레토 & 사르카 1999, 페이지 901-910.
- ^ 블랙번 외 2006, 페이지 169
- ^ Flajolet, Raoult & Vuillemin 1979.
원천
- Ahn, Minwook; Paek, Yunheung (2009). "Register coalescing techniques for heterogeneous register architecture with copy sifting". ACM Transactions on Embedded Computing Systems. 8 (2): 1–37. CiteSeerX 10.1.1.615.5767. doi:10.1145/1457255.1457263. ISSN 1539-9087. S2CID 14143277.
- Aho, Alfred V.; Lam, Monica S.; Sethi, Ravi; Ullman, Jeffrey D. (2006). Compilers: Principles, Techniques, and Tools (2Nd ed.). Addison-Wesley Longman Publishing Co., Inc. ISBN 978-0321486813.
- Appel, Andrew W.; George, Lal (2001). "Optimal spilling for CISC machines with few registers". Proceedings of the ACM SIGPLAN 2001 conference on Programming language design and implementation - PLDI '01. pp. 243–253. CiteSeerX 10.1.1.37.8978. doi:10.1145/378795.378854. ISBN 978-1581134148. S2CID 1380545.
- Barik, Rajkishore; Grothoff, Christian; Gupta, Rahul; Pandit, Vinayaka; Udupa, Raghavendra (2007). "Optimal Bitwise Register Allocation Using Integer Linear Programming". Languages and Compilers for Parallel Computing. Lecture Notes in Computer Science. Vol. 4382. pp. 267–282. CiteSeerX 10.1.1.75.6911. doi:10.1007/978-3-540-72521-3_20. ISBN 978-3-540-72520-6.
- Bergner, Peter; Dahl, Peter; Engebretsen, David; O'Keefe, Matthew (1997). "Spill code minimization via interference region spilling". Proceedings of the ACM SIGPLAN 1997 conference on Programming language design and implementation - PLDI '97. pp. 287–295. doi:10.1145/258915.258941. ISBN 978-0897919074. S2CID 16952747.
- Blackburn, Stephen M.; Guyer, Samuel Z.; Hirzel, Martin; Hosking, Antony; Jump, Maria; Lee, Han; Eliot, J.; Moss, B.; Phansalkar, Aashish; Stefanović, Darko; VanDrunen, Thomas; Garner, Robin; von Dincklage, Daniel; Wiedermann, Ben; Hoffmann, Chris; Khang, Asjad M.; McKinley, Kathryn S.; Bentzur, Rotem; Diwan, Amer; Feinberg, Daniel; Frampton, Daniel (2006). "The DaCapo benchmarks". Proceedings of the 21st annual ACM SIGPLAN conference on Object-oriented programming systems, languages, and applications - OOPSLA '06. p. 169. doi:10.1145/1167473.1167488. ISBN 978-1595933485. S2CID 9255051.
- Book, Ronald V. (December 1975). "Karp Richard M.. Reducibility among combinatorial problems. Complexity of computer computations, Proceedings of a Symposium on the Complexity of Computer Computations, held March 20-22, 1972, at the IBM Thomas J. Watson Center, Yorktown Heights, New York, edited by Miller Raymond E. and Thatcher James W., Plenum Press, New York and London 1972, pp. 85–103". The Journal of Symbolic Logic. 40 (4): 618–619. doi:10.2307/2271828. ISSN 0022-4812. JSTOR 2271828.
- Bouchez, Florent; Darte, Alain; Rastello, Fabrice (2006). "Register Allocation: What Does the NP-Completeness Proof of Chaitin et al. Really Prove? Or Revisiting Register Allocation: Why and How". Register allocation: what does the NP-Completeness proof of Chaitin et al. really prove?. Lecture Notes in Computer Science. Vol. 4382. pp. 2–14. doi:10.1007/978-3-540-72521-3_21. ISBN 978-3-540-72520-6.
- Bouchez, Florent; Darte, Alain; Rastello, Fabrice (2007a). "On the Complexity of Register Coalescing". International Symposium on Code Generation and Optimization (CGO'07). pp. 102–114. CiteSeerX 10.1.1.101.6801. doi:10.1109/CGO.2007.26. ISBN 978-0-7695-2764-2. S2CID 7683867.
- Bouchez, Florent; Darte, Alain; Rastello, Fabrice (2007b). "On the complexity of spill everywhere under SSA form". ACM SIGPLAN Notices. 42 (7): 103–114. arXiv:0710.3642. doi:10.1145/1273444.1254782. ISSN 0362-1340.
- Braun, Matthias; Hack, Sebastian (2009). "Register Spilling and Live-Range Splitting for SSA-Form Programs". Compiler Construction. Lecture Notes in Computer Science. Vol. 5501. pp. 174–189. CiteSeerX 10.1.1.219.5318. doi:10.1007/978-3-642-00722-4_13. ISBN 978-3-642-00721-7. ISSN 0302-9743.
- Briggs, Preston; Cooper, Keith D.; Torczon, Linda (1992). "Rematerialization". ACM SIGPLAN Notices. 27 (7): 311–321. doi:10.1145/143103.143143. ISSN 0362-1340.
- Briggs, Preston; Cooper, Keith D.; Torczon, Linda (1994). "Improvements to graph coloring register allocation". ACM Transactions on Programming Languages and Systems. 16 (3): 428–455. CiteSeerX 10.1.1.23.253. doi:10.1145/177492.177575. ISSN 0164-0925. S2CID 6571479.
- Cavazos, John; Moss, J. Eliot B.; O’Boyle, Michael F. P. (2006). "Hybrid Optimizations: Which Optimization Algorithm to Use?". Compiler Construction. Lecture Notes in Computer Science. Vol. 3923. pp. 124–138. doi:10.1007/11688839_12. ISBN 978-3-540-33050-9. ISSN 0302-9743.
- Chaitin, Gregory J.; Auslander, Marc A.; Chandra, Ashok K.; Cocke, John; Hopkins, Martin E.; Markstein, Peter W. (1981). "Register allocation via coloring". Computer Languages. 6 (1): 47–57. doi:10.1016/0096-0551(81)90048-5. ISSN 0096-0551.
- Chaitin, G. J. (1982). "Register allocation & spilling via graph coloring". Proceedings of the 1982 SIGPLAN symposium on Compiler construction - SIGPLAN '82. pp. 98–101. doi:10.1145/800230.806984. ISBN 978-0897910743. S2CID 16872867.
- Chen, Wei-Yu; Lueh, Guei-Yuan; Ashar, Pratik; Chen, Kaiyu; Cheng, Buqi (2018). "Register allocation for Intel processor graphics". Proceedings of the 2018 International Symposium on Code Generation and Optimization - CGO 2018. pp. 352–364. doi:10.1145/3168806. ISBN 9781450356176. S2CID 3367270.
- Cohen, Albert; Rohou, Erven (2010). "Processor virtualization and split compilation for heterogeneous multicore embedded systems". Proceedings of the 47th Design Automation Conference on - DAC '10. p. 102. CiteSeerX 10.1.1.470.9701. doi:10.1145/1837274.1837303. ISBN 9781450300025. S2CID 14314078.
- Colombet, Quentin; Brandner, Florian; Darte, Alain (2011). "Studying optimal spilling in the light of SSA". Proceedings of the 14th international conference on Compilers, architectures and synthesis for embedded systems - CASES '11. p. 25. doi:10.1145/2038698.2038706. ISBN 9781450307130. S2CID 8296742.
- Diouf, Boubacar; Cohen, Albert; Rastello, Fabrice; Cavazos, John (2010). "Split Register Allocation: Linear Complexity Without the Performance Penalty". High Performance Embedded Architectures and Compilers. Lecture Notes in Computer Science. Vol. 5952. pp. 66–80. CiteSeerX 10.1.1.229.3988. doi:10.1007/978-3-642-11515-8_7. ISBN 978-3-642-11514-1. ISSN 0302-9743.
- Ditzel, David R.; McLellan, H. R. (1982). "Register allocation for free". Proceedings of the first international symposium on Architectural support for programming languages and operating systems - ASPLOS-I. pp. 48–56. doi:10.1145/800050.801825. ISBN 978-0897910668. S2CID 2812379.
- Eisl, Josef; Grimmer, Matthias; Simon, Doug; Würthinger, Thomas; Mössenböck, Hanspeter (2016). "Trace-based Register Allocation in a JIT Compiler". Proceedings of the 13th International Conference on Principles and Practices of Programming on the Java Platform: Virtual Machines, Languages, and Tools - PPPJ '16. pp. 1–11. doi:10.1145/2972206.2972211. ISBN 9781450341356. S2CID 31845919.
- Eisl, Josef; Marr, Stefan; Würthinger, Thomas; Mössenböck, Hanspeter (2017). "Trace Register Allocation Policies" (PDF). Proceedings of the 14th International Conference on Managed Languages and Runtimes - Man Lang 2017. pp. 92–104. doi:10.1145/3132190.3132209. ISBN 9781450353403. S2CID 1195601.
- Eisl, Josef; Leopoldseder, David; Mössenböck, Hanspeter (2018). "Parallel trace register allocation". Proceedings of the 15th International Conference on Managed Languages & Runtimes - Man Lang '18. pp. 1–7. doi:10.1145/3237009.3237010. ISBN 9781450364249. S2CID 52137887.
- Koes, David Ryan; Goldstein, Seth Copen (2009). "Register Allocation Deconstructed". Written at Nice, France. Proceedings of th 12th International Workshop on Software and Compilers for Embedded Systems. SCOPES '09. New York, NY, USA: ACM. pp. 21–30. ISBN 978-1-60558-696-0.
- Farach, Martin; Liberatore, Vincenzo (1998). "On Local Register Allocation". Written at San Francisco, California, USA. Proceedings of the Ninth Annual ACM-SIAM Symposium on Discrete Algorithms. SODA '98. Philadelphia, PA, USA: Society for Industrial and Applied Mathematics. pp. 564–573. ISBN 0-89871-410-9.
- Flajolet, P.; Raoult, J. C.; Vuillemin, J. (1979), "The number of registers required for evaluating arithmetic expressions", Theoretical Computer Science, 9 (1): 99–125, doi:10.1016/0304-3975(79)90009-4
- George, Lal; Appel, Andrew W. (1996). "Iterated register coalescing". ACM Transactions on Programming Languages and Systems. 18 (3): 300–324. doi:10.1145/229542.229546. ISSN 0164-0925. S2CID 12281734.
- Horwitz, L. P.; Karp, R. M.; Miller, R. E.; Winograd, S. (1966). "Index Register Allocation". Journal of the ACM. 13 (1): 43–61. doi:10.1145/321312.321317. ISSN 0004-5411. S2CID 14560597.
- Johansson, Erik; Sagonas, Konstantinos (2002). "Linear Scan Register Allocation in a High-Performance Erlang Compiler". Practical Aspects of Declarative Languages. Lecture Notes in Computer Science. Vol. 2257. pp. 101–119. doi:10.1007/3-540-45587-6_8. ISBN 978-3-540-43092-6. ISSN 0302-9743.
- Kurdahi, F. J.; Parker, A. C. (1987). "REAL: a program for REgister ALlocation". 24th ACM/IEEE conference proceedings on Design automation conference - DAC '87. pp. 210–215. doi:10.1145/37888.37920. ISBN 978-0818607813. S2CID 17598675.
- Mössenböck, Hanspeter; Pfeiffer, Michael (2002). "Linear Scan Register Allocation in the Context of SSA Form and Register Constraints". Compiler Construction. Lecture Notes in Computer Science. Vol. 2304. pp. 229–246. doi:10.1007/3-540-45937-5_17. ISBN 978-3-540-43369-9. ISSN 0302-9743.
- Nickerson, Brian R. (1990). "Graph coloring register allocation for processors with multi-register operands". ACM SIGPLAN Notices. 25 (6): 40–52. doi:10.1145/93548.93552. ISSN 0362-1340.
- Paleczny, Michael; Vick, Christopher; Click, Cliff (2001). "The Java HotSpot Server Compiler". Proceedings of the Java Virtual Machine Research and Technology Symposium (JVM01). Monterey, California, USA. pp. 1–12. CiteSeerX 10.1.1.106.1919.
- Park, Jinpyo; Moon, Soo-Mook (2004). "Optimistic register coalescing". ACM Transactions on Programming Languages and Systems. 26 (4): 735–765. CiteSeerX 10.1.1.33.9438. doi:10.1145/1011508.1011512. ISSN 0164-0925. S2CID 15969885.
- Poletto, Massimiliano; Sarkar, Vivek (1999). "Linear scan register allocation". ACM Transactions on Programming Languages and Systems. 21 (5): 895–913. CiteSeerX 10.1.1.27.2462. doi:10.1145/330249.330250. ISSN 0164-0925. S2CID 18180752.
- Rogers, Ian (2020). "Efficient global register allocation". arXiv:2011.05608 [cs.PL].
- Runeson, Johan; Nyström, Sven-Olof (2003). "Retargetable Graph-Coloring Register Allocation for Irregular Architectures". Software and Compilers for Embedded Systems. Lecture Notes in Computer Science. Vol. 2826. pp. 240–254. CiteSeerX 10.1.1.6.6186. doi:10.1007/978-3-540-39920-9_17. ISBN 978-3-540-20145-8. ISSN 0302-9743.
- Smith, Michael D.; Ramsey, Norman; Holloway, Glenn (2004). "A generalized algorithm for graph-coloring register allocation". ACM SIGPLAN Notices. 39 (6): 277. CiteSeerX 10.1.1.71.9532. doi:10.1145/996893.996875. ISSN 0362-1340.
- Traub, Omri; Holloway, Glenn; Smith, Michael D. (1998). "Quality and speed in linear-scan register allocation". ACM SIGPLAN Notices. 33 (5): 142–151. CiteSeerX 10.1.1.52.8730. doi:10.1145/277652.277714. ISSN 0362-1340.
- Wimmer, Christian; Mössenböck, Hanspeter (2005). "Optimized interval splitting in a linear scan register allocator". Proceedings of the 1st ACM/USENIX international conference on Virtual execution environments - VEE '05. p. 132. CiteSeerX 10.1.1.394.4054. doi:10.1145/1064979.1064998. ISBN 978-1595930477. S2CID 494490.
- Wimmer, Christian; Franz, Michael (2010). "Linear scan register allocation on SSA form". Proceedings of the 8th annual IEEE/ ACM international symposium on Code generation and optimization - CGO '10. p. 170. CiteSeerX 10.1.1.162.2590. doi:10.1145/1772954.1772979. ISBN 9781605586359. S2CID 1820765.
외부 링크
- 정수 프로그래밍에 대한 튜토리얼
- 회의 정수 프로그래밍 및 조합 최적화(IPCO)
- Ausois 조합 최적화 워크숍
- 보스처, 스티븐, 그리고 디에고 노빌로.GCC는 새로운 Optimizer Framework를 도입했습니다.GCC의 SSA 사용 및 오래된 IR에 비해 어떻게 개선되는지에 대한 기사입니다.
- SSA 서지 목록.SSA 연구 논문의 광범위한 카탈로그.
- 자덱, F. 케네스「고정적인 단일 할당 양식의 개발」, 2007년 12월, SSA의 기원에 대해 설명합니다.
- VV.AA. "SSA 기반 컴파일러 설계" (2014년)
- CiteSeer 인용문
- Agner Fog에 의한 최적화 매뉴얼 - x86 프로세서 아키텍처 및 저레벨 코드 최적화에 관한 문서