대체 문자

Substitute character

컴퓨터 데이터에서 대체문자())는 송신된 데이터를 일정한 크기의 블록으로 보내기 위해 패딩하거나 특정 디바이스에서 무효, 오류 또는 표현 불가능으로 인식된 문자를 대신하기 위해 사용되는 제어문자이다.일부 프로그래밍 언어에서는 이스케이프 시퀀스로도 사용됩니다.

ASCII 문자 세트에서는, 이 문자는 번호 26( )으로 부호화됩니다. 1Ahex). 표준 키보드는 와 키를 동시누르면 이 코드를 전송합니다(Ctrl+Z, 통념상 ^[1]Z로 기재되어 있습니다).Unicode 는 ASCII 에서 이 문자를 상속합니다만, 출력 부호화에 호환성이 있는 경우는, 디코딩 할 수 없는 입력을 나타내기 위해서 대신에 치환 문자( 「」, U+FFD)를 사용하는 것을 추천합니다.

사용하다

파일 끝

때문에 네이티브 파일 시스템 자체에 의해 정확한 파일 크기를 녹음하지 못 역사적으로, PDP-6 monitor,[2]RT-11, VMS, TOPS-10,[3]과 초기 PCCP/M 1과 2운영 체제의(및 파생 상품처럼 MP/M)그것이 명확하게 파일(EOF)의 마지막을 기념하기 위해;파일은 고정된 크기의 extents(기록)에 할당되었다.., 일반적으로 많이 받으시고 필요한 것이었다.aving[4][5][6][7]파일의 끝에 할당되었지만 사용되지 않은 공간이 있습니다.이 여분의 공간은 CP/M 아래의 1A16(16진수) 문자로 채워졌습니다.CP/M 3 이상에서 사용되는 확장 CP/M 파일 시스템( Concurrent CP/M, Concurrent DOS 및 DOS Plus와 같은 파생 모델)은 바이트 입상 [8][9]파일을 지원하므로 이는 더 이상 필수 사항이 아니지만 하위 호환성을 보장하기 위해 규칙(특히 텍스트 파일)으로 남아 있습니다.

CP/M, 86-DOS, MS-DOS, PC DOS, DR-DOS 및 그 다양한 파생 버전에서 SUB 문자는 문자 스트림의 끝을 나타내기 위해 사용되었으며, 따라서 대화형 명령줄 창에서 사용자 입력을 종료하는 데 사용됩니다(그리고 종종 명령어에 의해 유도되는 것과 같은).

2017년 현재 많은 텍스트 편집기와 프로그램 언어가 이 규칙을 지원하거나 편집 시 파일 끝에 이 문자를 삽입하거나 텍스트 [citation needed]파일에서 적절하게 처리하도록 구성할 수 있습니다.이러한 경우 파일의 물리적 끝을 나타내는 것이 아니라 "이 시점 이후 유용한 데이터가 없다"는 것을 나타내는 마커에 가깝기 때문에 종종 "소프트" EOF라고 불립니다.실제로는 이 문자를 넘어 파일 시스템의 실제 데이터 끝까지 더 많은 데이터가 존재할 수 있습니다. 따라서 콘솔에서 파일을 입력하거나 편집기에서 열 때 파일 내용을 숨기는 데 사용할 수 있습니다.많은 파일 형식 표준(: PNG 또는 GIF)은 이 기능을 정확하게 수행하기 위해 헤더에 SUB 문자를 포함합니다.일부 최신 텍스트 파일 형식(예: CSV-1203[10])에서는 파일의 마지막 문자로 후행 EOF 문자를 추가할 것을 권장합니다.그러나 +를 Z입력해도 DOS 또는 Windows파일에 EOF 문자가 포함되어 있지 않으며, 이러한 시스템의 API가 파일의 실제 끝을 나타내기 위해 해당 문자를 사용하지 않습니다.

일부 프로그래밍 언어(예: Visual Basic)는 삽입 텍스트 파일 읽기 프리미티브(INPUT, LINE INPUT 등)를 사용할 때 "소프트" EOF를 지나 읽을 수 없으며, 파일을 바이너리 모드로 열거나 파일 시스템 개체를 사용하여 이를 넘어갈 수 있는 대체 방법을 사용해야 합니다.

문자 26은 ASCII가 이 문자를 Substitute라고 부르지만 "파일 끝"을 표시하기 위해 사용되었으며 "파일 끝"을 나타내는 다른 문자가 있습니다."파일 구분자"라고 불리는 28번도 비슷한 목적으로 사용되어 왔습니다.

기타 용도

Unix와 유사한 운영체제에서 이 문자는 일반적으로 사용자가 현재 실행 중인 대화형 프로세스를 일시 [11]중단하는 방법으로 에서 사용됩니다.일시 중단된 프로세스는 포그라운드(인터랙티브) 모드로 재개하거나 백그라운드모드로 실행을 재개하거나 종료할 수 있습니다.사용자가 컴퓨터 단말기에서 입력하면 현재 실행 중인 포그라운드프로세스가 "Terminal Stop"(SIGTSTP) 신호를 전송하여 프로세스가 실행을 중지합니다.사용자는 나중에 "forground" 명령을 사용하여 프로세스 실행을 계속할 수 있습니다.fg또는 "background" 명령어(bg).

Unicode 보안 고려[12] 사항 보고서에서는 문자 집합 변환 시 사용할 수 없는 문자를 안전하게 대체할 수 있는 문자로 이 문자를 권장합니다.

많은 GUI 및 애플리케이션에서 마지막 작업을 취소하기 위해 +(Z⌘ CommandZMacOS에서 +)를 사용할 수 있습니다.많은 응용 프로그램에서 이전 작업보다 이전 작업을 +를 여러 번 Z눌러 취소할 수도 있습니다.Control+Z텍스트 편집을 제어하기 위해 Xerox PARC의 프로그램 설계자가 선택한 소수의 키보드 시퀀스 중 하나였습니다.

표현

ASCII 및 Unicode의 "substitute" 표현:

  • 8진수 코드: 32
  • 10진수 코드: 26
  • 16진수 코드: 1A, U+001a
  • 니모닉 기호: SUB
  • 이진수 값: 11010

「 」를 참조해 주세요.

레퍼런스

  1. ^ "Keyboard shortcuts for Windows". Microsoft Support. Microsoft. Retrieved 2012-06-02.
  2. ^ "Table of IO Device Characteristics - Console or Teletypewriters". PDP-6 Multiprogramming System Manual (PDF). Maynard, Massachusetts, USA: Digital Equipment Corporation (DEC). 1965. p. 43. DEC-6-0-EX-SYS-UM-IP-PRE00. Archived (PDF) from the original on 2014-07-14. Retrieved 2014-07-10. (1+84+10페이지)
  3. ^ "5.1.1.1.장치 의존적 기능-데이터 모드-정보 통신 소프트웨어 A(ASCII)과 AL(아스키 선)".PDP-10 기준 핸드 북:모니터-Time-Sharing을 모니터링(PDF)과 의사 소통하는 것.Vol3. 디지털 이큅먼트 코퍼레이션(DEC). 1969년.를 대신하여 서명함. 5– 5-6[5-5(431)].그 2011-11-15에 원래에서Archived(PDF)..(207페이지)2014-07-10 Retrieved
  4. ^ Elliott, John C. (1998). "CP/M 1.4 disc formats". Archived from the original on 2020-11-14. Retrieved 2021-11-18.
  5. ^ Elliott, John C. (1998). "CP/M 2.2 disc formats". Archived from the original on 2020-11-05. Retrieved 2021-11-18.
  6. ^ "2. 운영 시스템 콜 협약".CP/M 2.0인터페이스 가이드(1판)(PDF).캘리포니아 PacificGrove에 사는, USA:디지털 리서치. 1979년의 5페이지.그 2020-02-28에 원래에서Archived(PDF).[...] ASCII파일의 끝은control-Z 캐릭터(1AH)또는 파일의 진정한 끝에...그 CP/M 읽어 준 연산에서 반환되여 설명이다. 2020-02-28 Retrieved.Control-Z 문자(예:COM파일)무시되고 기계 코드 파일 내에 있다고 하고 파일 조건의 끝 CP/M에서 반환을 읽작전을 종료하기 위해 사용된다.[...](56쪽) 넘었다.
  7. ^ Hogan, Thom (1982). "3. CP/M Transient Commands". Osborne CP/M User Guide - For All CP/M Users (2 ed.). Berkeley, California, USA: A. Osborne/McGraw-Hill. p. 74. ISBN 0-931988-82-9. Retrieved 2020-02-28. [...] CP/M marks the end of an ASCII file by placing a CONTROL-z character in the file after the last data character. If the file contains an exact multiple of 128 characters, in which case adding the CONTROL-Z would waste 127 characters, CP/M does not do so. Use of the CONTROL-Z character as the end-of-file marker is possible because CONTROL-z is seldom used as data in ASCII files. In a non-ASCII file, however, CONTROL-Z is just as likely to occur as any other character. Therefore, it cannot be used as the end-of-file marker. CP/M uses a different method to mark the end of a non-ASCII file. CP/M assumes it has reached the end of the file when it has read the last record (basic unit of disk space) allocated to the file. The disk directory entry for each file contains a list of the disk records allocated to that file. This method relies on the size of the file, rather than its content, to locate the end of the file. [...] [1][2]
  8. ^ Elliott, John C. (1998). "CP/M 3.1 disc formats". Archived from the original on 2021-10-26. Retrieved 2021-11-18.
  9. ^ Elliott, John C. (1998). "CP/M 4.1 disc formats". Archived from the original on 2020-11-05. Retrieved 2021-11-18.
  10. ^ CSV-1203 포맷 사양 포르투갈어 웹 아카이브에서 2016-05-16 아카이브
  11. ^ "Quick Reference: Unix Commands". IT Connect. University of Washington. Retrieved 2012-06-02.
  12. ^ Unicode 보안 고려 사항 보고서

추가 정보