바이너리

Binary file
318 바이트 Wikipedia favicon16진수 덤프 또는. 첫 번째 열은 행의 시작 주소를 계산하고, 반면,*반복을 나타냅니다.

이진 파일은 텍스트 [1]파일이 아닌 시스템 파일입니다.바이너리 파일이라는 용어는 종종 "비텍스트 파일"[2]을 의미하는 용어로 사용됩니다.대부분의 이진 파일 형식에는 텍스트로 해석할 수 있는 부분이 포함되어 있습니다. 예를 들어, 이전 Microsoft Word 문서 파일과 같이 서식 지정된 텍스트포함하는 일부 컴퓨터 문서 파일에는 문서의 텍스트가 포함되어 있지만 이진 [2]형식의 형식 정보도 포함되어 있습니다.

구조.

바이너리 파일은 보통 바이트의 시퀀스로 간주되며, 이는 바이너리 디짓(비트)이 8로 그룹화됨을 의미합니다.이진 파일에는 일반적으로 텍스트 문자가 아닌 다른 문자로 해석되는 바이트가 포함됩니다.컴파일된 컴퓨터 프로그램은 전형적인 예입니다.실제로 컴파일된 어플리케이션은 프로그래머에 의해 바이너리라고 불리기도 합니다.그러나 바이너리 파일에는 이미지, 사운드, 다른 파일의 압축 버전 등이 포함되어 있는 경우도 있습니다.단,[1] 모든 종류의 파일 컨텐츠가 포함됩니다.

일부 이진 파일에는 파일 내의 데이터를 해석하기 위해 컴퓨터 프로그램이 사용하는 메타데이터 블록인 머리글이 포함되어 있습니다.헤더에는 형식을 식별할 수 있는 시그니처 또는 매직 번호가 포함되어 있는 경우가 많습니다.예를 들어 GIF 파일에는 여러 개의 이미지가 포함될 수 있으며 헤더는 이미지 데이터의 각 블록을 식별하고 설명하는 데 사용됩니다.헤더의 선두 바이트에는 다음과 같은 텍스트가 포함됩니다.GIF87a또는GIF89aGIF 파일로 바이너리를 식별할 수 있습니다.바이너리 파일에 헤더가 포함되어 있지 않은 경우는 플랫바이너리 파일이라고 불립니다

텍스트 파일은 부분적으로 또는 전체적으로 인코딩된 이진 정보로 구성될 수 있습니다.네트워크를 통해 바이너리 파일을 송신할 때는, 인쇄 가능한 문자만을 사용하도록 부호화할 수 있습니다.이것은 인터넷 브라우징과 전자 메일 통신에 사용되는 네트워크 프로토콜의 제한 때문에 종종 필요합니다.이러한 부호화의 1개는 Base64 입니다.또한 비대칭 암호법(웹사이트 증명서 등)을 사용하는 시스템에서 사용하는 공개키 및 개인키 정보를 포함하는 파일도 인쇄 가능한 문자로 인코딩된 바이너리 정보로 저장될 수 있다.

조작

일부 데이터 값을 허용하지 않는 특정 시스템(예: 이메일)을 통해 이진 파일을 전송하기 위해 보통 일반 텍스트 표현(: Base64 사용)으로 변환됩니다.데이터를 부호화하면, 전송중에 파일 사이즈가 커집니다(예를 들면, Base64 를 사용하면, 파일의 사이즈가 약 30 %증가합니다).또, 수신 후에 바이너리로의 변환이 필요하게 됩니다.그 결과 텍스트 데이터의 엔트로피가 크기만큼 줄어들기 때문에 이 시나리오에서 전송되는 실제 데이터는 원래 바이너리 데이터의 크기에 매우 가깝기 때문에 크기가 증가하면 낮은 수준의 링크 압축으로 상쇄될 수 있습니다.이 주제에 대한 자세한 내용은 이진 대 텍스트 인코딩을 참조하십시오.

Microsoft WindowsC++ 프로그래밍 언어용 표준 라이브러리는 프로그래머가 파일을 열 때 파일이 일반 텍스트인지 바이너리인지를 나타내는 파라미터를 지정할 수 있도록 합니다.는 시스템이 C/C++ "행 끝" 문자 간에 변환하는 경우 파일 읽기 및 쓰기에 대한 표준 라이브러리 호출에 영향을 줍니다.r(ASCII 라인피드 문자) 및 Windows가 파일에서 예상하는 줄 끝 시퀀스(ASCII 캐리지 리턴 문자 및 줄 바꿈 문자 순서)를 선택합니다.Unix 유사 시스템에서는 C 및 C++ 표준 라이브러리는 프로그래머가 파일이 텍스트인지 바이너리인지 지정할 수 있지만 Unix 유사 시스템의 줄 끝 시퀀스는 C/C++ 줄 끝 문자일 뿐이므로 라이브러리는 이 파라미터를 무시할 수 있습니다.

표시

16진수 에디터 또는 뷰어를 사용하여 파일 데이터를 [2]바이너리 파일의 대응하는 바이트에 대해 일련의 16진수(또는 10진수, 바이너리 또는 ASCII 문자) 값으로 표시할 수 있습니다.

바이너리 파일이 텍스트에디터로 열려 있는 경우, 통상, 8비트의 각 그룹은 1개의 문자로 변환되어 텍스트 문자의 표시(아마도 이해할 수 없는)가 표시됩니다.다른 응용 프로그램에서 파일을 열면 해당 응용 프로그램은 각 바이트를 숫자로 처리하여 0에서 255 사이의 숫자 스트림을 출력하거나 바이트의 숫자를 색상으로 해석하여 해당 그림을 표시할 수 있습니다.다른 유형의 뷰어('단어 추출기'라고 함)는 단순히 인쇄 불가능한 문자를 사람이 읽을 수 있는 텍스트만 보여주는 공백으로 대체합니다.이러한 유형의 보기는 게임에서 암호를 찾고, 텍스트가 아닌 파일에서 숨겨진 텍스트를 찾고 손상된 [2]문서를 복구하기 위해 이진 파일을 빠르게 검사하는 데 유용합니다.의심스러운 파일(소프트웨어)에 불필요한 영향이 없는지 검사하는 데도 사용할 수 있습니다.예를 들어, 사용자는 의심스러운 소프트웨어가 승인되지 않은 데이터를 업로드(도용하기 위해)하기 위해 접속을 시도하는 URL/이메일을 볼 수 있습니다.파일 자체가 실행 파일로 처리되어 실행되면 운영체제는 해당 파일을 기계어로 일련의 명령으로 해석하려고 합니다.

해석

이진 파일에는 표준이 매우 중요합니다.예를 들어 ASCII 문자 집합으로 해석된 이진 파일은 텍스트가 표시됩니다.커스텀 어플리케이션에서는 파일을 다르게 해석할 수 있습니다.바이트는 소리, 픽셀, 또는 단어 전체가 될 수도 있습니다.바이너리 자체는 실행 알고리즘이 각 비트, 바이트, 워드 또는 블록에 대해 무엇을 해야 하는지를 정의할 때까지 의미가 없습니다.따라서 바이너리를 조사하여 기존의 포맷과 대조하는 것만으로 실제로 무엇을 나타내는지에 대해 잘못된 결론을 내릴 수 있습니다.이 사실은 숨겨진 내용을 드러내기 위해 알고리즘이 바이너리 데이터 파일을 다르게 해석하는 스테가노그래피에서 사용될 수 있습니다.알고리즘이 없으면 숨겨진 콘텐츠가 존재한다고 판단할 수 없습니다.

바이너리 호환성

바이너리 호환성이 있는 2개의 파일은 파일의 데이터 부분에 0과 1의 동일한 시퀀스를 가집니다.그러나 파일 헤더는 다를 수 있습니다.

이 용어는 한 응용 프로그램에 의해 생성된 데이터 파일이 다른 응용 프로그램에 의해 생성된 데이터 파일과 정확히 동일함을 나타내기 위해 가장 일반적으로 사용됩니다.예를 들어 일부 소프트웨어 회사는 이진 호환 Windows 및 Macintosh용 응용 프로그램을 생산합니다. 즉, Windows 환경에서 생성된 파일은 Macintosh에서 생성된 파일과 호환됩니다.이렇게 하면 데이터 가져오기 및 내보내기로 인해 발생하는 많은 변환 문제를 방지할 수 있습니다.

서로 다른 컴퓨터 간에 발생할 수 있는 이진 호환성의 문제 중 하나는 컴퓨터의 엔디안성입니다.일부 컴퓨터에서는 바이트를 파일에 [3]다른 순서로 저장합니다.

「 」를 참조해 주세요.

레퍼런스

  1. ^ a b "Binary file definition by The Linux Information Project (LINFO)". www.linfo.org. Retrieved 2017-10-12.
  2. ^ a b c d "Ascii vs. Binary Files". www.cs.umd.edu. Retrieved 2017-10-12.
  3. ^ "NCL: Reading binary data". www.ncl.ucar.edu. Archived from the original on 2017-10-12. Retrieved 2017-10-12.

외부 링크

  • Wiktionary의 바이너리 사전 정의