필드 텍스트

Fielded text

필드 텍스트(Fielded Text)는 값 테이블(예: CSV 파일)이 포함된 텍스트 파일에 구조와 스키마 정의를 제공하는 제안된 표준이다.이 표준은 텍스트 파일 내의 데이터 형식과 구조를 메타 파일로 지정할 수 있도록 한다.그러면 이 메타 파일은 데이터베이스에서 데이터에 액세스하는 것과 유사한 방식으로 파일의 데이터에 액세스하는 데 사용될 수 있다.

메타 파일

메타 파일은 필드 텍스트 파일의 구조와 필드 데이터의 포맷 방법을 설명하는 XML 파일/스트림이다.그것이 포함하는 정보는 데이터베이스의 메타 정보와 유사하다.

메타에는 다음과 같은 정보 그룹이 포함되어 있다.

  • 전체 텍스트 파일에 적용되는 속성을 지정하는 기본 섹션.
  • 텍스트 파일 내에서 사용되는 각 데이터 필드의 속성을 지정하는 필드 섹션
  • 텍스트 파일 내에서 사용할 대체 항목을 지정하는 대체 섹션.대체는 일부 CSV 파일(예: \n)에서 사용되는 이스케이프 시퀀스와 유사하다.
  • 시퀀스 섹션.필드 텍스트 파일은 키 필드 값에 따라 필드 집합이 서로 다른 줄을 가질 수 있다.메타 파일의 시퀀스 섹션은 키 필드를 따를 수 있는 필드 순서를 지정한다.

일반적으로 메타 파일의 확장명은 "ftm"이다.

선언 및 선언되지 않은 필드 텍스트 파일

필드 텍스트 파일은 선언하거나 선언 취소될 수 있다.

선언된 필드 텍스트 파일은 텍스트 파일과 관련된 메타 데이터를 참조하는 두 개의 특수 행으로 시작한다.메타 참조는 URI, 파일 또는 텍스트 파일 내에 주석으로 포함될 수 있다.선언된 필드 텍스트 파일은 항상 "!필드 텍스트^" (따옴표가 없는) 문자로 시작하여 선언된 필드 텍스트 파일로 식별한다.선언된 필드 텍스트 파일에는 "ftx"의 파일 확장자가 종종 사용된다.또한 이 표준은 MIME 유형 텍스트/필드를 필드 텍스트 데이터 스트림을 식별하는 데 사용할 것을 제안한다.

Unclared Fielded Text 파일은 2개의 특수 행으로 시작하지 않는다.이것은 필드 텍스트 메타 파일/스트림과 암묵적으로 연관되지 않는다.응용프로그램은 구조와 형식을 결정하기 위해 명시적으로 메타 파일을 신고되지 않은 필드 텍스트 파일과 연결해야 한다.기존 CSV, 고정 길이 필드 및 테이블의 값을 포함하는 기타 텍스트 파일은 미신고 필드 텍스트 파일이다.

기본 예

아래는 기본 CSV 파일이다.그것은 2개의 제목줄과 4개의 데이터줄을 가지고 있다.선에는 다양한 유형의 7개 필드가 들어 있다.

"Pet Name", "Age", "Color", "Date Received", "Price", "Needs Walking", "Type" , (Years), , , (Dollars), , "Rover", 4.5, Brown, 12 Feb 2004, 80, True, "Dog" "Charlie", , Gold, 5 Apr 2007, 12.3, False, "Fish" "Molly", 2, Black, 12 Dec 2006, 25, False, "Cat" "Gilly", , White, 10 Apr 2007, 10, False, "Guinea Pig"

다음 필드 텍스트 메타 파일은 위의 텍스트 파일의 구조와 레이아웃(구성표)을 지정한다.

 <?xml 버전="1.0" 인코딩="utf-16"?>  <필드로이드텍스트 HeadingLineCount="2">    <필드 이름="펫이름" />    <필드 DataType="플로트" 이름="나이" />    <필드 이름="컬러" />    <필드 DataType="날짜 시간" 이름="수신 날짜" 형식="d MMM yyyy" />    <필드 DataType="십진법" 이름="가격" />    <필드 DataType="부울" 이름="NeedsWalking" />    <필드 이름="유형" />  </필더드문자> 

다음은 위의 CSV 텍스트와 그 메타 데이터가 코멘트로 포함된 선언된 필드 텍스트 파일이다.~ 문자는 주석 라인을 지정한다.

 ~ !Fielded Text^ Version="1.0" ~ MetaEmbedded="True" ~ <?xml 버전="1.0" 인코딩="utf-16"?> ~ <야전>Text LineCommentChar="~" HeadingLineCount="2" > ~ "필드 이름="PetName" /> ~ <필드 데이터 유형="플로트" 이름="나이" /> ~ < 필드 네임="색상" /> ~ <필드 데이터 유형="날짜 시간" 이름="날짜 수신" 형식="d MMM yyyy" /> ~ <필드 데이터 유형="십진수" 이름="""가격" /> ~ <필드 DataType="Boolean" 이름="보행 필요" /> ~ <현장명="유형" /> ~ </필드형Text>  "Pet Name", "Age", "Color", "Date Received", "Price", "Needs Walking", "Type"  , (Years), , , (Dollars), ,  "Rover", 4.5, Brown, 12 Feb 2004, 80, True, "Dog"  "Charlie", , Gold, 5 Apr 2007, 12.3, False, "Fish"  "Molly", 2, Black, 12 Dec 2006, 25, False, "Cat"  "Gilly", , White, 10 Apr 2007, 10, False, "Guinea Pig"

역량

Fielded Text 표준은 Meta의 스키마를 최대한 단순하게 유지하면서 값 테이블을 포함하는 거의 모든 기존 텍스트 파일을 처리할 수 있는 충분한 기능을 제공하는 것을 목표로 한다.다음 목록은 필드 텍스트 표준의 기능을 요약한 것이다.

  • 구분 기호 문자로 구분된 필드
  • 고정 길이 필드
  • 줄에 고정 길이와 구분 기호로 구분된 혼합 필드
  • 따옴표로 묶인 필드(선택사항 또는 명시적)
  • 따옴표의 새 선
  • 자동 새 라인 감지 또는 지정된 새 라인 문자
  • 평.
  • 빈 줄 무시
  • 줄에서 추가 문자/필드 무시
  • 언어 문화 처리
  • 다중 제목줄(구분된 길이와 고정된 길이 모두)
  • 대체(탈출 시퀀스)
  • 포함된(더핑된) 따옴표 문자
  • Boolean, DateTime, Decimum, Float, 정수 및 문자열 필드
  • 필드 제목 제약 조건
  • Null 필드
  • 상수 필드
  • 필드 형식 및 스타일 지정
  • 선은 "키" 필드의 값에 따라 다른 필드 시퀀스를 가질 수 있음

사양

Fielded Text 표준 초안 사양은 Fielded Text페이지에서 확인할 수 있다.

참고 항목

외부 링크

  • 필드 텍스트 홈 페이지
  • RFC4180: CSV(쉼표로 구분된 값) 파일의 공통 형식 및 MIME 유형