BUFR

BUFR

BUFR(Binary Universal Form)세계기상기구(WMO)가 유지하는 바이너리 데이터 형식이다.최신 버전은 BUFR Edition 4입니다. BUFR Edition 3도 현재 운용 가능한 것으로 간주됩니다.BUFR은 SYNOP(표면 관측), TEMP(상층 공기 소리), CLIMAT(월간 기후 데이터)와 같은 수십 개의 문자 기반 위치 기반 기상 코드를 대체한다는 목표로 1988년에 만들어졌다.BUFR은 휴대성이 뛰어나고 컴팩트하며 범용성이 뛰어납니다.어떤 종류의 데이터든 특정 공간/시간 컨텍스트 및 기타 관련 메타데이터와 함께 나타낼 수 있습니다.WMO 용어에서 BUFR은 테이블 구동 코드 형식의 범주에 속하며, 여기서 데이터 요소의 의미는 메시지 자체와 별도로 보관 및 유지되는 일련의 테이블을 참조하여 결정됩니다.

BUFR은 사용하기 어려운 복잡한 형식이며 몇 가지 약점을 나타냅니다.[2]BUFR 포맷의 도입으로 데이터의 「분할」과 많은 포맷 [3][4][5]에러가 발생했습니다.

형식 설명

BUFR 메시지는 6개의 섹션으로 구성되어 있으며 번호는 0 ~5 입니다.

  • 섹션 0, 1 및 5에는 주로 메시지 식별을 위한 스태틱메타데이터가 포함되어 있습니다.
  • 섹션 2는 옵션입니다.사용할 경우 메시지 작성자가 원하는 임의의 형식으로 임의 데이터를 포함할 수 있습니다(이는 로컬에서만 권장됩니다).
  • 섹션 3에는 BUFR 데이터 제품의 형태와 내용을 정의하는 일련의 설명자가 포함되어 있습니다.
  • 섹션 4는 섹션 3에서 설명한 바와 같이 메시지의 핵심 데이터와 메타데이터 값을 포함하는 비트 스트림입니다.

섹션 3에 포함된 제품 설명은 복제 및/또는 운영자 설명자를 사용하여 정교하고 단순하게 만들 수 있습니다.(각종 디스크립터의 개요에 대해서는, 이하를 참조해 주세요.자세한 것에 대하여는, 「WMO Guide on BUFR」를 참조해 주세요).

템플릿

섹션 3에는 섹션 4의 비트스트림 내용과 일치하는 일련의 설명자가 짧은 헤더에 이어 나옵니다.섹션 3의 기술자 시퀀스는 BUFR 메시지의 템플릿으로 이해할 수 있습니다.템플릿에는 일치하는 비트스트림에 포함된 데이터 값의 구조를 설명하는 데 필요한 정보가 포함되어 있습니다.이는 단계별로 알고리즘과 같은 방식으로 해석해야 합니다.일련의 BUFR 메시지에 따라 섹션 4에 포함된 값은 메시지마다 다를 수 있지만 섹션 3에 제시된 템플릿이 변경되지 않으면 순서와 구조는 예측 가능한 상태로 유지됩니다.템플릿은 특정 데이터 제품의 요구 사항(예: 날씨 관측)을 충족하도록 설계할 수 있습니다.그런 다음 이러한 템플릿을 사용하여 BUFR 데이터 제품의 내용과 구조를 표준화할 수 있습니다.WMO는 지표면 및 상층 공기 관측 데이터에 대한 다수의 BUFR 템플릿을 발표했다.

디스크립터

16비트 폭의 모든 디스크립터는 F-X-Y 구조로 되어 있습니다.F는 최상위2비트(최좌측)를 나타냅니다.X는 중간6비트, Y는 최하위8비트를 나타냅니다.F 값(0 ~ 3)에 따라 기술자의 유형이 결정됩니다.

  • Element Descriptors (F=0): 이름에서 알 수 있듯이, 이러한 Descriptors는 Elemental 데이터 및 관련 메타데이터를 전달하기 위해 사용됩니다.
    X 값은 설명자의 클래스를 식별합니다(즉, 수평 좌표 파라미터, 온도 파라미터 등).Y 값은 클래스 내의 기술자 번호입니다.요소 기술자 클래스 1 ~9는 모순되거나 취소되지 않는 한 BUFR 템플릿의 나머지 전체에 걸쳐 나타나는 순간부터 유효하다는 특별한 특성이 있습니다.실제로 클래스 1~9 기술자는 BUFR 메시지의 핵심 데이터에 적용되는 공간, 시간 및 기타 메타 데이터에 사용됩니다.
    모든 요소 기술자는 "표 B"로 알려진 BUFR 사양 섹션에 정의되어 있습니다.표 B에 새로운 요소 기술자를 추가해도 BUFR 소프트웨어 사양을 변경할 필요가 없다.표 B의 요소 기술자 정의에는 숫자, 짧은 텍스트 정의, 디코딩 파라미터(비트 폭, 스케일 팩터 및 바이어스) 및 유형(숫자, 문자열, 코드 테이블 등)이 포함됩니다.
  • 복제 기술자(F=1): 선택한 개수의 설명자의 반복을 제어할 수 있는 특수 기술자입니다.이것은 BUFR 템플릿에 루프와 같은 구조를 도입하는 매우 강력한 조작입니다.X 값은 복제에 포함할 다음 기술자의 수를 지정합니다.Y 값은 복제를 실행하는 횟수를 나타냅니다.Y=0인 경우 복제를 "복제"라고 하며 복제 수는 특수 요소 설명자의 값에서 구해야 합니다.
  • 연산자 설명자(F=2):이러한 기술자는 데이터의 특성을 수정하거나 원본과 함께 추가 데이터를 생성 및 조작할 수 있는 특수 작업을 제공합니다.X 값은 연산자를 식별하고 Y 은 응용 프로그램을 제어하는 데 사용됩니다.이러한 기술자는 "표 C"로 알려진 BUFR 사양 섹션에 정의되어 있습니다.C에 새로운 오퍼레이터 기술자를 추가하려면 BUFR 소프트웨어 사양을 변경해야 하므로 새로운 BUFR 에디션 번호가 필요합니다.
  • 시퀀스 기술자(F=3): 단일 시퀀스 기술자는 복제 기술자 및 표 B, C 및 D 항목을 포함한 다른 기술자 시퀀스의 별칭입니다.이러한 기술자는 "표 D"로 알려진 BUFR 사양 섹션에 정의되어 있습니다.X Y 값의 사용은 요소 설명자와 동일합니다.

서브셋

섹션 3 템플릿에 설정된 데이터 구조는 단일 BUFR 메시지 내에서 여러 번 재사용할 수 있습니다.이러한 경우 섹션 4는 일련의 소위 하위 집합을 포함한다.예를 들어, 하위 집합을 사용하여 여러 위치에서 관찰된 내용을 단일 메시지로 전달할 수 있습니다.

레퍼런스

  1. ^ "Archived copy". Archived from the original on 2018-02-15. Retrieved 2018-02-14.{{cite web}}: CS1 maint: 제목으로 아카이브된 복사(링크)
  2. ^ "On the suitability of BUFR and GRIB for archiving data". 10 January 2013.
  3. ^ Hand, E. (2016). "Obsolescence looms for balloon data". Science. 352 (6283): 281–282. Bibcode:2016Sci...352..281H. doi:10.1126/science.352.6283.281. PMID 27081049.
  4. ^ "Dealing with Disappearing Surface Data: The Migration to BUFR and the Discontinuation of Text SYNOP and Buoy Reports". 25 January 2017.
  5. ^ "ECMWF - TAC2BUFR - ECMWF Confluence Wiki" (PDF).

외부 링크

온라인 BUFR 검증 프로그램

소프트웨어 라이브러리