플랫 파일 데이터베이스

Flat-file database
플랫 파일[1] 모델의 예

플랫 파일 데이터베이스는 플랫 파일이라는 파일에 저장된 데이터베이스입니다.레코드는 통일된 형식을 따르며 레코드 간의 관계를 인덱싱하거나 인식하는 구조는 없습니다.파일은 간단합니다.플랫 파일은 플레인 텍스트 파일(예: csv, txt 또는 tsv) 또는 바이너리 파일입니다.데이터베이스 내의 데이터에서 관계를 추정할 수 있지만 데이터베이스 형식 자체는 이러한 관계를 명확하게 하지 않습니다.

이 용어는 일반적으로 작은 데이터베이스를 의미하지만 매우 큰 데이터베이스도 플랫할 수 있습니다.

개요

보통 일반 텍스트 파일에는 한 [2]줄에 하나의 레코드가 포함됩니다.데이터를 묘사하는 규칙에는 여러 가지가 있습니다.쉼표로 구분된 값과 구분자로 구분된 값 파일에서는 필드를 쉼표 또는 탭 문자 등의 구분자로 구분할 수 있습니다.각 필드의 길이가 고정되어 있는 경우도 있습니다.짧은 값은 공백 문자로 채워질 수 있습니다.딜리미터 충돌을 피하기 위해 추가 서식이 필요할 수 있습니다.

딜리미터를 사용하면 (고정폭 포맷과는 달리) 처리될 때마다 딜리미터를 찾는 데 약간의 오버헤드가 발생하므로 성능에 영향이 있을 수 있습니다.다만, 문자 구분자(특히 쉼표)의 사용도 데이터 압축의 대략적인 형태이며, 데이터 볼륨을 삭감하는 것으로, 특히 데이터 전송의 목적으로 전체적인 퍼포먼스에 도움이 되는 경우가 있습니다.길이 구성요소(선언식 표기법)를 포함하는 문자 구분자를 사용하는 것은 비교적 드물지만 각 필드의 범위를 찾는 데 관련된 오버헤드를 크게 줄입니다.

플랫 파일의 예는 다음과 같습니다./etc/passwd그리고./etc/groupUnix와 같은 운영체제에서는플랫 파일의 다른 예로는 [Name], [Address], [Phone Number]필드가 있는 이름과 주소 리스트가 있습니다.

종이에 손으로 쓴 이름, 주소 및 전화번호 목록은 플랫 파일 데이터베이스입니다.이것은 타자기나 워드프로세서에서도 가능합니다.스프레드시트 또는 텍스트 에디터 프로그램을 사용하여 플랫 파일 데이터베이스를 구현할 수 있습니다.이 데이터베이스를 인쇄하거나 온라인으로 사용하여 검색 기능을 향상시킬 수 있습니다.

역사

로(아마)도 카드를 다른 카드 색인, 또는 개별 카드(포지티브 개인 자료 관련된 포함한 미국 통계국 처음 1890년 미국 인구 조사 때 주의에 허먼 홀러리스의 작품은, 데이터 종이 cards,[3]에 구멍을 통해 표와 관련된 스캔들이 첫번째 컴퓨터화된 플랫 파일 데이터베이스라고 볼 수 있다.s)그룹 멤버십을 통해 서로를 구할 수 있습니다.

1980년대에는 IBM PCMacintosh에서 구성 가능한 플랫 파일 데이터베이스 컴퓨터 애플리케이션이 유행했습니다.이 프로그램들은 개인이 쉽게 데이터베이스를 설계하고 사용할 수 있도록 설계되었으며,[citation needed] 인기 에서 워드프로세서스프레드시트와 거의 대등했다.플랫 파일 데이터베이스 소프트웨어의 예로는 이전 버전의 FileMaker, 쉐어웨어 PC-File 및 널리 사용되는 dBase 등이 있습니다.

플랫 파일 데이터베이스는 쓰기 및 편집이 쉽고 복잡한 방식으로 무수한 목적에 적합하기 때문에 일반적이고 어디서나 사용할 수 있습니다.

최신 구현

NoSQL 데이터, JSON 형식의 데이터, 원시 스프레드시트(콤마 구분 또는 탭 구분) 및 텍스트 파일의 선형 저장소는 통합된 인덱스, 데이터 요소 간의 기본 제공 참조 또는 복잡한 데이터 유형이 없기 때문에 모두 플랫 파일 데이터베이스로 볼 수 있습니다.책이나 약속 및 주소록의 컬렉션을 관리하는 프로그램은 기본적으로 단일 목적 플랫 파일 데이터베이스를 사용하여 인덱스 또는 포인팅 시스템으로 장식되지 않은 플랫 파일에서 정보를 저장 및 검색할 수 있습니다.

사용자가 목차를 텍스트 파일에 쓸 수 있지만 텍스트 파일 형식 자체에는 목차의 개념이 포함되어 있지 않습니다.사용자는 John의 연락처 정보에 대해 "Notes" 섹션에 "Friends with Kathy"라고 쓸 수 있지만, 이는 데이터베이스에 내장된 기능이 아니라 사용자에 의해 해석됩니다.데이터베이스 시스템이 레코드 간의 관계를 인식하고 성문화하기 시작하면 "평탄한" 것에서 벗어나기 시작하고, 유형 및 계층적 관계를 기술하는 세부적인 시스템을 갖추면, 이제는 "평탄한" 것으로 간주되기에는 너무 구조화된다.

데이터베이스 예시

다음 예시는 플랫 파일 데이터베이스의 일반적인 요소를 보여 줍니다.데이터 배열은 일련의 열과 행으로 구성되어 표 형식으로 구성됩니다.이 예에서는 1개의 테이블만 사용합니다.

열에는 이름(사람 이름, 두 번째 열), (사람이 지원하는 운동팀 이름, 세 번째 열) 및 숫자 고유 ID(기록, 첫 번째 열)가 포함됩니다.

다음은 설명한 데이터의 텍스트 표시 예를 나타냅니다.

id name team 1 Amy Blues 2 Bob Reds 3 Chuck Blues 4 Richard Blues 5 Ethel Reds 6 Fred Blues 7 Gilly Blues 8 Hank Reds 9 Hank Blues

이러한 유형의 데이터 표현은 플랫 파일 데이터베이스에는 매우 표준적이지만 텍스트에서는 쉽게 알 수 없는 몇 가지 추가 고려 사항이 있습니다.

  • 데이터 유형: 위와 같은 데이터베이스 테이블의 각 열은 일반적으로 특정 데이터 유형으로 제한됩니다.이러한 제한은 일반적으로 관례에 의해 확립되지만, 데이터가 관계형 데이터베이스 시스템으로 전송되지 않는 한 공식적으로 명시되지 않는다.
  • 구분된 열:위의 예에서 개별 열은 공백 문자를 사용하여 구분됩니다.이를 들여쓰기 또는 "고정 폭" 데이터 형식이라고도 합니다.또 다른 일반적인 규칙은 탭이나 쉼표와 같은 하나 이상의 딜리미터 문자를 사용하여 열을 구분하는 것입니다.
  • 관계 대수:위의 표의 각 행 또는 레코드는 관계형 대수에서 태플의 표준 정의를 충족합니다(위의 예는 일련의 3 튜플을 나타냅니다).또한 첫 번째 행은 각 행의 값과 관련된 필드 이름을 지정합니다.
  • 데이터베이스 관리 시스템:텍스트 파일로 가능한 정식 조작은 보통 원하는 것보다 제한적이기 때문에 위의 예의 텍스트는 일반적으로 데이터베이스 관리 시스템으로 전송되기 전에 데이터의 중간 상태를 나타냅니다.

「 」를 참조해 주세요.

  • /etc/passwd(일반적으로 사용되는 플랫 파일)는 Unix에서 사용자를 세부적으로 설명하는 데 사용됩니다.
  • CSV(표준 쉼표로 구분된 값)
  • Berkeley DB(표준 플랫 파일 데이터베이스)
  • Awk(클래식 플랫 파일 프로세서)
  • Recfiles(일반 텍스트 데이터베이스 파일 형식)

레퍼런스

  1. ^ 데이터 통합 용어집 2009년 3월 20일 미국 교통부 Wayback Machine, 2001년 8월.
  2. ^ Fowler, Glenn (1994), "cql: Flat-file database query language", WTEC'94: Proceedings of the USENIX Winter 1994 Technical Conference on USENIX Winter 1994 Technical Conference
  3. ^ Blodgett, John H.; Schultz, Claire K. (1969). "Herman hollerith: data processing pioneer". American Documentation. 20 (3): 221–226. doi:10.1002/asi.4630200307. ISSN 1936-6108.