데이터 이행

Data migration

데이터 마이그레이션은 데이터를 선택, 준비, 추출 및 변환하고 컴퓨터 스토리지 시스템 간에 데이터를 영구적으로 전송하는 프로세스입니다.또한 이행된 데이터의 완전성을 검증하고 레거시 데이터 스토리지의 폐기는 데이터 이행 [1][2]프로세스 전체의 일부로 간주됩니다.데이터 이행은 모든 시스템 구현, 업그레이드 또는 통합에 있어 중요한 고려사항이며, 일반적으로 가능한 한 자동화되도록 수행되므로 번거로운 작업으로부터 인력을 해방할 수 있습니다.데이터 이행은 서버 또는 스토리지 기기의 교환, 유지보수 또는 업그레이드, 애플리케이션 이행, 웹 사이트 통합, 디저스터 리커버리,[2] 데이터 센터 재배치 등 다양한 이유로 이루어집니다.

표준 단계

"2011년 현재 데이터 마이그레이션 프로젝트의 거의 40%가 시간 초과, 예산 초과 또는 [1][3]완전히 실패했습니다."따라서 효과적인 데이터 이행을 위해서는 적절한 계획이 중요합니다.데이터 마이그레이션 계획의 구체적인 내용은 프로젝트마다 크게 다를 수 있지만, 컴퓨팅 회사인 IBM은 대부분의 데이터 마이그레이션 프로젝트에는 계획,[2] 마이그레이션 및 마이그레이션 후라는 세 가지 주요 단계가 있다고 제안합니다.각 단계에는 고유한 단계가 있습니다.계획 수립 시 의존관계 및 요건을 분석하고 이행 시나리오를 작성 및 테스트하며 이전 정보를 포함하는 프로젝트 계획을 작성합니다.이행 단계에서는 계획이 수립되고 이행 후 이행의 완전성과 완전성이 검증, 문서화, 종료됩니다.이행에는 레거시 시스템의 [2]폐기가 포함됩니다.복잡도가 중간에서 높은 애플리케이션의 경우, 새로운 시스템이 완전히 검증되어 도입될 때까지 이러한 데이터 이행 단계를 여러 번 반복할 수 있습니다.

계획:이행되는 데이터, 애플리케이션 등은 비즈니스, 프로젝트, 기술요건 및 의존관계에 따라 선택됩니다.하드웨어 및 대역폭 요건이 분석됩니다.실행 가능한 마이그레이션 및 백아웃 시나리오와 관련된 테스트, 자동화 스크립트, 매핑 및 절차가 개발됩니다.데이터 품질을 향상시키고 중복되거나 사용되지 않는 정보를 제거하기 위해 데이터 형식에 대한 데이터 정리 및 변환 요구 사항도 측정됩니다.이행 아키텍처가 결정 및 개발되고 필요한 소프트웨어 라이선스가 취득되며 변경 관리 프로세스가 시작됩니다.[1][2]

이행:하드웨어 및 소프트웨어 요건을 검증하고 필요에 따라 이행 절차를 맞춤화할 수 있습니다.요건과 커스터마이즈 설정이 올바르게 기능하는 것을 확인하기 위해서, 일종의 사전 검증 테스트도 실시합니다.모든 것이 정상이라고 판단되면 이전 시스템에서 데이터를 읽는 데이터 추출과 새 시스템에 데이터를 쓰는 데이터 로딩 등의 주요 작업을 포함하여 마이그레이션이 시작됩니다.추가 검증 단계를 통해 개발된 마이그레이션 계획이 완전히 [1][2]수립되었음을 확인할 수 있습니다.

이행 후: 데이터 이행 후 결과를 검증하여 데이터가 올바르게 변환되었는지, 완전한지, 새로운 시스템의 프로세스를 지원하는지 여부를 판단합니다.검증 중에는 불일치 영역을 식별하고 잘못된 데이터 손실을 방지하기 위해 두 시스템을 동시에 실행해야 할 경우가 있습니다.이행프로젝트에 대한 추가 문서화와 보고서가 수행되며 이행이 완료되면 레거시 시스템도 폐기될 수 있습니다.이행 클로즈아웃 미팅은 이행 [1][2]프로세스를 공식적으로 종료합니다.

프로젝트 대 프로세스

데이터 이행과 데이터 통합 작업에는 차이가 있습니다.데이터 이행은 어떤 환경에서 다른 환경으로 데이터를 이동 또는 복사하여 소스에서 삭제 또는 폐기하는 프로젝트입니다.이행 중(수개월 또는 수년에 걸쳐 발생할 수 있음)에는 데이터가 여러 방향으로 흐를 수 있으며 동시에 여러 이행이 발생할 수 있습니다.ETL(추출, 변환, 부하) 조치가 필요하지만, 이를 달성하는 방법은 전통적으로 ETL 약어와 관련된 방법이 아닐 수 있다.

반면, 데이터 통합은 IT 아키텍처의 영구적인 부분이며 다양한 애플리케이션과 데이터스토어 간의 데이터 흐름을 담당하며 프로젝트 활동이 아닌 프로세스입니다.운영 체제에서 데이터 웨어하우스로 데이터를 공급하도록 설계된 표준 ETL 기술은 후자의 [4]범주에 포함됩니다.

분류

데이터는 다양한 미디어에 파일 또는 데이터베이스에 저장되며 소프트웨어 애플리케이션에 의해 생성 및 소비되며, 이는 비즈니스 프로세스를 지원합니다.데이터 전송 및 변환의 필요성은 여러 비즈니스 요건에 의해 좌우될 수 있으며, 이행에 대한 접근방식은 이러한 요건에 따라 달라집니다.이를 기반으로 네 가지 주요 마이그레이션 범주가 제안됩니다.

스토리지 이행

기업은 물리적 미디어를 합리화하여 보다 효율적인 스토리지 [2]기술을 활용할 수 있습니다.따라서 테이프 또는 디스크 간에 데이터의 물리 블록을 이동해야 하며, 많은 경우 가상화 기술을 사용해야 합니다.데이터 형식 및 콘텐츠 자체는 일반적으로 프로세스에서 변경되지 않으며,[5] 일반적으로 위의 계층에 대한 영향을 최소화하거나 전혀 미치지 않고 달성할 수 있습니다.

데이터베이스 이행

마찬가지로 데이터베이스 벤더 에 이동하거나 사용 중인 데이터베이스 소프트웨어의 버전을 업그레이드해야 할 수도 있습니다.후자의 경우 물리적 데이터 마이그레이션이 덜 필요하지만, 이는 대규모 업그레이드에서 발생할 수 있습니다.이러한 경우 기본 데이터 형식이 크게 변경될 수 있으므로 물리적 변환 프로세스가 필요할 수 있습니다.이는 데이터 조작 언어 또는 프로토콜이 [6]변경되었는지 여부에 따라 애플리케이션 계층의 동작에 영향을 줄 수도 있고 그렇지 않을 수도 있습니다.그러나 일부 최신 애플리케이션은 데이터베이스 [7]기술에 거의 의존하지 않도록 작성되어 있으므로, Sybase, MySQL, IBM DB2 또는 SQL Server에서 Oracle로 변경할 경우 기능 및 비기능 성능에 부정적인 영향을 미치지 않는지 확인하기 위한 테스트 주기만 필요합니다.

응용 프로그램 이행

애플리케이션 벤더(: 새로운 CRM 또는 ERP 플랫폼)의 변경은 거의 모든 애플리케이션 또는 제품군이 고유한 데이터 모델에서 작동하고 엔터프라이즈 애플리케이션 통합 [8]환경 내의 다른 애플리케이션 및 시스템과 상호 작용하기 때문에 상당한 변화가 불가피합니다.게다가 애플리케이션을 가능한 한 폭넓은 시장에 판매할 수 있도록, 통상, 메타데이터를 사용해 각 고객에 대해서 시판 패키지가 구성되어 있습니다.벤더가 취급해야 하는 데이터의 무결성을 보호하기 위해 벤더에 의해 Application Programming Interface(API; 응용 프로그램프로그래밍 인터페이스)가 제공될 수 있습니다.벤더의 웹 인터페이스를 스크립팅하여 [9]데이터를 자동으로 이행할 수도 있습니다.

비즈니스 프로세스의 이행

비즈니스 프로세스는 대개 비즈니스 프로세스 관리 도구에 의해 조정되는 인적 및 애플리케이션 시스템 작업의 조합을 통해 운영됩니다.이러한 변경사항이 발생하면 조직 및 고객, 제품 및 운영에 대한 정보를 반영하기 위해 한 저장소, 데이터베이스 또는 애플리케이션에서 다른 저장소로 데이터를 이동해야 할 수 있습니다.이러한 마이그레이션 동인의 예로는 인수합병, 비즈니스 최적화, 새로운 시장 공략 또는 경쟁 [10]위협에 대응하기 위한 재편성 등이 있습니다.

이행의 첫 번째 두 가지 카테고리는 통상, IT부문이 다른 비즈니스의 관여 없이 처리하는 통상적인 운용 액티비티입니다.마지막 두 범주는 프로세스와 애플리케이션의 운영 사용자에게 직접 영향을 미치며 복잡할 수밖에 없으며, 비즈니스 다운타임을 크게 발생시키지 않고 이를 제공하는 것은 어려울 수 있습니다.이러한 [10]이행에서는 프로젝트 관리 사무소 또는 데이터 거버넌스 팀을 통한 고도의 적응형 접근법, 동시 동기화, 비즈니스 지향 감사 기능 및 이해관계자의 명확한 이행 가시성이 주요 요건이 될 수 있습니다.

디지털 보존의 한 형태로서의 이행

디지털 객체 자체에 초점을 맞춘 마이그레이션은 오래된 미디어에서 현재 미디어로 데이터를 전송하거나 다시 쓰는 행위이며, 오랫동안 디지털 객체의 장기 [11]보존을 위한 유일한 실행 가능한 접근법으로 여겨져 왔습니다.부서지기 쉬운 신문을 마이크로필름에 재생산하는 것이 그러한 이동의 한 예이다.

단점들

  • 이행은 데이터 캐리어의 노후화에 대처하지만 데이터를 실행하는 특정 테크놀로지가 완전히 포기되어 이행이 무용지물이 될 수 있다는 사실은 다루지 않습니다.
  • 시간이 오래 걸리는 – 이행은 지속적인 프로세스로 미디어가 노후화될 때마다 특정 미디어에 저장된 모든 데이터 개체에 대해 반복해야 합니다.
  • 고비용 – 이행 [12]시마다 추가 데이터 스토리지 미디어를 구입해야 합니다.

「 」를 참조해 주세요.

레퍼런스

  1. ^ a b c d e Morris, J. (2012). "Chapter 1: Data Migration: What's All the Fuss?". Practical Data Migration (2nd ed.). BCS Learning & Development Ltd. pp. 7–15. ISBN 9781906124847.
  2. ^ a b c d e f g h Dufrasne, B.; Warmuth, A.; Appel, J.; et al. (2017). "Chapter 1: Introducing disk data migration". DS8870 Data Migration Techniques. IBM Redbooks. pp. 1–16. ISBN 9780738440606.
  3. ^ Howard, P. (23 August 2011). "Data Migration Report - 2011". Bloor Research International Limited. Retrieved 20 July 2018.
  4. ^ King, T. (17 August 2016). "Data Integration vs. Data Migration; What's the Difference?". Solutions Review - Data Integration. LeadSpark, Inc. Retrieved 20 July 2018.
  5. ^ Seiwert, C.; Klee, P.; Marinez, L.; et al. (2012). "Chapter 2: Migration techniques and processes". Data Migration to IBM Disk Storage Systems. IBM Redbooks. pp. 7–30. ISBN 9780738436289.
  6. ^ Fowler, M.; Beck, K.; Brant, J.; et al. (2012). Refactoring: Improving the Design of Existing Code. Addison-Wesley. pp. 63–4. ISBN 9780133065268.
  7. ^ Fronc, A. (1 March 2015). "Database-agnostic applications". DBA Presents. Retrieved 20 July 2018.
  8. ^ Plivna, G. (1 July 2006). "Data migration from old to new application: An experience". gplivna.eu. Retrieved 20 July 2018.
  9. ^ Ortac, Alper; Monperrus, Martin; Mezini, Mira (2015). "Abmash: mashing up legacy Web applications by automated imitation of human actions" (PDF). Software: Practice and Experience. 45 (5): 581–612. doi:10.1002/spe.2249. ISSN 0038-0644. S2CID 16940486.
  10. ^ a b Allen, M.; Cervo, D. (2015). Multi-Domain Master Data Management: Advanced MDM and Data Governance in Practice. Morgan Kaufmann. pp. 61–2. ISBN 9780128011478.
  11. ^ van der Hoeven, Jeffrey; Bram Lohman; Remco Verdegem (2007). "Emulation for Digital Preservation in Practice: The Results". The International Journal of Digital Curation. 2 (2): 123–132. doi:10.2218/ijdc.v2i2.35.
  12. ^ Muira, Gregory (2007). "Pushing the Boundaries of Traditional Heritage Policy: maintaining long-term access to multimedia content" (PDF). IFLA Journal. 33 (4): 323–326. doi:10.1177/0340035207086058. S2CID 110505620.

외부 링크