DNA디지털데이터스토리지

DNA digital data storage

DNA 디지털 데이터 저장소는 합성된 DNA [1][2]가닥과 주고받는 이진 데이터를 인코딩하고 해독하는 과정입니다.

저장 매체로서의 DNA는 높은 저장 밀도로 인해 엄청난 잠재력을 가지고 있지만, 비용이 많이 들고 읽기 및 쓰기 시간이 [3]매우 느리기 때문에 현재 실용화에는 큰 제약이 있습니다.

2019년 6월, 과학자들은 위키피디아 영어판의 모든 16GB 텍스트가 합성 [4]DNA로 인코딩되었다고 보고했다.2021년 과학자들은 18Mbps의 [5]속도로 데이터를 DNA에 쓸 수 있는 맞춤형 DNA 데이터 라이터가 개발되었다고 보고했다.

셀프리

현재 사용되고 있는 가장 광범위한 DNA 배열 기술은 Illumina에 의해 개발된 것으로, 고체 지지대 위의 단일 가닥 DNA의 고정화, 배열의 중합효소 연쇄반응(PCR) 증폭, 형광 마커로 태그된 상호보완적 염기로 개별 DNA 베이스의 라벨링을 포함한다(Illlumina 염료 seq 참조).uencing)형광 패턴(4개의 DNA 염기 각각에 대해 다른 색)은 이미지에서 포착되고 DNA [1]염기서열을 결정하기 위해 처리될 수 있습니다.최근 개발된 대안은 DNA 분자가 래칫 효소의 제어 하에 나노 스케일 기공을 통과하는 나노 포어 기술이다.DNA 분자의 통과는 측정할 수 있는 전류의 작은 변화를 일으킨다.나노포어 기술의 주요 장점은 실시간으로 [1]읽을 수 있다는 것이다.2016년 이 기술의 컨센서스 정확도는 약 99.3%[6]였으며 2022년에는 Q60 =[7] 99.9999%로 향상되었다.

생체내

살아있는 유기체의 유전자 코드는 잠재적으로 정보를 저장하기 위해 결합될 수 있다.게다가 합성 생물학은 세포의 유전 [1]물질에 저장된 정보의 저장과 검색을 가능하게 하기 위해 "분자 기록 장치"로 세포를 조작하는 데 사용될 수 있다.CRISPR 유전자 편집은 또한 세포의 게놈에 인공 DNA [1]서열을 삽입하는 데 사용될 수 있다.발달 계보 데이터(분자 플라이트 레코더)를 인코딩하는 경우, 마우스당 약 30조 개의 세포핵 △핵당 60 개의 기록 사이트 △사이트당 7 - 15 비트가 기록된 마우스당 약 2 테라바이트를 생성합니다(단,[8] 매우 선별적으로 읽기만 함).

역사

DNA 디지털 데이터 저장의 개념은 물리학자 리처드 P.가 1959년에 고안되었습니다. 파인만, "밑바닥에 많은 공간이 있다:새로운 물리학 분야로 진입하기 위한 초대'는 (생물학을 포함한) 소우주 물체와 유사하거나 더 광범위한 [9]능력을 가진 인공 물체의 생성에 대한 일반적인 전망을 개략적으로 설명했다.1964–65에서, 미하일 Samoilovich Neiman, 소비에트 연방 물리학자, 독립적으로 일반적인 고려 사항과 약간의 추정 녹음 저장 및 합성 DNA와 RNA분자에 정보의 복구가 가능한지에 대해 보여 주는molecular-atomic 1층에 초소형화에 대해 전자 제품에 3기사를 실었다.[10][11][12]첫 번째 M.S. Neiman의 논문 발표 후, 그리고 편집자에 의해 두 번째 논문의 원고(1964년 1월, 8일, 그 논문에 나타난 바와 같이)를 받은 후,[13] 사이버네틱스학자 Norbert Wiener와의 인터뷰가 출판되었다.N. Wiener는 M. S. Neiman이 제안한 아이디어에 가까운 컴퓨터 메모리의 소형화에 대한 아이디어를 독립적으로 표현했습니다.M. S. Neiman이 논문의 세 번째에서 언급한 이 Wiener의 생각들.이 이야기는 [14]자세히 설명되어 있다.

DNA 스토리지의 초기 사용 중 하나는 1988년 예술가 Joe Davis와 하버드 연구진 사이의 협업에서 발생했습니다.E.coli의 DNA 배열로 저장된 이 이미지는 5x7 매트릭스로 구성되었으며, 이 매트릭스는 한번 해독되면 생명체와 암컷 지구를 나타내는 고대 게르만족 룬의 그림을 형성했다.매트릭스에서 1은 어두운 픽셀에 대응하고 0은 밝은 [15]픽셀에 대응합니다.

2007년 애리조나 대학에서 주소 지정 분자를 사용하여 DNA 가닥 내의 불일치 부위를 인코딩하는 장치가 개발되었습니다.그런 다음 제한 다이제스트를 수행하여 이러한 불일치를 판독할 수 있었고,[16] 그 결과 데이터가 복구되었습니다.

2011년 조지처치, 스리코수리, 위안가오는 처치가 공동 집필한 659KB의 책을 암호화하는 실험을 했다.이를 위해 연구팀은 2대 1 대응법을 실시했는데, 여기서 2진수 0은 아데닌이나 시토신 중 하나로 표현되고 2진수 0은 구아닌이나 티민으로 표현된다.검사 결과 [15]DNA에서 22개의 오류가 발견되었습니다.

2012년, 하버드 대학조지 처치와 동료들은 DNA가 디지털 정보로 인코딩된 기사를 발표했는데, 여기에는 수석 연구원이 쓴 5만 3,400개의 워드북의 HTML 초안, 11개의 JPG 이미지, 그리고 1개의 자바스크립트 프로그램이 포함되어 있다.중복성을 위해 여러 개의 복사본이 추가되었고 5.5 페타비트[17]각 입방 밀리미터의 DNA에 저장할 수 있습니다.연구진은 비트가 베이스와 일대일로 매핑되는 간단한 코드를 사용했는데, 이는 같은 베이스의 장기 실행으로 이어지며, 시퀀싱이 오류 발생 가능성이 높다는 단점이 있었다.그 결과 DNA는 다른 기능 외에도 하드 드라이브나 자기 [18]테이프와 같은 또 다른 형태의 저장 매체가 될 수 있는 것으로 나타났다.

2013년에는 유럽생물정보학연구소(EBI) 연구진이 주도하여 처치 및 동료 논문과 거의 동시에 제출된 기사에서 500만 비트가 넘는 데이터의 저장, 검색 및 재생산을 상세히 기술하였다.모든 DNA 파일은 99.99%에서 100% [19]정확도의 정보를 재현했습니다.이 연구의 주요 혁신은 매우 낮은 데이터 손실률을 보장하기 위해 오류 수정 인코딩 체계를 사용하는 것뿐만 아니라 시퀀스 기반 인덱싱 [18]체계를 통해 식별 가능한 일련의 겹치는 짧은 올리고뉴클레오티드에서 데이터를 인코딩하는 아이디어였다.또, 각각의 DNA 가닥의 배열은, 에러를 피하기 위해서 데이터의 각 영역을 4회 반복하도록 겹쳤다.이 네 가닥 중 두 가닥은 [19]오류를 제거하기 위해 거꾸로 구성되었습니다.메가바이트당 비용은 데이터 인코딩에 12,400달러, 검색에는 220달러로 추정되었습니다.그러나 DNA 합성 및 염기서열 분석 비용이 기하급수적으로 감소함에 따라 이 [18]기술이 2023년까지 장기 데이터 저장에 비용 효율이 높아질 것이라고 지적했습니다.

2013년에는 매니쉬 K에 의해 DNACloud라는 소프트웨어가 개발되었습니다.Gupta와 동료들은 컴퓨터 파일을 그들의 DNA 표현에 부호화한다.데이터를 DNA(.dnac 파일)[20][21]로 인코딩(및 디코딩)하기 위해 골드만 등이 제안한 알고리즘의 메모리 효율성 버전을 구현합니다.

DNA로 인코딩된 데이터의 장기적 안정성은 2015년 2월 ETH 취리히 연구진의 기사에서 보고되었다.연구팀은 Reed-Solomon 오류 정정 부호화를 통해 그리고 Sol-gel [22]화학을 통해 실리카 유리구 내에 DNA를 캡슐화함으로써 중복성을 추가했다.

2016년 처치 앤 테크니컬러 리서치이노베이션(Church and Technicolor Research and Innovation)의 연구에 따르면 22MB의 MPEG 압축 영화 시퀀스가 저장되고 DNA에서 복구되었다.시퀀스의 회복에 [23]에러가 제로인 것이 판명되었습니다.

2017년 3월 컬럼비아 대학뉴욕 게놈 센터야니브 에를리히디나 지엘린스키는 DNA 1g당 215페타바이트의 밀도로 데이터를 저장하는 DNA 분수로 알려진 방법을 발표했다.이 기술은 이론적인 한계치의 85%를 달성하면서 DNA 저장의 Shannon 용량에 근접합니다.이 방법은 2메가바이트의 데이터를 합성하는 데 7000달러가 들고,[24][25][26] 읽는데 또 다른 2000달러가 들기 때문에 대규모로 사용할 준비가 되어 있지 않았다.

2018년 3월, Washington 대학과 Microsoft는 약 200MB의 데이터를 저장 및 검색한 결과를 발표했습니다.이 연구는 [27][28]또한 DNA에 저장된 데이터 항목의 랜덤 액세스 방법을 제안하고 평가했습니다.2019년 3월,[29] 같은 팀은 DNA의 데이터를 인코딩하고 해독하는 완전 자동화된 시스템을 시연했다고 발표했다.

유레콤과 임페리얼 칼리지가 2019년 1월에 발표한 연구는 합성 DNA에 구조화된 데이터를 저장할 수 있는 능력을 보여주었다.이 연구는 합성 DNA에서 구조화되거나 더 구체적으로 관계형 데이터를 인코딩하는 방법을 보여주었고, 또한 화학적 [30][31]과정으로 DNA에서 직접 데이터 처리 작업(SQL과 유사)을 수행하는 방법을 보여주었다.

2019년 6월 과학자들은 위키피디아 16GB가 모두 합성 [4]DNA로 암호화되었다고 보고했다.2021년 CATALOG는 18Mbps의 속도로 데이터를 DNA에 [5]쓸 수 있는 맞춤형 DNA 라이터를 개발했다고 발표했다.

효소 절단을 통한 네이티브 DNA 배열에 대한 데이터 저장을 설명하는 첫 번째 기사는 2020년 4월에 발표되었다.이 논문에서 과학자들은 DNA 백본에 정보를 기록하는 새로운 방법을 시연하여 비트 단위의 랜덤 액세스와 메모리 [32]내 컴퓨팅을 가능하게 합니다.

다보스 Bitcoin 챌린지

2015년 1월 21일,[33][34] 2013년 네이처 [19]논문의 원작자 중 한 명인 유럽생물정보연구소(EBI)의 Nick Goldman은 다보스에서 열린 세계경제포럼 연차총회에서 다보스 Bitcoin Challenge를 발표했습니다.그의 발표 동안, 각 튜브에 정확히 하나의 Bitcoin의 비밀 키가 들어 있고, 모두 DNA로 암호화되어 있다는 메시지와 함께 DNA 튜브가 청중들에게 배포되었다.DNA의 염기서열 분석과 해독을 먼저 한 사람이 이 Bitcoin을 획득하고 도전에 이길 수 있다.이 도전은 3년 동안 진행되었으며 [34]2018년 1월 21일 이전에 아무도 상을 받지 못하면 종료된다.

거의 3년 후인 2018년 1월 19일, EBI는 벨기에의 앤트워프 대학브리에이트 브루셀 대학의 박사과정 학생인 샌더 웨이트가 [35][36]이 도전을 완료한 첫 번째 학생이라고 발표했다.Bitcoin(보통 텍스트와 PDF 파일로 저장) 청구 방법에 대한 설명 옆에 EBI 로고, DNA를 인쇄한 회사의 로고(CustomArray), James Joyce[37]스케치가 DNA에서 검색되었습니다.

달 도서관

Arch Mission Foundation에 의해 Beresheet Lander에 발사된 달 도서관에는 20권의 유명 도서와 1만 개의 이미지 등 DNA로 암호화된 정보가 보관되어 있다.DNA는 엄청난 시간을 지속할 수 있기 때문에 이것은 저장의 최적 선택 중 하나였다.Arch Mission Foundation은 이 책이 수십억 [38]년이 지난 후에도 여전히 읽을 수 있다고 제안합니다.

사물의 DNA

사물의 DNA(DoT)의 개념은 야니브 에를리히와 로버트 [39][40][41]그래스를 포함한 이스라엘과 스위스의 연구팀에 의해 2019년에 도입되었다.DoT는 디지털 데이터를 DNA 분자로 인코딩하고, DNA 분자는 물체에 내장됩니다.이것은 생물학적 유기체와 유사하게 그들만의 청사진을 가지고 있는 물체를 만들 수 있는 능력을 준다.사물 인터넷(Internet of Things)과 달리, 상호 연관된 컴퓨팅 장치의 시스템인 DoT는 완전히 격리된 독립 스토리지 개체인 개체를 생성합니다.

DoT의 개념 증명으로, 연구원은 인쇄에 사용되는 플라스틱 필라멘트에 청사진을 담은 스탠포드 토끼를 3D 프린팅했습니다.토끼의 귀를 아주 조금 잘라냄으로써, 그들은 청사진을 읽고, 그것을 증식하고, 다음 세대의 토끼를 생산할 수 있었다.또한 소재에 통합된 YouTube 비디오를 포함하는 구별 불가능한 렌즈를 제작함으로써 스테가노그래피 목적을 위한 DoT의 기능을 보여주었다.

「 」를 참조해 주세요.

레퍼런스

  1. ^ a b c d e Ceze L, Nivala J, Strauss K (August 2019). "Molecular digital data storage using DNA". Nature Reviews. Genetics. 20 (8): 456–466. doi:10.1038/s41576-019-0125-3. PMID 31068682. S2CID 148570002.
  2. ^ Akram F, Haq IU, Ali H, Laghari AT (October 2018). "Trends to store digital data in DNA: an overview". Molecular Biology Reports. 45 (5): 1479–1490. doi:10.1007/s11033-018-4280-y. PMID 30073589. S2CID 51905843.
  3. ^ Panda D, Molla KA, Baig MJ, Swain A, Behera D, Dash M (May 2018). "DNA as a digital information storage device: hope or hype?". 3 Biotech. 8 (5): 239. doi:10.1007/s13205-018-1246-7. PMC 5935598. PMID 29744271.
  4. ^ a b Shankland S (29 June 2019). "Startup packs all 16GB of Wikipedia onto DNA strands to demonstrate new storage tech - Biological molecules will last a lot longer than the latest computer storage technology, Catalog believes". CNET. Retrieved 7 August 2019.
  5. ^ a b Roquet, Nathaniel; Bhatia, Swapnil P.; Flickinger, Sarah A.; Mihm, Sean; Norsworthy, Michael W.; Leake, Devin; Park, Hyunjun (2021-04-20). "DNA-based data storage via combinatorial assembly": 2021.04.20.440194. doi:10.1101/2021.04.20.440194. S2CID 233415483. {{cite journal}}:Cite 저널 요구 사항 journal=(도움말)
  6. ^ Deamer D, Akeson M, Branton D (May 2016). "Three decades of nanopore sequencing". Nature Biotechnology. 34 (5): 518–24. doi:10.1038/nbt.3423. PMC 6733523. PMID 27153285.
  7. ^ Chien-Shun Chiou, Bo-Han Chen, You-Wun Wang, Nang-Ting Kuo, Chih-Hsiang Chang, Yao-Ting Huang (May 20, 2022). "Correcting Modification-Mediated Errors in Nanopore Sequencing by Nucleotide Demodification and in silico Correction". doi:10.1101/2022.05.20.492776. S2CID 248990571. {{cite journal}}:Cite 저널 요구 사항 journal=(도움말)CS1 유지: 여러 이름: 작성자 목록(링크)
  8. ^ Kalhor R, Kalhor K, Leeper K, Graveline A, Mali P, Church GM (2018). "Developmental barcoding of whole mouse via homing CRISPR". Science. 361 (6405). doi:10.1126/science.aat9804. PMC 6139672. PMID 30093604.{{cite journal}}: CS1 maint: 여러 이름: 작성자 목록(링크)
  9. ^ Feynman RP (29 December 1959). "There's Plenty of Room at the Bottom". Annual meeting of the American Physical Society. California Institute of Technology.
  10. ^ Neiman MS (1964). "Some fundamental issues of microminiaturization" (PDF). Radiotekhnika (1): 3–12 (in Russ.).
  11. ^ Neiman MS (1965). "On the relationships between the reliability, performance and degree of microminiaturisation at the molecular-atomic level" (PDF). Radiotekhnika (1): 1–9 (in Russ.).
  12. ^ Neiman MS (1965). "On the molecular memory systems and the directed mutations" (PDF). Radiotekhnika (6): 1–8 (in Russ.).
  13. ^ Wiener N (1964). "Interview: machines smarter than men?". US News & World Report. 56: 84–86.
  14. ^ Rebrova IM, Rebrova OY (2020). "Storage devices based on artificial DNA: the birth of an idea and the first publications". Voprosy istorii estestvoznaniia i tekhniki. 41 (4): 666–76 (in Russ.). doi:10.31857/S020596060013006-8. S2CID 234420446.
  15. ^ a b Extance A (September 2016). "How DNA could store all the world's data". Nature. 537 (7618): 22–4. Bibcode:2016Natur.537...22E. doi:10.1038/537022a. PMID 27582204.
  16. ^ Skinner GM, Visscher K, Mansuripur M (2007-06-01). "Biocompatible Writing of Data into DNA". Journal of Bionanoscience. 1 (1): 17–21. arXiv:1708.08027. doi:10.1166/jbns.2007.005. S2CID 11241232.
  17. ^ Church GM, Gao Y, Kosuri S (September 2012). "Next-generation digital information storage in DNA". Science. 337 (6102): 1628. Bibcode:2012Sci...337.1628C. doi:10.1126/science.1226355. PMID 22903519. S2CID 934617.
  18. ^ a b c Yong E (2013). "Synthetic double-helix faithfully stores Shakespeare's sonnets". Nature. doi:10.1038/nature.2013.12279. S2CID 61562980.
  19. ^ a b c Goldman N, Bertone P, Chen S, Dessimoz C, LeProust EM, Sipos B, Birney E (February 2013). "Towards practical, high-capacity, low-maintenance information storage in synthesized DNA". Nature. 494 (7435): 77–80. Bibcode:2013Natur.494...77G. doi:10.1038/nature11875. PMC 3672958. PMID 23354052.
  20. ^ Shah S, Limbachiya D, Gupta MK (2013-10-25). "DNACloud: A Potential Tool for storing Big Data on DNA". arXiv:1310.6992 [cs.ET].
  21. ^ Limbachiya D, Dhameliya V, Khakhar M, Gupta MK (25 April 2016). "On Optimal Family of Codes for Archival DNA Storage". 2015 Seventh International Workshop on Signal Design and Its Applications in Communications (IWSDA). pp. 123–127. arXiv:1501.07133. doi:10.1109/IWSDA.2015.7458386. ISBN 978-1-4673-8308-0. S2CID 7062541.
  22. ^ Grass RN, Heckel R, Puddu M, Paunescu D, Stark WJ (February 2015). "Robust chemical preservation of digital information on DNA in silica with error-correcting codes". Angewandte Chemie. 54 (8): 2552–5. doi:10.1002/anie.201411378. PMID 25650567.
  23. ^ Blawat M, Gaedke K, Huetter I, Chen XM, Turczyk B, Inverso S, Pruitt BW, Church GM (2016). "Forward Error Correction for DNA Data Storage". Procedia Computer Science. 80: 1011–1022. doi:10.1016/j.procs.2016.05.398.
  24. ^ Yong E. "This Speck of DNA Contains a Movie, a Computer Virus, and an Amazon Gift Card". The Atlantic. Retrieved 3 March 2017.
  25. ^ "DNA could store all of the world's data in one room". Science Magazine. 2 March 2017. Retrieved 3 March 2017.
  26. ^ Erlich Y, Zielinski D (March 2017). "DNA Fountain enables a robust and efficient storage architecture". Science. 355 (6328): 950–954. Bibcode:2017Sci...355..950E. doi:10.1126/science.aaj2038. PMID 28254941. S2CID 13470340.
  27. ^ Organick L, Ang SD, Chen YJ, Lopez R, Yekhanin S, Makarychev K, et al. (March 2018). "Random access in large-scale DNA data storage". Nature Biotechnology. 36 (3): 242–248. doi:10.1038/nbt.4079. PMID 29457795. S2CID 205285821.
  28. ^ Patel P (2018-02-20). "DNA Data Storage Gets Random Access". IEEE Spectrum: Technology, Engineering, and Science News. Retrieved 2018-09-08.
  29. ^ "Microsoft, UW demonstrate first fully automated DNA data storage". Innovation Stories. 2019-03-21. Retrieved 2019-03-21.
  30. ^ Appuswamy R, Le Brigand K, Barbry P, Antonini M, Madderson O, Freemont P, McDonald J, Heinis T (2019). "OligoArchive: Using DNA in the DBMS storage hierarchy" (PDF). Conference on Innovative Data Systems Research (CIDR).
  31. ^ "OligoArchive Website". oligoarchive.github.io. Retrieved 2019-02-06.
  32. ^ Tabatabaei, S. Kasra; Wang, Boya; Athreya, Nagendra Bala Murali; Enghiad, Behnam; Hernandez, Alvaro Gonzalo; Fields, Christopher J.; Leburton, Jean-Pierre; Soloveichik, David; Zhao, Huimin; Milenkovic, Olgica (8 April 2020). "DNA punch cards for storing data on native DNA sequences via enzymatic nicking". Nature Communications. 11 (1): 1742. Bibcode:2020NatCo..11.1742T. doi:10.1038/s41467-020-15588-z. PMC 7142088. PMID 32269230.
  33. ^ World Economic Forum (2015-03-10), Future Computing: DNA Hard Drives Nick Goldman, retrieved 2018-05-19
  34. ^ a b "DNA storage European Bioinformatics Institute". www.ebi.ac.uk. Retrieved 2018-05-19.
  35. ^ "Belgian PhD student decodes DNA and wins a Bitcoin European Bioinformatics Institute". www.ebi.ac.uk. Retrieved 2018-05-19.
  36. ^ "A Piece of DNA Contained the Key to 1 Bitcoin and This Guy Cracked the Code". Motherboard. 2018-01-24. Retrieved 2018-05-19.
  37. ^ "From DNA to bitcoin: How I won the Davos DNA-storage Bitcoin Challenge". Sander Wuyts. 2018-01-16. Retrieved 2018-05-19.
  38. ^ Moskowitz, Clara. "DNA-Coded "Lunar Library" Aims to Preserve Civilization for Millennia". Scientific American. Retrieved 2022-01-09.
  39. ^ Koch, Julian (2019). "A DNA-of-things storage architecture to create materials with embedded memory". Nature Biotechnology. 38 (1): 39–43. doi:10.1038/s41587-019-0356-z. PMID 31819259. S2CID 209164262.
  40. ^ Molteni M (2019-12-09). "These Plastic Bunnies Got a DNA Upgrade. Next up, the World?". Wired. Retrieved 2019-12-09.
  41. ^ Hotz RL (2019-12-09). "Scientists Store Data in Synthetic DNA Embedded in a Plastic Bunny". Wall Street Journal. Retrieved 2019-12-09.

추가 정보