화학 측정학

Chemometrics

화학측정학은 화학 시스템에서 데이터 구동 수단을 통해 정보를 추출하는 과학이다.화학측정학은 본질적으로 화학, 생화학, 의학, 생물학화학 공학 문제를 다루기 위해 다변량 통계학, 응용 수학, 컴퓨터 과학과 같은 핵심 데이터 분석 분야에서 자주 사용되는 방법을 사용하는 학문 간이다.이런 식으로, 그것은 심리학이나 계량경제학 같은 다른 학문 간 분야를 반영한다.

배경

화학측정학은 실험 자연과학, 특히 화학에서 서술적 문제와 예측적 문제를 모두 해결하기 위해 적용된다.기술 적용에서 화학 시스템의 특성은 시스템의 기본 관계와 구조를 학습할 목적으로 모델링된다(즉, 모델의 이해와 식별).예측 어플리케이션에서 화학 시스템의 속성은 새로운 특성 또는 관심 동작을 예측하기 위한 목적으로 모델링됩니다.두 경우 모두 데이터셋은 작을 수 있지만 종종 크고 복잡하며 수백에서 수천 개의 변수와 수백에서 수천 개의 사례 또는 관찰이 수반됩니다.

화학측정기법은 분석화학대사학에서 특히 많이 사용되며, 개선된 화학측정기법의 개발은 분석계측 및 방법론에서 기술수준을 계속 발전시키고 있다.이는 응용 프로그램 중심 분야이며, 따라서 표준 화학 측정 방법론이 산업적으로 매우 널리 사용되는 반면, 학술 그룹은 화학 측정 이론, 방법 및 응용 프로그램 개발에 전념하고 있습니다.

오리진스

화학의 초기 분석 실험조차도 화학 측정학의 한 형태와 관련이 있다고 주장할 수 있지만, 이 분야는 일반적으로 컴퓨터가 과학 연구를 위해 점점 더 많이 이용되면서 1970년대에 등장한 것으로 인식된다.'화학측정학'이라는 용어는 1971년 스반트 월드가 보조금 신청을 [1]통해 만든 용어이며, 그 직후 이 분야의 두 선구자인 스반트 월드와 브루스 코왈스키에 의해 국제화학측정학회가 결성되었다.Wold는 스웨덴 우메오 대학의 유기 화학 교수였고, Kowalski는 시애틀 워싱턴 대학의 분석 화학 교수였다.

많은 초기 적용은 다변량 분류를 포함했고, 수많은 정량적 예측 애플리케이션이 뒤따랐으며, 1970년대 후반과 1980년대 초반에는 다양한 데이터 및 컴퓨터 주도 화학 분석이 이루어졌다.

다변량 분석은 화학측정학의 초기 적용에서도 중요한 측면이었다.적외선 및 UV/가시 분광학 데이터는 표본당 수천 개의 측정값으로 계산되는 경우가 많다.질량분석, 핵자기공명, 원자방출/흡수 및 크로마토그래피 실험도 본질적으로 고다변량이다.이러한 데이터의 구조는 주성분 분석(PCA) 및 부분 최소 제곱(PLS)과 같은 기법을 사용하는 데 도움이 되는 것으로 밝혀졌다.이는 주로 데이터 집합이 고다변량일 수 있지만 종종 선형 하위 구조가 존재하기 때문이다.PCA와 PLS는 화학적으로 더 흥미로운 하위 구조를 경험적으로 모델링하고, 데이터의 상호 관계 또는 '잠재 변수'를 활용하고, 회귀, 클러스터링패턴 인식과 같은 추가 수치 분석을 위한 대체 콤팩트 좌표계를 제공하는 데 시간이 지남에 따라 매우 효과적인 것으로 나타났다.특히 부분 최소 제곱은 다른 분야에서 정기적으로 사용되기 전까지 수년간 화학 측정 애플리케이션에서 많이 사용되었다.

1980년대까지 이 분야에는 화학측정학 저널, 화학측정학지능형 실험실 시스템 저널, 화학정보모델링 저널 등 3개의 전문 저널이 발표되었습니다.이 저널들은 화학측정학의 기초 연구와 방법론 연구 모두를 계속 다루고 있다.현재, 기존 화학 측정 방법의 대부분의 일상적인 적용은 애플리케이션 지향 저널(예: Applied Spectroopy, Analytical Chemistry, Analytica Chimica Acta, Talanta)에 일반적으로 발표된다.화학측정학에 관한 몇몇 중요한 서적/논문도 1980년대에 처음 출판되었는데, 여기에는 말리노스키의 [2]화학 인자 분석 초판 샤라프, 일먼과 코왈스키의 화학측정학,[3] 마사트 등이 포함된다.화학측정학: 교과서 [4]및 마틴과 [5]네스의 다변량 보정.

분자 모델링 및 QSAR, 화학정보학, 유전체학, 단백질학, 메타경제학대사학 등의 '-omics' 분야, 프로세스 모델링 및 프로세스 분석 기술 등 일부 대규모 화학 응용 분야가 새로운 영역을 나타내고 있습니다.

화학측정학의 초기 역사에 대한 설명은 Geladi와 Esbensen에 [6][7]의한 일련의 인터뷰로 출판되었다.

기술

다변량 교정

많은 화학적 문제와 화학측정학의 적용은 교정을 수반한다.목표는 압력, 흐름, 온도, 적외선, 라만, NMR 스펙트럼질량 스펙트럼과 같은 화학 시스템의 측정된 특성에 기반하여 관심 특성을 예측하는 데 사용할 수 있는 모델을 개발하는 것이다.예로는 1) 분석물 농도에 대한 다중 파장 스펙트럼 응답, 2) 생물학적 활동에 대한 분자 설명자, 3) 최종 제품 속성에 대한 다변량 공정 조건/상태와 관련된 다변량 모델의 개발이 포함된다.이 공정에는 예측을 위한 관심 속성에 대한 기준 값과 이러한 속성에 해당하는 것으로 추정되는 측정된 속성이 포함된 보정 또는 교육 데이터 세트가 필요합니다.예를 들어 사례 1)의 경우, 각 샘플(기준)에 대한 관심 분석물의 농도 및 해당 샘플의 해당 적외선 스펙트럼을 포함한 다수의 샘플로부터 데이터를 수집할 수 있다.다변량 반응(스펙트럼)을 관심 분석물의 농도와 관련짓는 수학적 모델을 구성하기 위해 부분 최소 제곱법 또는 주성분 회귀와 같은 다변량 보정 기법을 사용할 수 있으며, 이러한 모델을 사용하여 효율적으로 예측이 가능합니다.e농도의 새로운 샘플.

다변량 보정의 기법은 일반적으로 고전적 [5][8]방법 또는 역방향 방법으로 크게 분류됩니다.이러한 접근법 간의 주요 차이점은 고전적 교정에서는 모델이 측정된 분석 반응(예: 스펙트럼)을 설명하는 데 최적화되고 따라서 최적의 설명자로 간주될 수 있도록 해결되는 반면, 역법에서는 모델이 인트의 특성을 예측하는 데 최적화되도록 해결된다는 것이다.정지(예: 농도, 최적 예측 변수)[9]역법은 일반적으로 화학 시스템에 대한 물리적 지식이 덜 필요하며, 적어도 이론적으로는 평균 제곱 오차 [10][11][12]의미에서 우수한 예측을 제공하므로, 역 접근법은 현대 다변량 교정에서 더 자주 적용되는 경향이 있다.

다변량 보정 기술을 사용하는 주요 장점은 빠르고 저렴하거나 비파괴적인 분석 측정(광학 분광학 등)을 사용하여 샘플 특성을 추정할 수 있다는 것이다. 그렇지 않으면 시간이 많이 걸리고 비용이 많이 들거나 파괴적인 테스트(LC-MS 등)가 필요할 수 있다.다중량 교정도 중요하다.다른 분석물질의 간섭이 심한 경우 정확한 정량적 분석이 가능하다.분석 방법의 선택성은 분석 측정 양식만큼 수학적 보정에 의해 제공됩니다.예를 들어, 다른 분석 기법(적외선 또는 라만 스펙트럼 등)에 비해 극단적으로 광범위하고 선택적이지 않은 근적외선 스펙트럼은 매우 복잡한 매트릭스에서 분석 물질의 농도를 예측하기 위해 신중하게 개발된 다변량 보정 방법과 함께 성공적으로 사용될 수 있다.

분류, 패턴 인식, 클러스터링

감독 다변량 분류 기법은 교정 또는 훈련 세트를 사용하여 미래 표본을 분류할 수 있는 수학적 모델을 개발한다는 점에서 다변량 보정 기법과 밀접한 관련이 있다.화학측정학에서 사용되는 기법은 다변량 판별 분석, 로지스틱 회귀, 신경망, 회귀/분류 나무와 같은 다른 분야에서 사용되는 기법과 유사합니다.이러한 전통적인 분류 방법과 함께 순위 감소 기법을 사용하는 것은 화학 측정학에서 일상적이다. 예를 들어, 주성분이나 부분 최소 제곱 점수에 대한 판별 분석이다.

클래스 모델링 또는 단일 클래스 분류기라고 하는 일련의 기법은 개별 관심 클래스에 대한 모델을 구축할 수 있습니다.[13] 이러한 방법은 제품의 품질 관리 및 진위 확인 시 특히 유용합니다.

비감독 분류(클러스터 분석이라고도 함)는 복잡한 데이터 집합의 패턴을 발견하기 위해 일반적으로 사용되며, 화학측정학에서 사용되는 많은 핵심 기술은 기계 학습 및 통계 학습과 같은 다른 분야에서 공통적이다.

다변량 곡선 분해능

화학적 용어로 다변량 곡선 분해능은 제한적이거나 없는 참조 정보와 시스템 지식을 가진 데이터 세트를 분해하려고 합니다.이 기술에 대한 초기 연구 중 일부는 1970년대 [14][15]초에 로튼과 실베스트레가 했다.이러한 접근방식을 자가 모델링 혼합 분석, 블라인드 소스/신호 분리 및 스펙트럼 혼합 해제라고도 한다.예를 들어, 다변량 곡선 분해법은 여러 개의 형광구를 각각 포함하는 일련의 샘플에서 형광 스펙트럼을 포함하는 데이터 세트로부터 개별 형광구의 형광 스펙트럼과 각 샘플의 상대적인 농도를 추출하기 위해 사용할 수 있으며, 기본적으로 전체 형광 스펙트럼을 혼합하지 않는다.스펙트럼을 개별 구성요소의 기여에 포함시킨다.이 문제는 일반적으로 회전 모호성(많은 가능한 솔루션이 측정된 데이터를 동등하게 나타낼 수 있음)으로 인해 잘못 결정되므로 비음수성, 단변성 또는 개별 구성요소 간의 알려진 상호 관계(예: 운동성 또는 질량 균형 제약)[16][17]와 같은 추가 제약 조건을 적용하는 것이 일반적이다.

기타 기술

실험 설계는 화학 측정학에서 핵심 연구 분야로 남아 있으며, 여러 개의 논문이 화학 [18][19]응용 분야의 실험 설계에 특히 전념하고 있습니다.실험 설계의 건전한 원칙은 화학 측정학계 내에서 널리 채택되어 왔지만, 많은 복잡한 실험은 순수하게 관측된 것이며, 표본과 표본의 특성과 상호 관계에 대한 제어는 거의 없을 것이다.

신호 처리는 또한 거의 모든 화학 측정 애플리케이션에서 매우 중요한 구성요소이며, 특히 교정 또는 분류 전에 데이터를 조건화하는 데 신호 전처리를 사용합니다.화학측정학에서 일반적으로 사용되는 기법은 종종 관련 분야에서 [20]사용되는 기법과 밀접한 관련이 있다.신호 전처리는 최종 데이터 처리의 결과를 해석할 수 있는 방법에 영향을 줄 수 있습니다.[21]

퍼포먼스 특성 평가 및 장점 수치 물리학의 대부분의 영역과 마찬가지로 화학측정학은 정량적으로 지향되기 때문에 퍼포먼스 특성 평가, 모델 선택, 검증 및 검증, 장점 수치 등에 상당한 중점을 두고 있습니다.정량적 모델의 성능은 일반적으로 관심 속성을 예측할 때 루트 평균 제곱 오류와 참-양성 비율/거짓-양성 비율 쌍(또는 전체 ROC 곡선)으로 분류기의 성능에 의해 지정됩니다.Olivieri 등의 최근 보고서는 선택성, 민감도, SNR 및 예측 구간 [22]추정에 대한 다변량 정의를 포함하여 다변량 보정의 장점 및 불확실성 추정에 대한 포괄적인 개요를 제공한다.화학계 모델 선택에는 보통 재샘플링과 같은 도구(부트스트랩, 치환, 교차 검증 포함)의 사용이 포함됩니다.

다변량 통계 공정 관리(MSPC), 모형화 및 최적화는 과거 화학 측정 [23][24][25]개발의 상당한 양을 설명합니다.분광학은 30-40년 동안 제조 공정의 온라인 모니터링을 위해 성공적으로 사용되어 왔으며, 이 공정 데이터는 화학계 모델링에 매우 적합하다.특히 MSPC의 관점에서, 배치 및 연속 공정의 멀티웨이 모델링은 업계에서 점점 더 보편화되고 있으며 화학 측정학 및 화학 공학 분야의 연구 분야로 남아 있습니다.프로세스 분석 화학은 원래 [26]명칭대로 진행되거나 새로운 용어 프로세스 분석 기술이 화학 측정 방법 및 MSPC를 계속 많이 활용하고 있습니다.

다방향 방법은 화학 측정 애플리케이션에서 [27][28]많이 사용됩니다.이것들은 보다 널리 사용되는 메서드의 고차 확장입니다.예를 들어, 데이터 테이블(매트릭스 또는 2차 배열)의 분석은 여러 필드에서 일상적이지만, 멀티웨이 방법은 3차, 4차 또는 그 이상의 차수를 포함하는 데이터 세트에 적용됩니다.이러한 유형의 데이터는 화학에서 매우 일반적입니다. 예를 들어 액체 크로마토그래피/질량 분석(LC-MS) 시스템은 분석된 각 샘플에 대해 대량의 데이터 매트릭스(용출 시간 대 m/z)를 생성합니다.따라서 여러 표본에 걸친 데이터는 데이터 큐브를 구성합니다.배치 공정 모형화에는 시간 대 공정 변수 대 배치 번호가 있는 데이터 집합이 포함됩니다.이러한 문제에 적용되는 다방향 수학 방법에는 PARAFAC, 삼선형 분해, 다방향 PLS 및 PCA 등이 있습니다.

레퍼런스

  1. ^ 에서 설명한 바와 같이Wold, S. (1995). "Chemometrics; what do we mean with it, and what do we want from it?". Chemometrics and Intelligent Laboratory Systems. 30 (1): 109–115. doi:10.1016/0169-7439(95)00042-9.
  2. ^ Malinowski, E. R.; Howery, D. G. (1980). Factor Analysis in Chemistry. New York: Wiley. ISBN 978-0471058816. (다른 판은 1989년, 1991년, 2002년에 이어졌다.)
  3. ^ Sharaf, M. A.; Illman, D. L.; Kowalski, B. R., eds. (1986). Chemometrics. New York: Wiley. ISBN 978-0471831068.
  4. ^ Massart, D. L.; Vandeginste, B. G. M.; Deming, S. M.; Michotte, Y.; Kaufman, L. (1988). Chemometrics: a textbook. Amsterdam: Elsevier. ISBN 978-0444426604.
  5. ^ a b Martens, H.; Naes, T. (1989). Multivariate Calibration. New York: Wiley. ISBN 978-0471909798.
  6. ^ Geladi, P.; Esbensen, K. (2005). "The Start and Early History of Chemometrics: Selected Interviews. Part 1". J. Chemometrics. 4 (5): 337–354. doi:10.1002/cem.1180040503. S2CID 120490459.
  7. ^ Esbensen, K.; Geladi, P. (2005). "The Start and Early History of Chemometrics: Selected Interviews. Part 2". J. Chemometrics. 4 (6): 389–412. doi:10.1002/cem.1180040604. S2CID 221546473.
  8. ^ Franke, J. (2002). "Inverse Least Squares and Classical Least Squares Methods for Quantitative Vibrational Spectroscopy". In Chalmers, John M (ed.). Handbook of Vibrational Spectroscopy. New York: Wiley. doi:10.1002/0470027320.s4603. ISBN 978-0471988472.
  9. ^ Brown, C. D. (2004). "Discordance between Net Analyte Signal Theory and Practical Multivariate Calibration". Analytical Chemistry. 76 (15): 4364–4373. doi:10.1021/ac049953w. PMID 15283574.
  10. ^ Krutchkoff, R. G. (1969). "Classical and inverse regression methods of calibration in extrapolation". Technometrics. 11 (3): 11–15. doi:10.1080/00401706.1969.10490714.
  11. ^ Hunter, W. G. (1984). "Statistics and chemistry, and the linear calibration problem". In Kowalski, B. R. (ed.). Chemometrics: mathematics and statistics in chemistry. Boston: Riedel. ISBN 978-9027718464.
  12. ^ Tellinghuisen, J. (2000). "Inverse vs. classical calibration for small data sets". Fresenius' J. Anal. Chem. 368 (6): 585–588. doi:10.1007/s002160000556. PMID 11228707. S2CID 21166415.
  13. ^ Oliveri, Paolo (2017). "Class-modelling in food analytical chemistry: Development, sampling, optimisation and validation issues – A tutorial". Analytica Chimica Acta. 982: 9–19. doi:10.1016/j.aca.2017.05.013. PMID 28734370.
  14. ^ Lawton, W. H.; Sylvestre, E. A. (1971). "Self Modeling Curve Resolution". Technometrics. 13 (3): 617–633. doi:10.1080/00401706.1971.10488823.
  15. ^ Sylvestre, E. A.; Lawton, W. H.; Maggio, M. S. (1974). "Curve Resolution Using a Postulated Chemical Reaction". Technometrics. 16 (3): 353–368. doi:10.1080/00401706.1974.10489204.
  16. ^ de Juan, A.; Tauler, R. (2003). "Chemometrics Applied to Unravel Multicomponent Processes and Mixtures. Revisiting Latest Trends in Multivariate Resolution". Analytica Chimica Acta. 500 (1–2): 195–210. doi:10.1016/S0003-2670(03)00724-4.
  17. ^ de Juan, A.; Tauler, R. (2006). "Multivariate Curve Resolution (MCR) from 2000: Progress in Concepts and Applications". Critical Reviews in Analytical Chemistry. 36 (3–4): 163–176. doi:10.1080/10408340600970005. S2CID 95309963.
  18. ^ Deming, S. N.; Morgan, S. L. (1987). Experimental design: a chemometric approach. Elsevier. ISBN 978-0444427342.
  19. ^ Bruns, R. E.; Scarminio, I. S.; de Barros Neto, B. (2006). Statistical design – chemometrics. Amsterdam: Elsevier. ISBN 978-0444521811.
  20. ^ Wentzell, P. D.; Brown, C. D. (2000). "Signal Processing in Analytical Chemistry". In Meyers, R. A. (ed.). Encyclopedia of Analytical Chemistry. Wiley. pp. 9764–9800.
  21. ^ Oliveri, Paolo; Malegori, Cristina; Simonetti, Remo; Casale, Monica (2019). "The impact of signal pre-processing on the final interpretation of analytical outcomes – A tutorial". Analytica Chimica Acta. 1058: 9–17. doi:10.1016/j.aca.2018.10.055. PMID 30851858.
  22. ^ Olivieri, A. C.; Faber, N. M.; Ferre, J.; Boque, R.; Kalivas, J. H.; Mark, H. (2006). "Guidelines for calibration in analytical chemistry Part 3. Uncertainty estimation and figures of merit for multivariate calibration". Pure and Applied Chemistry. 78 (3): 633–650. doi:10.1351/pac200678030633. S2CID 50546210.
  23. ^ Illman, D. L.; Callis, J. B.; Kowalski, B. R. (1986). "Process Analytical Chemistry: a new paradigm for analytical chemists". American Laboratory. 18: 8–10.
  24. ^ MacGregor, J. F.; Kourti, T. (1995). "Statistical control of multivariate processes". Control Engineering Practice. 3 (3): 403–414. doi:10.1016/0967-0661(95)00014-L.
  25. ^ Martin, E. B.; Morris, A. J. (1996). "An overview of multivariate statistical process control in continuous and batch process performance monitoring". Transactions of the Institute of Measurement & Control. 18 (1): 51–60. doi:10.1177/014233129601800107. S2CID 120516715.
  26. ^ Hirschfeld, T.; Callis, J. B.; Kowalski, B. R. (1984). "Chemical sensing in process analysis". Science. 226 (4672): 312–318. Bibcode:1984Sci...226..312H. doi:10.1126/science.226.4672.312. PMID 17749872. S2CID 38093353.
  27. ^ Smilde, A. K.; Bro, R.; Geladi, P. (2004). Multi-way analysis with applications in the chemical sciences. Wiley.
  28. ^ Bro, R.; Workman, J. J.; Mobley, P. R.; Kowalski, B. R. (1997). "Overview of chemometrics applied to spectroscopy: 1985–95, Part 3—Multiway analysis". Applied Spectroscopy Reviews. 32 (3): 237–261. Bibcode:1997ApSRv..32..237B. doi:10.1080/05704929708003315.

추가 정보

  • Beebe, K. R.; Pell, R. J.; Seasholtz, M. B. (1998). Chemometrics: A Practical Guide. Wiley.
  • Brereton, R. G. (2007). Applied Chemometrics for Scientists. Wiley.
  • Brown, S. D.; Tauler, R.; Walczak, B., eds. (2009). Comprehensive Chemometrics: Chemical and Biochemical Data Analysis. 4 volume set. Elsevier.
  • Gemperline, P. J., ed. (2006). Practical Guide to Chemometrics (2nd ed.). CRC Press.
  • Kramer, R. (1998). Chemometric Techniques for Quantitative Analysis. CRC Press.
  • Maeder, M.; Neuhold, Y.-M. (2007). Practical Data Analysis in Chemistry. Elsevier.
  • Mark, H.; Workman, J. (2007). Chemometrics in Spectroscopy. Academic Press-Elsevier.
  • Martens, H.; Naes, T. (1989). Multivariate Calibration. Wiley.
  • Massart, D. L.; Vandeginste, B. G. M.; Deming, S. M.; Michotte, Y.; Kaufman, L. (1988). Chemometrics: A Textbook. Elsevier.
  • Otto, M. (2007). Chemometrics: Statistics and Computer Application in Analytical Chemistry (2nd ed.). Wiley-VCH.
  • Vandeginste, B. G. M.; Massart, D. L.; Buydens, L. M. C.; De Jong, S.; Lewi, P. J.; Smeyers-Verbeke, J. (1998). Hand book of Chemometrics and Qualimetrics: Part A & Part B. Elsevier.

외부 링크