곡선 피팅

Curve fitting
반복 프로세스를 사용한 비대칭 피크 모델에 의한 잡음 곡선 적합(가우스-뉴턴 알고리즘 및 가변 감쇠 계수α).
상단: 원시 데이터 및 모델.
맨 아래: 오차 제곱의 정규화 합계의 진화.

곡선[1][2] 적합은 일련의 데이터 [3]점에 가장 적합한 곡선 또는 수학 함수를 구성하는 과정으로,[4][5] 제약 조건이 적용될 수 있습니다.곡선 적합에는 데이터에 대한 정확한 적합이 필요한 [6][7]보간 또는 데이터에 근사적으로 적합한 "평활" 함수가 구성된 [8][9]평활이 포함될 수 있습니다.관련 주제는 회귀 [10][11]분석으로, 랜덤 오차로 관측된 데이터에 적합한 곡선에 얼마나 많은 불확실성이 존재하는지와 같은 통계적 추론의 질문에 더 초점을 맞춘다.적합 곡선은 데이터를 시각화하고,[12][13] 데이터를 사용할 [14]수 없는 함수의 값을 추론하고, 두 개 이상의 [15]변수 간의 관계를 요약하는 데 사용할 수 있습니다.외삽은 관측 [16]데이터의 범위를 벗어난 적합 곡선의 사용을 의미하며, 관측 데이터를 반영하는 만큼 곡선을 구성하는 데 사용되는 방법을 반영할 수 있기 때문에 불확실성[17] 정도에 노출된다.

데이터 점에 함수 적합

일반적으로 y=f(x) 형식의 함수를 적합시킵니다.

데이터 점에 선 및 다항식 함수 적합

Polynomial curves fitting a sine function
사인 함수를 사용하여 생성된 다항식 곡선 적합점.검은색 점선은 "참" 데이터, 빨간색 선은 1차 다항식, 녹색 선은 2차 다항식, 주황색 선은 3차 다항식, 파란색 선은 4도입니다.

1차 다항식

기울기a인 선입니다.선은 임의의 두 점을 연결하므로 1차 다항식 방정식은 구별되는 x 좌표를 가진 임의의 두 점을 통과하는 정확한 적합치입니다.

방정식의 차수가 2차 다항식으로 증가하면 다음과 같은 결과가 됩니다.

이것은 간단한 곡선을 정확히 세 점에 맞출 것이다.

방정식의 차수를 3차 다항식으로 증가시키면 다음과 같이 된다.

이것은 정확히 4점에 맞을 것이다.

보다 일반적인 설명은 이것이 정확히 네 가지 제약조건에 부합할 것이라고 말하는 것입니다.각 제약조건은 점, 각도 또는 곡면( 반경의 역수)이 될 수 있습니다.각도 및 곡률 구속조건은 곡선의 끝에 추가되는 경우가 가장 많으며, 이러한 경우 끝 조건이라고 합니다.단일 스플라인 내에 포함된 다항식 곡선 간의 원활한 전환을 보장하기 위해 동일한 끝 조건이 자주 사용됩니다."곡률의 변화"와 같은 고차 제약 조건도 추가할 수 있습니다.예를 들어, 이것은 클로버 리프 설계에 있어서 클로버 리프(cloverleaf)를 따라갈 때 자동차에 가해지는 힘의 변화율을 이해하고 그에 따라 합리적인 속도 제한을 설정하는 데 유용합니다.

1차 다항식 방정식은 단일 점과 각도에 대한 정확한 적합이 될 수 있고, 3차 다항식 방정식은 각도 제약과 곡률 제약의 두 점에 대한 정확한 적합이 될 수도 있습니다.이들 및 고차 다항식 방정식에 대해서는 많은 다른 제약 조건 조합이 가능합니다.

n + 1 이상의 제약조건(n은 다항식의 정도)이 있는 경우에도 다항식 곡선은 여전히 이러한 제약조건을 통과할 수 있습니다.모든 제약 조건에 대한 정확한 적합은 확실하지 않지만, 예를 들어 1차 다항식이 세 의 공선 을 정확히 적합시키는 경우 발생할 수 있습니다.그러나 일반적으로 각 근사치를 평가하기 위해서는 몇 가지 방법이 필요하다.최소 제곱법은 편차를 비교하는 한 가지 방법입니다.

단순히 다항식의 정도를 증가시켜 정확한 일치를 얻을 수 있을 때 대략적인 적합치를 얻어야 하는 몇 가지 이유가 있습니다.

  • 정확한 일치가 존재한다고 해서 반드시 쉽게 발견할 수 있는 것은 아닙니다.사용되는 알고리즘에 따라서는, 정확한 적합도를 계산할 수 없거나, 해답을 찾는데 컴퓨터 시간이 너무 오래 걸리는 경우가 있습니다.이 경우 대략적인 해결책이 필요할 수 있습니다.
  • 표본에서 의심스러운 데이터 점을 정확하게 적합시키기 위해 곡선을 왜곡하는 대신 평균화하는 효과가 바람직할 수 있습니다.
  • 룽지의 현상: 고차 다항식은 매우 진동적일 수 있습니다.곡선이 두 A와 B를 통과하면 곡선이 AB의 중간점 근처에서도 약간 흐를 것으로 예상된다.이러한 현상은 고차 다항식 곡선에서는 발생하지 않을 수 있으며, 양수 또는 음수 크기의 값이 매우 클 수도 있습니다.저차 다항식을 사용하면 곡선이 중간점 근처에 떨어질 가능성이 높아집니다(1차 다항식에서는 중간점을 정확히 통과하도록 보장됨).
  • 저차 다항식은 평활하고 고차 다항식 곡선은 "흐릿한" 경향이 있습니다.이를 보다 정확하게 정의하기 위해 다항식 곡선에서 가능한 최대 변곡점 수는 n-2입니다. 여기서 n은 다항식 순서입니다.변곡점은 곡선의 양반경에서 음반경으로 전환되는 위치입니다.우리는 또한 이것이 "물받이"에서 "물받이"로 바뀌는 곳이라고 말할 수 있다.고차 다항식이 뭉클해지는 것은 "가능"할 뿐이며, 평활할 수도 있지만, 저차 다항식 곡선과 달리 이에 대한 보장은 없습니다.15도 다항식은 최대 13개의 변곡점을 가질 수 있지만 11개 또는 9개 또는 1개 이하의 임의의 홀수를 가질 수도 있다(짝수 차수의 폴리노멀은 n - 2에서 0까지의 변곡점을 짝수로 가질 수 있다.)

다항식 곡선이 정확한 적합에 필요한 것보다 높은 정도는 앞에서 설명한 상위 다항식에 대한 모든 이유로 바람직하지 않지만, 무한한 수의 솔루션이 존재하는 경우로 이어집니다.예를 들어, 1차 다항식(직선)은 일반적인 두 개 대신 하나의 점으로 제한되므로 무한한 수의 해를 얻을 수 있습니다.이 때문에, 어떻게 하나의 솔루션을 비교하고 선택할 것인가 하는 문제가 생깁니다.이것은 소프트웨어와 인간에게도 문제가 될 수 있습니다.따라서 일반적으로 모든 제약조건에 대해 정확한 일치를 위해 가능한 한 낮은 차수를 선택하는 것이 가장 좋습니다. 또한 대략적인 적합치가 허용되는 경우에는 더 낮은 차수를 선택하는 것이 좋습니다.

밀 수율과 토양 염도의[18] 관계

데이터 점에 다른 함수 적합

경우에 따라 삼각 함수(사인 및 코사인 등)와 같은 다른 유형의 곡선을 사용할 수도 있습니다.

분광학에서 데이터는 가우스, 로렌츠, Voigt 및 관련 함수로 적합할 수 있다.

생물학, 생태학, 인구통계학, 역학 및 기타 많은 분야에서, 인구증가, 전염병의 확산 등은 로지스틱 함수를 사용하여 적합할 수 있다.

농업에서 역 로지스틱 S그모이드 함수(S-곡선)는 농작물 수확량과 성장 인자 간의 관계를 설명하는 데 사용됩니다.파란색 수치는 농지에서 측정된 데이터의 S자형 회귀에 의해 만들어졌다.처음에는 낮은 토양 염도에서는 토양 염도가 높아지면 작물 수확량이 서서히 감소하는 반면 이후에는 감소 속도가 빨라지는 것을 알 수 있다.

곡선에 대한 대수적 적합 대 기하학적 적합

데이터의 대수적 분석에서 "적합"은 일반적으로 곡선에서 점의 수직(y축) 변위를 최소화하는 곡선을 찾는 것을 의미한다(예: 일반 최소 제곱).그러나 그래픽 및 이미지 애플리케이션의 경우 기하학적 피팅은 최상의 시각적 적합성을 제공하고자 합니다. 즉, 일반적으로 곡선에 대한 직교 거리(: 총 최소 제곱)를 최소화하거나 곡선에서 점 변위의 두 축을 모두 포함하는 것을 의미합니다.기하학적 적합은 일반적으로 비선형 및/또는 반복 계산을 요구하기 때문에 인기가 없지만, 보다 심미적이고 기하학적으로 정확한 [19][20][21]결과를 얻을 수 있다는 장점이 있습니다.

데이터 점에 평면 원곡선 적합

y () { y 함수를 가정할 수 없는 경우에도 평면 곡선을 맞출 수 있습니다.

원뿔 단면(원호, 타원호, 포물선호 및 쌍곡선 호)이나 삼각 함수(사인 및 코사인 등)와 같은 다른 유형의 곡선을 사용할 수도 있습니다.예를 들어, 중력의 영향을 받는 물체의 궤적은 공기 저항이 무시될 때 포물선 경로를 따릅니다.따라서 궤적 데이터 지점을 포물선 곡선에 일치시키는 것이 타당할 것이다.조수는 정현파 패턴을 따르므로, 달과 태양의 효과를 모두 고려할 경우 조석 데이터 점을 사인파 또는 서로 다른 주기의 두 사인파의 합계와 일치시켜야 한다.

모수 곡선의 경우 각 좌표를 호 길이의 개별 함수로 적합시키는 것이 효과적입니다. 데이터 점을 정렬할 수 있다고 가정하면 현 거리를 사용할 [22]수 있습니다.

기하학적 적합에 의한 원 맞춤

Coope 방법을 사용한 원 피팅, 원호, 중심(1 ; 1) 및 반지름 4를 나타내는 점.
다른 타원 피팅 모델
대수적 거리를 최소화하는 타원 피팅(Fitzgibbon 방식).

Coope는[23] 일련의 2D 데이터 점에 대한 원의 최상의 시각적 적합도를 찾는 문제에 접근합니다.이 방법은 통상적인 비선형 문제를 반복적인 수치 방법을 사용하지 않고 해결할 수 있는 선형 문제로 우아하게 변환하므로 이전 기술보다 훨씬 빠르다.

기하학적 맞춤으로 타원 맞춤

위의 기법은 비선형 단계를 추가함으로써 일반적인[24] 타원까지 확장되어 빠르고 임의의 방향과 변위의 시각적으로 보기 좋은 타원형을 찾는 방법이 된다.

피팅 서페이스

이 논의는 2D 곡선의 관점에서 이루어졌지만, 이 논리의 대부분은 3D 표면으로도 확장됩니다. 각 표면은 일반적으로 u 및 v라고 불리는 두 가지 파라메트릭 방향의 곡선 그물로 정의됩니다. 표면은 각 방향으로 하나 이상의 표면 패치로 구성될 수 있습니다.

소프트웨어

R과 같은 통계 패키지수치 소프트웨어(gnuplot, GNU Scientific Library, MLAB, Maple, MATLAB, TK Solver 6.0, Scilab, Mathematica, GNU 옥타브, SciPy 등)에는 다양한 시나리오에서 곡선 피팅을 수행하기 위한 명령어가 포함되어 있습니다.곡선 피팅을 수행하기 위해 특별히 작성된 프로그램도 있습니다. 이러한 프로그램은 통계 및 수치 분석 프로그램 목록 범주에서 찾을 수 있습니다.회귀곡선 피팅 소프트웨어.

「 」를 참조해 주세요.

레퍼런스

  1. ^ Sandra Lach Arlinghouse, PHB 커브 피팅 실무 핸드북CRC 프레스, 1994.
  2. ^ 윌리엄 M. 콜브프로그래밍 가능한 계산기를 위한 곡선 피팅.Syntec, Incorporated, 1984.
  3. ^ S.S. 할리, K.V. 라오 1992년고급 인구 분석 기법. ISBN0306439972 165페이지(cf. ... 기능은 관찰된 데이터에 적합한 경우 충족됩니다.)
  4. ^ 신호와 노이즈: 왜 이렇게 많은 예측이 실패하는가? 하지만 일부는 그렇지 않다.By Nate Silver
  5. ^ 데이터 마이닝을 위한 데이터 준비:문자, 도리안 파일이 썼어
  6. ^ MATLAB®를 사용한 엔지니어링의 수치적 방법.얀 키살라스의 작품.페이지 24.
  7. ^ Python 3을 사용한 엔지니어링의 수치 메서드.얀 키살라스의 작품.페이지 21.
  8. ^ 곡선 피팅의 수치적 방법.P. G. 게스트, 필립 조지 게스트349페이지.
  9. ^ 다음 항목도 참조하십시오.연체자
  10. ^ 선형비선형 회귀 분석을 사용하여 생물학적 데이터에 모형 적합Harvey Motulsky 지음 Arthur Christopulos.
  11. ^ Rudolf J. Freund, William J. Wilson, Ping Sa의 회귀 분석.269쪽.
  12. ^ 비주얼 정보학편집자: 할리마 바디오제 자만, 피터 로빈슨, 마리아 페트로, 패트릭 올리비에, 하이코 슈뢰더.689쪽.
  13. ^ 비선형 엔지니어링 모델을 위한 수치적 방법.존 R.하우저227쪽.
  14. ^ 실험 물리학 방법:분광학, 제13권, 제1부클레어 마틴의 작품.150페이지.
  15. ^ 연구설계 백과사전 제1권.Neil J. Salkind 편집자266쪽.
  16. ^ 커뮤니티 분석계획 기술.리처드 E. 클로스터맨의 작품.1 페이지.
  17. ^ 환경투자의 평가에 있어서의 리스크와 불확실성의 개요.다이앤 출판사69페이지
  18. ^ S자형 회귀 계산기
  19. ^ Ahn, Sung-Joon (December 2008), "Geometric Fitting of Parametric Curves and Surfaces" (PDF), Journal of Information Processing Systems, 4 (4): 153–158, doi:10.3745/JIPS.2008.4.4.153, archived from the original (PDF) on 2014-03-13
  20. ^ Chernov, N.; Ma, H. (2011), "Least squares fitting of quadratic curves and surfaces", in Yoshida, Sota R. (ed.), Computer Vision, Nova Science Publishers, pp. 285–302, ISBN 9781612093994
  21. ^ Liu, Yang; Wang, Wenping (2008), "A Revisit to Least Squares Orthogonal Distance Fitting of Parametric Curves and Surfaces", in Chen, F.; Juttler, B. (eds.), Advances in Geometric Modeling and Processing, Lecture Notes in Computer Science, vol. 4975, pp. 384–397, CiteSeerX 10.1.1.306.6085, doi:10.1007/978-3-540-79246-8_29, ISBN 978-3-540-79245-1
  22. ^ Ahlberg & Nilson의 페이지 51(1967) 스플라인 이론과 그 응용, Academic Press, 1967년 [1]
  23. ^ Coope, I.D. (1993). "Circle fitting by linear and nonlinear least squares". Journal of Optimization Theory and Applications. 76 (2): 381–388. doi:10.1007/BF00939613. hdl:10092/11104.
  24. ^ Paul Sheer, 수동 스테레오 측광학 소프트웨어 어시스턴트, M.Sc. 논문, 1997

추가 정보

  • N. Chernov(2010), 원형선형 회귀: 최소 제곱에 의한 원과 선 적합, Chapman & Hall/CRC, 통계 및 적용 확률에 관한 모노그래프, 제117권(256페이지).[2]