선형신앙함수
Linear belief function선형신앙함수는 뎀스터-샤퍼의 신념함수 이론을 관심 변수가 연속적인 경우로 확장한 것이다.그러한 변수의 예로는 금융자산 가격, 포트폴리오 성과 및 기타 선행변수와 결과변수가 있다.이 이론은 원래 아서 P에 의해 제안되었다. Kalman Filters와 그 이후의 맥락에서 뎀스터는[1] 리핑 류에 의해 인공지능에서의 지식 표현과 금융 및 회계에서의 의사 결정에 정교하고 정제되고 적용되었다.[2]
개념
선형신앙함수는 참값의 위치에 관한 우리의 믿음을 다음과 같이 나타내려고 한다.우리는 진리가 소위 확실성 하이퍼플레인에 있다는 것을 확신하지만 정확한 위치를 알지 못한다. 확실성 하이퍼플레인의 어느 정도 차원을 따라, 우리는 참 값이 -192 ~ +192의 어느 곳에 있을 수 있고 특정 위치에 있을 확률은 정상적인 분포에 의해 설명될 수 있다고 믿는다. 다른 차원을 따라, 우리의 지식 i.s 공백, 즉, 참 값은 -192 ~ +192 사이의 어딘가에 있지만 관련 확률은 알 수 없다.일반적으로 믿음 기능은 비빈 교차점을 가질 수 있는 초점 요소의 클래스에 걸친 질량 함수에 의해 정의된다.선형신뢰함수는 그것의 초점 요소가 확실한 하이퍼플레인 위에 배타적이고 평행한 하위 하이퍼플레인이며 그것의 질량 함수는 하위 하이퍼플레인에 걸친 정규 분포라는 점에서 특별한 형태의 믿음함수다.
위의[3] 기하학적 설명에 기초하여 샤퍼와[4] 류는 LBF의 두 가지 수학적 표현을 제안한다: 넓은 감각의 내부 제품과 가변 공간의 선형 기능 그리고 샘플 공간의 하이퍼플레인 위에 이중으로 한다.몬니는 여전히 가우스 힌트라고 불리는 또 다른 구조를 제안한다.이러한 표현은 수학적으로 깔끔하지만, 전문가 시스템의 지식 표현에는 적합하지 않은 경향이 있다.
지식 표현
선형신뢰함수는 세 가지 유형의 변수에 대한 논리적 지식과 확률론적 지식 모두를 나타낼 수 있다. 즉, 관측 가능하거나 관리 가능한 결정론적, 분포가 정상인 무작위 및 지식이 없는 빈 공간이다.논리적 지식은 선형 방정식 또는 기하학적으로 확실성 하이퍼플레인(hyperplane)으로 표현된다.확률적 지식은 모든 병렬 초점 요소에 걸친 정규 분포로 표현된다.
일반적으로 X가 평균 μ와 공분산 σ을 갖는 다중 정규 변수의 벡터라고 가정한다.그런 다음 다변량 정규 분포를 모멘트 행렬로 동등하게 나타낼 수 있다.
분포가 비감소(Non-degenerate), 즉 Ⅱ가 전체 순위를 가지며 그 역행위가 존재하는 경우, 모멘트 행렬은 다음과 같이 완전히 쓸 수 있다.
정규화 상수를 제외하고 위의 방정식은 X에 대한 정규 밀도 함수를 완전히 결정한다.따라서 M→) 은 잠재적 형태에서 X의 확률 분포를 나타낸다.
이 두 가지 간단한 행렬은 우리가 선형신앙함수의 세 가지 특별한 경우를 대표할 수 있게 해준다.첫째, 일반적인 정규 확률 분포의 경우 M(X)은 이를 나타낸다.둘째, X에 대해 직접 관찰하여 μ 값을 얻었다고 가정하자.이 경우 불확실성이 없으므로 분산과 공분산 모두 소멸한다. 즉 σ = 0이다.따라서 직접적인 관찰은 다음과 같이 나타낼 수 있다.
셋째, X에 대해 완전히 무지하다고 가정하자.이것은 밀도함수가 존재하지 않기 때문에 베이지안 통계에서 매우 곤란한 경우다.완전히 스윕된 모멘트 매트릭스를 사용함으로써, 우리는 스윕된 형태의 0 행렬로서 공허한 선형 믿음 함수를 나타낸다.
표현을 이해하는 한 가지 방법은 X의 분산이 ∞에 접근하여 σ−1 = 0이고 따라서 →이(가) 사라진다는 것을 보여줄 수 있는 제한 사례로서 완전한 무지를 상상하는 것이다.그러나 위의 방정식은 분산이 무한한 부적절한 이전 또는 정규 분포와 같지 않다.사실, 그것은 어떤 독특한 확률 분포와도 일치하지 않는다.이러한 이유로, 더 나은 방법은 결합을 위한 중립적 요소로서 공허한 선형신앙 기능을 이해하는 것이다(나중에 참조).
나머지 3건의 특례를 대표하려면 부분적 싹쓸이 개념이 필요하다.전체 스위핑과 달리 부분 스위핑은 변수의 하위 집합에 대한 변환이다.X와 Y가 합동 모멘트 행렬을 갖는 정규 변수의 두 벡터라고 가정합시다.
그런 다음 M(X, Y)을 부분적으로 쓸 수 있다.예를 들어 X에 대한 부분 스위프를 다음과 같이 정의할 수 있다.
X가 1차원인 경우 부분 스위핑은 X의 분산을 음의 역수로 대체하고 그 역수를 다른 원소들과 곱한다.X가 다차원인 경우, X의 공분산 행렬과 다른 곱의 역행렬을 연산한다.변수의 부분 스위프에서 얻은 스윕 행렬은 부분 집합의 각 개별 변수에 대한 부분 스위프 시퀀스를 통해 동등하게 얻을 수 있으며 시퀀스의 순서는 중요하지 않다.마찬가지로 완전 스위프 행렬은 모든 변수에 대한 부분 스위프의 결과물이다.
우리는 두 가지 관찰을 할 수 있다.First, after the partial sweeping on X, the mean vector and covariance matrix of X are respectively and , which are the same as that of a full sweeping of the marginal moment matrix of X.따라서 위의 부분 쓸기 방정식에서 X에 해당하는 원소는 전위 형태의 X의 한계 분포를 나타낸다.Second, according to statistics, is the conditional mean of Y given X = 0; is the conditional covX = 0; 그리고 ( )- 의 Ariance 행렬은 X에 대한 Y 회귀 모형의 기울기다.따라서 지수에 해당하는 원소와M → , Y){\의 X와 Y의 교차점에 해당하는 원소는 주어진 X = 0의 Y의 조건부 분포를 나타낸다.
이러한 의미론들은 부분적인 쓸개연산을 다변량 정규분포를 조작하는 유용한 방법으로 만든다.또한 이들은 적절한 믿음 함수, 선형 방정식 및 선형 회귀 모형을 포함하여 나머지 세 가지 선형 믿음 함수의 중요한 사례에 대한 모멘트 행렬 표현의 기초를 형성한다.
적절한 선형신뢰함수
변수 X와 Y의 경우 변수 X에 대한 의견이 없는 상태에서 변수 Y에 대한 정규 분포를 정당화하는 증거가 있다고 가정하십시오.또한 X와 Y가 완전히 선형적으로 연관되어 있지 않다고 가정하십시오. 즉, X와 Y의 상관관계가 1보다 작다고 가정하십시오.이 경우는 Y에 대한 일반적인 정규 분포와 X에 대한 공허한 믿음 함수의 혼합을 포함한다.따라서 다음과 같이 부분적으로 스윕된 행렬을 사용하여 이를 나타낸다.
이것이 우리가 대표성을 이해할 수 있는 방법이다.Since we are ignorant on X, we use its swept form and set and . Since the correlation between X and Y is less than 1, the regression coefficient of X on Y approaches to 0 when the varianceX가 ∞에 접근한다.Therefore, . Similarly, one can prove that and .
선형 방정식
X와 Y가 두 행 벡터이고 Y = XA + b이며 여기서 A와 b는 계수 행렬이라고 가정한다.부분적으로 스윕된 행렬을 사용하여 방정식을 다음과 같이 나타낸다.
우리는 선형 방정식이 (1) 모든 변수에 대한 완전한 무지와 (2) 독립 변수가 주어지는 종속 변수의 퇴보 조건부 분포라는 두 가지 지식을 포함하고 있다는 사실에 근거하여 표현을 이해할 수 있다.X는 방정식의 독립 벡터이기 때문에 우리는 그것에 대해 완전히 무지하다.따라서 ( )- = - ( )- = 0 -(\ X = 0을 주어진 Y는 완전히 b로 결정된다.따라서 Y의 조건부 평균은 b이고 조건부 분산은 0이다.또한 회귀 계수 행렬은 A이다.
선형 방정식으로 표현해야 할 지식은 적절한 선형 믿음 함수에서 그것과 매우 가깝다는 점에 유의하십시오. 단, 전자는 X와 Y 사이의 완벽한 상관 관계를 가정하지만 후자는 그렇지 않다.이 관찰은 흥미롭다; 그것은 부분적 무지와 선형 방정식의 차이를 하나의 매개 변수인 상관관계로 특징짓는다.
선형 회귀 모형
선형 회귀 모델은 이전 사례보다 더 일반적이고 흥미로운 사례다.X와 Y가 두 벡터, Y = XA + b + E라고 가정해 보십시오. 여기서 A와 b는 적절한 계수 행렬이고 E는 E ~ N(0, σ)을 만족하는 독립적인 백색 소음이다.모델을 부분적으로 스윕된 다음과 같은 행렬로 표현한다.
이 선형 회귀 모델은 지식의 두 조각의 조합으로 간주될 수 있다(나중에 참조), 하나는 세 변수 X, Y, E를 포함하는 선형 방정식으로 지정되며, 다른 하나는 E의 단순한 정규 분포, 즉 E ~ N(0, ,)이다.또는 X = 0이 주어진 경우 Y가 b로 완전히 결정되지 않는다는 점을 제외하고는 선형 방정식과 유사한 것으로 간주할 수 있다.대신 Y의 조건부 평균은 b이고 조건부 분산은 is이다.이 대안 해석에서 선형 회귀 모형은 지식 표현을 위한 기본 구성 요소를 형성하며 1모멘트 매트릭스로 인코딩된다.게다가 소음 용어 E는 표현에 나타나지 않는다.따라서, 그것은 대표성을 더욱 효율적으로 만든다.
6개의 특별한 경우를 대표함으로써 우리는 모멘트 행렬 표현의 분명한 이점을 볼 수 있다. 즉, 선형 방정식, 관절과 조건부 분포, 무지를 포함한 외관상 다양한 유형의 지식을 통일적으로 표현할 수 있다.이번 통일은 인공지능의 지식표현뿐만 아니라 통계분석과 공학연산에서도 의미가 크다.예를 들어, 표현은 관측치, 분포, 부적절한 사전(베이지안 통계량의 경우) 및 선형 방정식 모델 등 통계에서 전형적인 논리적 및 확률론적 요소들을 별도의 개념으로 취급하지 않고 단일 개념의 표현으로 취급한다.그것은 이러한 개념이나 발현 사이의 내적 연결성을 볼 수 있게 하고 계산 목적으로 그것들을 상호 작용할 수 있게 해준다.
지식 작업
선형신앙함수를 이용한 전문가 시스템에서 추론을 하기 위한 두 가지 기본 운영이 있는데, 결합과 한계화가 그것이다.조합은 지식의 통합에 해당하는 반면, 한계화는 지식의 강화에 해당한다.추론을 하는 것은 관련 지식을 전체 지식으로 결합한 다음 추론 질문에 답해야 하는 부분적인 영역에 전체 지식의 전체를 투영하는 것을 포함한다.
한계화
한계화는 선형적인 믿음 함수를 더 적은 변수를 가진 것으로 계획한다.모멘트 매트릭스로 표현하면, 그것은 단순히 나머지 변수에 해당하는 서브매트릭스로의 비위프 모멘트 매트릭스를 제한하는 것이다.예를 들어, 공동 분포 M(X, Y)의 경우 Y에 대한 한계값은 다음과 같다.
변수를 제거할 때 해당 모멘트 매트릭스에서 변수를 스위프하지 않은 것이 중요하다. 즉 변수 위에 화살표 기호가 없다.예를 들어 매트릭스 →, Y) {\ MY)}을 Y에 투영하면 다음이 생성된다.
이것은 Y의 같은 선형신앙함수가 아니다.그러나 부분적으로 스윕된 행렬에서 Y의 일부 또는 모든 변수를 제거하면 나머지 변수에 대해 동일한 함수를 나타내는 행렬인 정확한 결과가 여전히 생성된다는 것을 쉽게 알 수 있다.
이미 휩쓸고 간 변수를 제거하려면 부분 또는 전체 역회전 스위프를 사용하여 스위프를 역전시켜야 한다.M→) 이 (가) 완전히 스윕 모멘트 매트릭스라고 가정하고,
그런 M→ ) M을 완전히 역 스위프하면 다음과 같이 모멘트 매트릭스 M(X)이 복구된다.
모멘트 행렬이 부분적으로 스윕된 형태인 경우, 다음과 같이 말한다.
X에 대한 그것의 부분적인 역 스위핑은 다음과 같이 정의된다.
역 스위핑은 일부 승수에 대한 신호 차이를 제외하고 전방 스위핑과 유사하다.그러나 전방과 후방 스위핑은 서로 반대되는 작업이다.(X→) M에 완전 역방향 스위프를 적용하면 초기 모멘트 매트릭스 M(X)이 복구된다는 것을 쉽게 알 수 있다.X에 부분 역 스위프를 매트릭스 M(X→,) 에 적용하면 모멘트 매트릭스 M(X,Y)이 회복된다는 것도 증명할 수 있다.사실, 류는[6] 같은 변수들에 대한 전방 스윕 후 역 스윕을 통해 순간 매트릭스가 회복될 것이라는 것을 증명한다.역스윕 후 전진 스윕을 통해서도 회복할 수 있다.직관적으로 부분 전방 스위핑은 관절을 한계점과 조건부로 인자를 만드는 반면 부분 역 스위핑은 관절을 결합으로 곱한다.
조합
뎀스터의 규칙에 따르면, 믿음 기능의 조합은 초점 요소의 교차점과 확률밀도함수의 곱절로 표현될 수 있다.리핑 류는 특히 선형신앙함수에 이 규칙을 적용하고 밀도함수 측면에서 조합식을 얻는다.나중에 그는 아서 P의 주장을 증명한다. 완전히 쓸린 행렬 두 개의 합으로 공식을 뎀프스터하고 다시 표현한다.Mathematically, assume and }}}}}\{\{array는 변수 X의 동일한 벡터에 대한 두 개의 LBF이다.그리고 이들의 조합은 완전히 쓸린 행렬이다.
위의 방정식은 종종 두 정규 분포를 곱하는 데 사용된다.여기서는 정규 분포를 특수 사례로 포함하는 두 개의 선형 믿음 함수의 조합을 정의하기 위해 사용한다.또한 빈 선형신앙함수(0 스윕 행렬)는 결합을 위한 중립 요소라는 점에 유의한다.이 방정식을 적용할 때 우리는 두 가지 특별한 경우를 고려해야 한다.첫째, 결합할 두 행렬의 치수가 서로 다르면, 한 행렬 또는 두 행렬을 빈칸으로 확장해야 한다. 즉, 각 행렬에 존재하지 않는 변수에 대한 무지를 가정한다.만약 M1(X,Y)과 M2(X,Z)결합되어야 한다 예를 들면, 우리가 처음 M1(X, Y, Z→){\displaystyle M_{1}(X,Y,{\vec{Z}})에}와 M2(X, Y→, Z){\displaystyle M_{2}(X,{\vec{Y}},Z)}각각 같은 M1(X, Y, Z→){\displaystyle M_{1}(X,Y,{\vec{Z}})}그들을 확장할 것이다. iZ와 →, ) 에 대해 경외하는 것은 Y에 대해 무지하다.이 공허한 확장은 처음에 공씨가 이산적인 믿음 기능을 위해 제안한 것이었다.둘째, 변수에 분산이 0이면 전면 연산을 허용하지 않는다.이 경우 분산을 극히 적은 숫자로 가장하여 ε이라고 하고, 원하는 스윕과 조합을 행할 수 있다.그런 다음 동일한 변수의 결합된 행렬에 역 스위프를 적용하고 ε이 0에 근접하게 할 수 있다.0 분산은 변수에 대한 완전한 확실성을 의미하므로, 이 pro-절차는 최종 결과에서 ε 항을 사라지게 된다.
일반적으로 두 개의 선형신앙함수를 결합하기 위해서는 그들의 순간매트릭스를 완전히 쓸어야 한다.단, 완전히 쓸린 행렬과 부분 쓸린 행렬을 결합할 수 있다. 만약 전 행렬의 변수가 모두 쓸려간다면 가능하다.선형 회귀 모형(Y = XA + b + E)을 사용하여 특성을 설명할 수 있다.앞서 언급했듯이 회귀 모형은 두 가지 지식의 결합으로 간주될 수 있다. 하나는 세 변수 X, Y, E를 포함하는 선형 방정식으로 지정되며, 다른 하나는 E의 단순한 정규 분포, 즉 E ~ N(0, σ)이다.Let and be their moment matrices respectively.그런 다음 먼저 Y에서 →, →, 을(를) 쓸지 않고 두 행렬을 직접 결합할 수 있다.이 조합의 결과는 다음과 같이 부분적으로 스윕 행렬이다.
E에 역 스위프를 적용한 다음 행렬에서 E를 제거하면 회귀 모형의 동일한 표현을 얻을 수 있을 것이다.
적용들
우리는 세 가지 유형의 변수를 다음과 같이 설명하기 위해 감사 문제를 사용할 수 있다.수취채권의 종료 잔액(E)을 감사한다고 가정합시다.앞에서 살펴본 바와 같이, E는 개시 잔액(B)+매출액(S)+매출액(S)+매출액의 현금영수증(C)+매출액(R)+미미한 매출수익률 및 현금할인을 나타내는 잔액(R)+과 같다.따라서 우리는 논리적 관계를 선형 방정식으로 나타낼 수 있다.
나아가 감사관이 E와 B가 평균 10만 달러, 표준편차 5와 공분산 15라고 믿는다면 우리는 다변량 정규분포로서 그 믿음을 나타낼 수 있다.과거 자료에서 잔존 R이 평균 0이고 표준 편차가 0.5,000달러인 경우 정규 분포 R~N(0, 0.5)으로 과거2 데이터를 요약할 수 있다.현금영수증에 대한 직접적인 관찰이 있다면 C = 5만 달러라는 방정식처럼 증거를 대변할 수 있다.만약 감사인이 수취채권의 기초 잔액에 대해 아무것도 모른다면, 우리는 공허한 LBF로 그 또는 그녀의 무지를 대표할 수 있다.마지막으로, 과거 자료에 따르면 현금영수증 C를 고려할 때 판매 S는 평균 8C + 4이고 표준 편차는 4,000달러인 것으로 나타난다면, 우리는 선형 회귀모델 S ~ N(4 + 8C, 16)으로 그 지식을 나타낼 수 있다.
참조
- ^ A. P. Dempster, A. K. M. E. Saleh, Ed. 통계 재단의 데이터 분석에서 "정상적인 믿음 기능과 Kalman 필터":노바 과학 출판사, 2001, 페이지 65–84.
- ^ 류, 리핑, 캐서린 셔노이, 프라카시 P.Shenoy, "선형 믿음 기능을 이용한 포트폴리오 평가를 위한 지식 표현 및 통합," IEEE 시스템, 인간 및 사이버네틱스에 관한 IEEE 거래, 시리즈 A, Vol. 36 (4) 2006, 페이지 774–785.
- ^ G. 샤퍼, "뎀스터의 가우스 신앙 기능에 관한 노트," 캔자스 대학 경영대학원, 로렌스, KS, 기술 보고서 1992.
- ^ L. 류, "가우스 신앙 함수의 이론," 국제 근사 추론 저널, 제14권, 페이지 95–126, 1996
- ^ P. A. Monney, 통계적 증거를 위한 수학 이론.뉴욕, 뉴욕: 스프링거, 2003.
- ^ L. 류, "가우스 신앙 기능의 로컬 연산," 국제 근사 추론 저널, 제22권, 페이지 217–248, 1999.
- ^ 통계학부의 A. Kong, "다변량 믿음 기능 및 그래픽 모델"MA 케임브리지: 하버드 대학교, 1986