유한 상태 변환기

외부 비디오
외부 비디오
	유한 상태 변환기 // Karlsruhe 공과대학, YouTube 비디오

유한상태변환기(FST)는 튜링기계용 용어인 입력테이프와 출력테이프를 따르는 2개의 메모리테이프를 가진 유한상태 기계이다.이것은 하나의 테이프가 있는 일반적인 유한 상태 오토마톤과 대조됩니다.FST는 2개의 ^[1]심볼 세트 간에 매핑되는 Finite-State Automaton(FSA; 유한 상태 오토마톤)의 일종입니다.FST는 FSA보다 일반적입니다.FSA는 수신된 문자열 세트를 정의함으로써 정식 언어를 정의하고 FST는 문자열 세트 간의 관계를 정의합니다.

FST는 입력 테이프에서 문자열 세트를 읽고 출력 테이프에서 일련의 관계를 생성합니다.FST 는, 세트내의 문자열간의 변환기 또는 릴레이터로서 생각할 수 있습니다.

형태학적 해석에서는 예를 들어 FST에 문자열을 입력하고 FST는 형태소 문자열을 출력합니다.

개요

테이프 내용을 입력으로 보면 오토마톤은 문자열을 인식한다고 할 수 있습니다.즉, 자동화는 {0,1} 집합에 문자열을 매핑하는 함수를 계산합니다.또는 자동화가 문자열을 생성한다고 할 수 있습니다.즉, 테이프를 출력 테이프로 볼 수 있습니다.이 관점에서 자동화는 문자열 집합인 형식 언어를 생성합니다.오토마타의 두 가지 관점은 동일하다: 오토마톤이 계산하는 함수는 정확히 그것이 생성하는 문자열 집합의 지시 함수이다.유한 오토마타에 의해 생성된 언어의 클래스는 정규 언어의 클래스로 알려져 있습니다.

트랜스듀서의 2개의 테이프는 일반적으로 입력테이프와 출력테이프로 간주됩니다.이러한 관점에서 트랜스듀서는 입력테이프의 문자열을 받아들여 출력테이프에 다른 문자열을 생성함으로써 입력테이프의 내용을 출력테이프로 변환(즉 번역)한다고 한다.비결정적으로 그렇게 할 수 있으며 각 입력 문자열에 대해 여러 출력을 생성할 수 있습니다.변환기는 또한 주어진 입력 문자열에 대해 출력을 생성하지 않을 수 있으며, 이 경우 입력을 거부한다고 한다.일반적으로 변환기는 2개의 형식 언어 간의 관계를 계산한다.

각 문자열간 유한 상태 변환기는 입력 알파벳 δ와 출력 알파벳 δ를 관련짓는다.유한 상태 변환기로 구현될 수 있는 δ*×δ* 위의 관계 R을 유리 관계라고 한다.부분 함수인 유리 관계, 즉 δ*부터 최대 1개의 δ*까지의 모든 입력 문자열을 관련짓는 유리 함수라고 합니다.

유한 상태 변환기는 종종 자연 언어 처리 연구와 응용 분야에서 음운 및 형태학적 분석에 사용됩니다.이 분야의 선구자들은 로널드 카플란, 라우리 카트툰, 마틴 케이, 키모 코스케니에미 ^[2]^{[non-primary source needed]}등이다.변환기를 사용하는 일반적인 방법은 이른바 "캐스케이드(cascade)"입니다. 이 캐스케이드에서는 합성 연산자의 반복적인 적용에 의해 다양한 연산을 위한 변환기가 단일 변환기로 결합됩니다(아래 정의).

형식 구조

형식적으로 유한 변환기 T는 다음과 같은 6 태플( $Q, δ$ , $δ,$ $I,$ $F, δ$ )이다.

$Q$ 는 유한 집합, 즉 상태 집합이다.
$δ$ 는 입력 알파벳이라고 불리는 유한 집합입니다.
$δ$ 는 출력 알파벳이라고 불리는 유한 집합입니다.
$I$ 는 초기 상태 집합인 Q의 $하위$ 집합입니다.
$F$ 는 최종 상태 집합인 Q의 $하위$ 집합이다.
$\delta \subseteq Q\times (\Sigma \cup \{\epsilon \})\times (\Gamma \cup \{\epsilon \})\times Q$ $\delta \subseteq Q\times (\Sigma \cup \{\epsilon \})\times (\Gamma \cup \{\epsilon \})\times Q$ × ( $\delta \subseteq Q\times (\Sigma \cup \{\epsilon \})\times (\Gamma \cup \{\epsilon \})\times Q$ { { $\delta \subseteq Q\times (\Sigma \cup \{\epsilon \})\times (\Gamma \cup \{\epsilon \})\times Q$ ) × ( $\delta \subseteq Q\times (\Sigma \cup \{\epsilon \})\times (\Gamma \cup \{\epsilon \})\times Q$ { $\delta \subseteq Q\times (\Sigma \cup \{\epsilon \})\times (\Gamma \cup \{\epsilon \})\times Q$ } $\delta \subseteq Q\times (\Sigma \cup \{\epsilon \})\times (\Gamma \cup \{\epsilon \})\times Q$ ) × $Q$ ( \ $displaystyle$ \ delta \ $subseteq Q \$ times ) \ $times$ ( \ $Sigma$ \ cup \ { \ { \ $epsilon$ \ $\delta \subseteq Q\times (\Sigma \cup \{\epsilon \})\times (\Gamma \cup \{\epsilon \})\times Q$ } ) \ times ( \ $Gamma$ \ cup \ { \ { \ \ } ) string) \ \ \ \ \ \ \ \ \ \ \ $times$ ) string ) string) string) ) 。

(Q, ))는 라벨이 붙은 유향 그래프로서 T의 트랜지션 그래프라고 불립니다.정점 집합은 Q입니다. $(q,a,b,r)\in \delta$ , $(q,a,b,r)\in \delta$ ( $(q,a,b,r)\in \delta$ $(q,a,b,r)\in \delta$ $(q,a,b,r)\in \delta$ r ) $∈$ { $display$ style $(q, a, b, r)\in \delta }$ 는 $(q,a,b,r)\in\delta$ , 정점 q에서 정점 r로 이어지는 라벨이 붙은 에지가 있음을 의미합니다.또한 a는 해당 에지의 입력 라벨이고 b는 해당 에지의 출력 라벨이라고 합니다.

참고: 유한 변환기의 정의는 문자 변환기(Roche 및 Schabes 1997)라고도 합니다. 대체 정의는 가능하지만, 모두 변환기로 변환될 수 있습니다.

확장 전이 관계 $「」(\$ ^{*})를 $\delta^*$ 다음과 같이 최소 세트로 정의합니다.

$\displaystyle \displayeq$ \displayeq $\delta \subseteq \delta ^{*}$ ;
$(q,\epsilon ,\epsilon ,q)\in \delta ^{*}$ , $(q,\epsilon ,\epsilon ,q)\in \delta ^{*}$ " , " $(q,\epsilon ,\epsilon ,q)\in \delta ^{*}$ , " , $(q,\epsilon ,\epsilon ,q)\in \delta ^{*}$ " q ) $(q,\epsilon ,\epsilon ,q)\in \delta ^{*}$ " " " " ( $(q,\epsilon ,\epsilon ,q)\in \delta ^{*}$ q , \ $epsilon$ , \ $epsilon , q$ ) \ $in$ \ $delta ^$ { * }" ( $q\in Q$ Q $)$ 에 대해 "\ $displaystyle$ $q$ $\ in$ Q" 입니다 $q\in Q$
$(q,x,y,r)\in \delta ^{*}$ , $(q,x,y,r)\in \delta ^{*}$ x , $(q,x,y,r)\in \delta ^{*}$ , $(q,x,y,r)\in \delta ^{*}$ r ) $(q,x,y,r)\in \delta ^{*}$ $、$ \ $display$ style ( $q$ , x , $y$ , $r$ ) \ $(q,x,y,r)\in \delta ^{*}$ $in$ \ display $^$ { * $(q,xa,yb,s)\in \delta ^{*}$ $($ ( ( $(r,a,b,s)\in \delta$ $(q,x,y,r)\in \delta ^{*}$ $(r,a,b,s)\in \delta$ ( $r$ , $a$ , $(r,a,b,s)\in \delta$ , $(r,a,b,s)\in \delta$ )\ $(r,a,b,s)\in \delta$ \ $display$ style ( $r$ , $(r,a,b,s)\in \delta$ $(q,xa,yb,s)\in \delta ^{*}$ , $(q,xa,yb,s)\in \delta ^{*}$ , s )\ $(q,xa,yb,s)\in \delta ^{*}$ \ $(q,xa,yb,s)\in \delta ^{*}$ $style$ ( r , $a$ , $(q,xa,yb,s)\in \delta ^{*}$ , s ) $、$ ) $(q,xa,yb,s)\in \delta ^{*}$

확장된 전이 관계는 기본적으로 가장자리 레이블을 고려하기 위해 증가된 전이 그래프의 반사적 전이 폐쇄입니다.「 $\delta ^{*}$ 」의 요소 $(\displaystyle$ \delta $\delta ^{*}$ ^{*})는 $\delta ^{*}$ 패스로 알려져 있습니다.경로의 에지 레이블은 구성 전환의 에지 레이블을 순서대로 연결하여 가져옵니다.

트랜스듀서 T의 동작은 다음과 같이 정의되는 유리관계 [T $]$ 입니다 $x[T]y$ $i I$ \ $(i,x,y,f)\in \delta ^{*}$ i \ $in$ $(i,x,y,f)\in \delta ^{*}$ $i\in I$ $f\in F$ f f f $f\in F$ f $f\in F$ $f$ f （ $i$ , $x$ , $y$ , $）。$ 입력라벨이 x이고 출력라벨이 y인 초기상태에서 최종상태로의 경로가 존재하는 경우 $x\in \Sigma ^{*}$ x " $"\$ x $\$ $in \Sigma$ $x\in \Sigma ^{*}$ $^{*}"$ 를 $x\in \Sigma ^{*}$ $y\in \Gamma ^{*}$ $y\in \Gamma ^{*}$ y 로 $y\in \Gamma ^{*}$ 변환합니다.

가중 오토마타

유한 상태 변환기는 가중치를 부여할 수 있으며, 여기서 각 전환에는 입력 및 출력 라벨 외에 가중치로 라벨이 지정됩니다.가중치 K에 대한 가중치 유한 상태 변환기(WFST)는 가중치되지 않은 것과 유사하게 $8-태플$ T $=(Q$ ,δ $, δ,$ $I,$ $F,$ E, δ, $δ,$ $δ$ )로 정의할 수 있다. 여기서, 다음과 같다.

$Q, δ$ , $δ,$ $I,$ $F$ 는 위와 같이 정의된다.
$E$ Q $E\subseteq Q\times (\Sigma \cup \{\epsilon \})\times (\Gamma \cup \{\epsilon \})\times Q\times K$ × ( $E\subseteq Q\times (\Sigma \cup \{\epsilon \})\times (\Gamma \cup \{\epsilon \})\times Q\times K$ { { $E\subseteq Q\times (\Sigma \cup \{\epsilon \})\times (\Gamma \cup \{\epsilon \})\times Q\times K$ $E\subseteq Q\times (\Sigma \cup \{\epsilon \})\times (\Gamma \cup \{\epsilon \})\times Q\times K$ ) $E\subseteq Q\times (\Sigma \cup \{\epsilon \})\times (\Gamma \cup \{\epsilon \})\times Q\times K$ × ( $E\subseteq Q\times (\Sigma \cup \{\epsilon \})\times (\Gamma \cup \{\epsilon \})\times Q\times K$ { { } $E\subseteq Q\times (\Sigma \cup \{\epsilon \})\times (\Gamma \cup \{\epsilon \})\times Q\times K$ ) $E\subseteq Q\times (\Sigma \cup \{\epsilon \})\times (\Gamma \cup \{\epsilon \})\times Q\times K$ × $Q$ × K × \ $display$ E \ $subseteq$ \ times ( \ $Sigma$ \ cup \ { \ $epsilon$ \ } $E\subseteq Q\times (\Sigma \cup \{\epsilon \})\times (\Gamma \cup \{\epsilon \})\times Q\times K$ ) \ times ( \ $Gamma$ \ cup \ { \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ $times$ \ $times$ \ times \ times \ times \ times ) $）$ ） ε \ $times$ 。
$K$ $I\right 화살표$ K는 $\lambda :I\rightarrow K$ 초기 상태를 가중치에 매핑합니다.
$\rho :F\rightarrow K$ : $\rho :F\rightarrow K$ → $K$ { $style$ \ $rho$ : F \ $right 화살표$ K $\rho :F\rightarrow K$ }는 최종 상태를 가중치에 매핑합니다.

WFST에서 특정 동작을 명확하게 정의하기 위해서는 가중치 세트를 요구하여 ^[3]세미링을 구성하는 것이 편리합니다.실제로 사용되는 두 가지 일반적인 반설정은 로그 반설과 열대 반설이다. 비결정론적 자동설정은 부울 ^[4]반설정에 가중치가 있는 것으로 간주될 수 있다.

확률적 FST

확률론적 FST(확률론적 FST 또는 통계적 FST라고도 함)는 아마도 가중 ^{[citation needed]}FST의 한 형태이다.