수화인식
Sign language recognition수화 인식(SLR로 일반적으로 단축됨)은 수화로부터 행동을 인식하는 것을 포함하는 계산 작업이다.[1] 이것은 특히 청각 장애인들이 직면하고 있는 의사소통 격차를 해소하기 위해 디지털 세계에서 해결해야 할 필수적인 문제다.
문제를 해결하려면 보통 주석을 단 색상(RGB) 데이터뿐만 아니라 깊이, 감각 정보 등 다양한 다른 양식이 유용하다.
격리된 수화 인식
ISLR(단어 수준 SLR이라고도 함)은 서명 동영상 클립의 주어진 세그먼트에서 글로스라고 불리는 개별 기호나 토큰을 인식하는 작업이다. 이는 격리된 동영상에서 인식할 때 흔히 분류 문제로 보이나, 실시간 애플리케이션에서 사용할 때는 영상 세분화 등의 다른 사항을 처리해야 한다.
연속수어인식
CSLR(수화언어 필사이라고도 함)에서 수화어 순서가 주어진 과제는 비디오의 모든 수화(또는 광택)를 예측하는 것이다. 이것은 수화의 실제 표기법에 더 적합하다. 어떻게 해결하느냐에 따라 ISLR 업무의 확장으로도 볼 수 있다.
연속수어번역
수화 번역은 일련의 수화(광택이라고 불림)를 필요한 구어체로 번역하는 문제를 말한다. 그것은 일반적으로 CSLR 문제에 대한 확장으로 모델링된다.
참조
- ^ Cooper, Helen; Holt, Brian; Bowden, Richard (2011). "Sign Language Recognition". Visual Analysis of Humans: Looking at People. Springer: 539–562. doi:10.1007/978-0-85729-997-0_27.