인디케이터 컴퓨팅

Indic computing

Incurn Computing은 "Indian Scripts and Language"와 같은 "Indian Scripts and Language"를 의미한다. 인디케이터 스크립트/언어, 입력 방법, 컴퓨터 응용 프로그램의 지역화, 웹 개발, 데이터베이스 관리, 철자 검사기, 텍스트 음성텍스트 음성 응용 프로그램, 인도 언어의 OCR 등의 소프트웨어를 개발하는 것을 포함한다.

널리 사용되는 대부분의 인디케이터 스크립트는 컴퓨터와 인터넷에서 작업하기 위해 유니코드로 인코딩된다. 버전 10.0을 기준으로 벵갈리, 데바나가리, 구자라티, 구르무크히, 칸나다, 임부, 말라얄람, 마사람 곤디,[1] 뉴나리, 올치키, 오리야, 신할라, 타밀, 텔루구 대본이 인코딩되어 지원되고 있다. 역사적으로 사용된 아루이,[2] 아옴 문자,[2] 그란타,[3] 후다바디,[3] 마하자니,[3] 모디 문자,[3] 싯담 문자,[3] 실로티 나가리,[4] 티루타[3] 등도 포함되어 있다. 일부 더 많은 인디케이터 스크립트가 개발 중이며, 예를 들어 툴루 스크립트 같은 유니코드에 포함될 것이다.

많은 인디케이터 컴퓨팅 프로젝트가 진행되고 있다. 그들은 일부 정부 부문 기업들, 일부 자원 봉사 단체들 그리고 개인들을 포함한다.

정부 부문

인도 연합 정부는 인도에서 휴대폰을 제조, 저장, 판매, 유통하는 휴대폰 회사들에게 22개 언어 모두의 텍스트 읽기를 지원하도록 의무화했다.[5] 이러한 움직임은 수백만의 사용자들에 의해 인도어 사용이 증가하고 있다.[6]

TDIL

그 부서는 전자 및 정보화 기술, 인도 정보 처리 도구와 기법 언어 장벽 없이 인간-기계 상호 작용을 촉진하기 위해 개발하는 목표, 다중 언어 지식 자원에 접근하는을 만드는 것;그리고 월 통합은 TDIL[7](기술 개발 인도 언어)을 시작했다.12포인트 전각. 혁신적인 사용자 제품과 서비스를 개발한다.

2005년부터 정부·학사·민간 기업이 개발한 어학 소프트웨어 도구를 비상업용 CD 형태로 보급하기 시작했다.

인도어 기술 확산 및 배치 센터에 배치된 TDIL 프로그램의 결과 중 일부. 본 센터는 TDIL 기금에 따라 개발된 모든 언어 자원, 도구 및 응용프로그램을 보급한다. 이 프로그램은 또한 이 프로그램의 국제적인 발자국을 만든 스와란 라타 박사의 지도 하에 기하급수적으로 확장되었다. 그녀는 이제 은퇴했다.

C-DAC

C-DAC는 인도에 기반을 둔 정부 소프트웨어 회사로 언어 관련 소프트웨어 개발에 관여하고 있다. 인도어를 위한 표준 키보드인 인스크립트 키보드를 개발한 것으로 가장 잘 알려져 있다. 워드프로세서, 타이핑 툴, 텍스트-음성 소프트웨어, 인도어 OCR 등 인디케이터 언어 솔루션도 많이 개발했다.

바라테야OO.org

CDAC에서 개발된 이 작품은 Bangalore(이전 명칭: NCST, Bangalore)가 Bharateeya가 되었다.OO.[8] OpenOffice 2.1은 10개 이상의 인도어를 지원했다.

보스

BOSS는 DIT의 이니셔티브인 무료/오픈 소스 소프트웨어를 위해 National Resource Center에 의해 개발되었다. 그 활동은 C-DAC 첸나이와 안나 대학교 KBC 연구 센터가 협력하고 있다. 지원 센터는 사용자들에게 지원을 제공하기 위해 인도의 몇몇 도시에 설립된다.

NGO 및 자원봉사 단체

인디눅스

Indlinux 조직은 리눅스 및 응용 프로그램의 다른 지시 언어 버전에서 작업하는 개별 자원 봉사자들을 조직하는 데 도움을 주었다.

사로바르

Sarovar.org은 자유/오픈 소스 라이센스로 프로젝트를 호스팅하는 인도 최초의 포털이다. 인도 트리반드룸에 위치하고 있으며 아시아넷 데이터센터에서 주최한다. Sarovar.org은 Linuxense가 커뮤니티 서비스의 일부로 사용자 정의, 설치 및 관리하고 있으며 River Valley Technologies가 후원한다. Sarovar.org은 데비안 에치와 GForge를 기반으로 구축되었으며 METTLE에서 운영된다.

피나크

피나크는 인디케이터어 컴퓨팅에 헌신하는 비정부 자선단체다. 소프트웨어 국산화, 언어 소프트웨어 개발, 오픈소스 소프트웨어 국산화, 온라인 백과사전 강화 등에 효과가 있다. 이 외에도, 피나크는 사람들에게 컴퓨터, 인터넷의 윤리적인 사용, 인터넷의 인도어 사용에 대해 교육하는 일을 한다.

앙쿠르 그룹

안쿠르 그룹은 현지화된 벵골어 GUI, 라이브 CD, 영어-벵골어 번역기, 벵골어 OCR, 벵골어사전 등 Linux 운영체제에서 벵골어(벵골어) 지원을 위해 노력하고 있다.[9]

바샤인도

SMC

SMC는 기술 분야에서 케랄라의 언어 격차를 해소하기 위해 일하는 무료 소프트웨어 그룹이며 오늘날 인도에서 가장 큰 언어 컴퓨팅 커뮤니티다.[10]

입력 방법

Returnie Keypad는 안드로이드에서 타이핑을 위해 지원되는 인도 언어를 나열한다.

풀사이즈 키보드

유니코드 입력 인디케이터 텍스트의 출현과 함께 컴퓨터의 텍스트는 매우 쉬워졌다. 이러한 목적을 위해 여러 가지 방법이 존재하지만, 주요 방법은 다음과 같다.

인스크립트

인스펙터는 인도어를 위한 표준 키보드다. C-DAC에 의해 개발되고 인도 정부에 의해 표준화되었다. 요즘은 마이크로소프트 윈도(2000, XP, Vista, 7), 리눅스, 매킨토시를 포함한 모든 주요 운영 체제에 내장되어 있다.

음성 변환

예를 들어, 사용자가 로마자를 사용하여 인도어로 텍스트를 타이핑하고 실시간으로 인도어 대본에서 등가 텍스트로 음성으로 변환하는 타이핑 방식이다. 이런 종류의 변환은 음성 텍스트 편집기, 워드 프로세서, 소프트웨어 플러그인에 의해 이루어진다. 아이디어를 바탕으로, 어떤 어플리케이션에서도 인디케이터 텍스트를 입력할 수 있는 음성 IME 도구를 사용할 수 있다.

음성 변환기의 예로는 Xlit, Google Indicator Transiteration, Baraha 등이 있다.IME, 인디케이터 IME, 루판타, SMC의 인디케이터 키보드 및 마이크로소프트 인디케이터 언어 입력 도구. SMC의 인디케이터 키보드는 무려 23개 언어를 지원하는 반면 구글 인디케이터 키보드는 11개 인도어만 지원한다.[10]

그것들은 크게 다음과 같이 분류될 수 있다.

레밍턴(타입 작성자)

이 레이아웃은 컴퓨터가 발명되거나 인디케이터 언어로 배치되지 않았을 때 개발되었으며, 타이프라이터가 인디케이터 스크립트에 텍스트를 입력하는 유일한 수단이었다. 타이프라이터는 기계적이고 스크립트 프로세서 엔진을 포함시킬 수 없기 때문에 각 문자를 자판 위에 별도로 배치해야 했기 때문에 자판 배열을 배우기가 매우 복잡하고 어렵게 되었다.

유니코드의 등장으로 레밍턴 레이아웃은 역호환성을 위해 다양한 타이핑 도구에 추가되어 옛 타이피스트들이 새로운 키보드 레이아웃을 배울 필요가 없게 되었다. 오늘날 이 레이아웃은 수년간의 사용으로 인해 이 레이아웃에 익숙해진 오래된 타이피스트들에 의해서만 사용된다. 레밍턴 레이아웃을 포함하는 하나의 도구는 인디케이터 IME이다. 레밍턴 자판 배열을 기반으로 하는 폰트는 Kruti Dev이다. Kruti Dev를 사용한 기존의 레밍턴 자판 배열을 매우 긴밀하게 지원하는 또 다른 온라인 도구는 레밍턴 타이핑 도구다.

점자

인도어 7개를 지원하는 IBus Sharada Braille은 SMC가 개발했다.[10]

숫자 키보드가 있는 휴대폰

노키아 1108 힌디

모바일/핸드/휴대전화 기본 모델에는 일반 구형 전화 키패드처럼 12개의 키가 있다. 각각의 키는 영어로 된 데이터 입력을 용이하게 하기 위해 3-4개의 영문 문자로 매핑된다. 이런 종류의 키패드로 인도어를 입력하기 위해서는 두 가지 방법이 있다. 첫째는 멀티탭 방식이고 둘째는 파니니 키패드처럼 화면의 시각적 도움말을 사용한다. 1차 용도는 SMS이다. 영어/로마 언어에 사용되는 140자 크기는 유니코드[11] 독점 압축을 사용하여 힌디와 같은 복잡한 스크립트 언어에 대한 단일 메시지 크기를 증가시킬 때 70자 내외의 언어만 수용할 수 있다. 인도 광대역 무선 컨소시엄(BWCI)은 제안된 표준의 사용 가능한 방법과 권장사항에 대한 연구를[12] 발표했다.

반투명/촬영법

영어는 인도어를 타이핑할 때 사용된다. QuillPad[13] IndiSMS[14]

네이티브 메서드

고유 방법에서 언어의 문자는 해당 언어에 대한 문자의 확률을 기반으로 숫자 키에 해당하는 화면에 표시된다. 특수 키를 사용하여 추가 문자에 접근할 수 있다. 단어를 부분적으로 입력하면 사용자가 선택할 수 있는 옵션이 제공된다.[15]

Qwerty 키보드가 있는 스마트폰

대부분의 스마트폰은 주로 영어에 적합한 35개의 키를 가지고 있다. 숫자와 일부 기호는 Alt라는 특수 키로 접근한다. 렌더링을 위한 유니코드의 지원이 널리 이용되지 않기 때문에 이러한 유형의 전화기에 대한 인디케이터 입력 방법은 아직 진화되지 않았다.

소프트/가상 키보드가 있는 스마트폰의 경우

스마트폰 사용을 위해 설명서가 채택되고 있다. 인디케이터 언어를 렌더링할 수 있는 안드로이드 폰의 경우 스왈렉 다국어 키패드[16] 다국어 키보드[17][18] 앱을 이용할 수 있다. Gboard는 몇몇 인도 언어에 대한 지원을 제공한다.[19]

현지화

현지화란 소프트웨어, 운영체제, 웹사이트 등을 인도어로 번역하는 것을 말한다. 다양한 자원봉사 단체들이 이 방향으로 활동하고 있다.

맨드레이크 타밀 버전

대표적인 예가 맨드라케 리눅스의 타밀 버전(2011년 이후 소멸)이다. 토론토(캐나다)의 타밀 스피커는 타밀 버전을 내놓으며 리눅스 소프트웨어인 맨드레이크를 출시했다.[20] 타밀에서 모든 기능에 접근할 수 있다는 점에 유의할 수 있다. 이것에 의해, 타밀을 아는 사람들에게는, 컴퓨터를 사용하기 위한 영어 지식의 전제조건이 없어졌다.

인드리눅스

IndLinux는 리눅스 운영체제를 인도어로 번역하는 것을 목표로 하는 봉사단이다. 이 그룹의 노력으로 리눅스는 힌디어와 다른 인도어로 거의 완전히 현지화되었다.

니푼

니펀은 힌두어로 된 다양한 어플리케이션을 번역하기 위한 온라인 번역 시스템이다. 악샤그람 네트워크의 일부다.

웹 사이트 위치 지정

고다디는 웹사이트를 힌디, 마라티, 타밀로 현지화했으며 IVR 통화량의 40%가 인도어라는 점도 언급했다.[21]

인디케이터블로그

인디케이터 블로그는 인디케이터 언어로 된 블로그를 말한다. 인도어로 블로그를 활성화하기 위한 다양한 노력이 이루어져 왔다.

소셜 네트워크

일부 소셜 네트워크는 인도어로 시작한다.[22]

프로그래밍

인디케이터 프로그래밍 언어

프레임워크

도메인의 인기 언어게르킨은 구자라티, 힌디, 칸나다, 푼자비, 타밀, 텔루구, 우르두[23] 등을 지원한다.

도서관

인도 언어의 자연 언어 처리가 증가하고 있다. iNLTK, StanfordNLP와 같은 여러 라이브러리가 있다.[24]

번역

구글은 힌디, 벵갈리, 마라티, 타밀, 텔루구, 구자라티, 푼자비, 말라얄람, 칸나다에 대해 향상된 번역 기능을 제공하며 오프라인에서도 지원한다.[19][25] 마이크로소프트는 또한 이러한 언어들 중 일부에 대해 번역을 제공한다.

소프트웨어

인디케이터 언어 스택

인도 정부는 FICCITDIL이 공동으로 주최한 심포지엄에서 인도 언어 스택이 의사소통의 장벽을 극복하는데 도움을 줄 수 있다고 말했다.[26]

철자 검사기

반투명 도구

번역 도구는 사용자가 다른 스크립트의 텍스트를 읽을 수 있게 해준다. 현재로서 악샤라무카는 대부분의 인도 문자를 허용하는 도구다. 구글은 또한 인디케이터 번역기를 제공한다. 이러한 스크립트의 텍스트는 다른 스크립트로 변환할 수 있으며, 그 반대의 경우도 가능하다. 반면 구글과 마이크로소프트는 라틴 문자에서 인디케이터 스크립트로의 번역을 허용한다.

텍스트 음성 변환

카네기 멜론 대학은 허드투레드 프로젝트와 공동으로 시각장애인들이 인도 모국어로 텍스트를 들을 수 있도록 돕는 TTS(Text-to-Speech) 소프트웨어를 개발했다. 현재 타밀이 제공되고 있으며, 힌디, 벵갈리, 구자라티, 마라티, 칸나다, 푼자비, 텔루구 등에서 2016년 하반기 출시될 예정이다.[27]

음성-문자세

음성 인식

애플사Siri에서 주요 인도어 지원을 추가했다.[28] 아마존의 알렉사는 힌디어에 대한 지원을 하고 있으며 인도의 주요 언어들을 부분적으로 인정하고 있다.[29] 구글 어시스턴트도 주요 인도어 지원을 받고 있다.[30]

국제화된 도메인 이름

운영 체제

버추얼 어시스턴스

인공지능 기반 가상 비서 구글 어시스턴트가 다양한 인도어를 지원한다.

사용 및 증가

고아빠에 따르면 인도 인터넷 트래픽의 61%는 힌디, 마라티, 타밀어가 차지했다.[21] 온라인 콘텐츠의 1% 미만이 인도어로 되어 있다. 새롭게 만들어진 탑 앱은 여러 인도어를 지원하거나 인도어 콘텐츠를 홍보한다. 왓츠앱의 인도 사용자 중 61%는 주로 모국어를 사용하여 통신한다.[31] 타밀어, 힌디어, 칸나다어, 벵골어, 마라티어, 텔루구어, 구자라티어, 말라얄람어 등 지역 언어 중에서 인터넷 채택이 가장 높은 것으로 최근의 연구에서 밝혀졌다. 마라티, 벵골어, 타밀어, 텔루구가 국내 전체 현지어 사용자 기반 중 30%를 차지할 것으로 추산하고 있다. 현재 인터넷 채택 수준은 타밀이 42%로 가장 높고 힌디 39%, 칸나다 37%[32] 순이다. 인텍스는 또한 지역 언어 사용의 87%가 힌디어, 벵갈어, 타밀어, 구자라티어, 마라티어 사용자로부터 왔다고 보고했다.[6] 용암모바일은 타밀과 말라얄람이 전화기에서 힌디보다 더 인기가 많다고 보도했다.[6]

참고 항목

참조

  1. ^ 유니코드 10.0
  2. ^ a b 유니코드 8.0
  3. ^ a b c d e f 유니코드 7.0
  4. ^ 유니코드 4.1
  5. ^ 핸드셋 표시 언어 사용 가능 기한 2017년 10월 1일까지 연장
  6. ^ a b c Centre의 지역 언어 지원 추진으로 성과를 거두다 – 힌두 비즈니스 라인
  7. ^ "TDIL: Technology Development for Indian Languages Programme, India". Archived from the original on 23 March 2015. Retrieved 28 March 2015.
  8. ^ "BharateeyaOOo". Retrieved 28 March 2015.
  9. ^ "Archive of Ankur Home". Ankur group, Bengalinux.org group. Archived from the original on 29 May 2005. Retrieved 26 December 2015.
  10. ^ a b c 말라얄람의 디지털 도약을 돕는 새로운 인도 익스프레스
  11. ^ "Quillpad Mobile – FAQs". Archived from the original on 2 April 2015. Retrieved 28 March 2015.
  12. ^ "SIG Report on Indian Language SMS, Nov 2010" (PDF). Archived from the original (PDF) on 2 April 2015. Retrieved 11 November 2011.
  13. ^ "Quillpad Mobile – Hindi SMS application for your mobile phone". Archived from the original on 2 April 2015. Retrieved 28 March 2015.
  14. ^ "Eterno Infotech". Archived from the original on 28 March 2015. Retrieved 28 March 2015.
  15. ^ "Keypad for mobile-Keyboard for mobile-Keyboard for typing on mobile-Keypad for typing on mobile". Retrieved 28 March 2015.
  16. ^ 이 벵골루 기반 스타트업이 보다 스마트한 인디케이터 키보드를 구축했다고 믿는 – NDTV
  17. ^ Honso. "MultiLing Keyboard – Android Apps on Google Play". Retrieved 28 March 2015.
  18. ^ Honso. "Plugin Hindi हिन्दी – Android Apps on Google Play". Retrieved 28 March 2015.
  19. ^ a b Google 번역기 9개 인도어 11개 추가 키보드 지원 – Live Mint
  20. ^ Frederick Noronha. "Indian-language computing: The long road ahead – Features – Technology". Infochange India. Retrieved 28 March 2015.
  21. ^ a b GoDaddy는 힌디, 마라티, 타밀에서 서비스를 개시한다 – EconomicTimes.com
  22. ^ Google과 Facebook의 인도 관심으로 인디케이터 컴퓨팅 – Live Mint
  23. ^ 게르킨어 참조
  24. ^ 인도어를 위한 상위 NLP 라이브러리 및 데이터셋 - 분석 매거진
  25. ^ Google이 7개의 인도어로 번역할 수 있도록 지원함 – Deccan Chronicle
  26. ^ Sawhney, Shri. Ajay Prakash (30 July 2018). "India Language Stack needed to overcome the barriers of communication: IT Secretary". Press Information Bureau GoI. Retrieved 27 September 2020.
  27. ^ University, Carnegie Mellon (3 August 2016). "Android App Lets Visually Impaired in India Listen to Texts in Native Languages-CMU News". Carnegie Mellon University. Retrieved 23 August 2016.
  28. ^ 여러 언어를 사용하여 인도의 Siri와 대화
  29. ^ 아마존 인디아, 곧 힌디에서 보이스 쇼핑 시작
  30. ^ 언어 변경 또는 여러 언어 사용
  31. ^ 우리는 아직 인도 인터넷을 만들지 않았어!
  32. ^ 영어 전용 영어 사용 금지: 인도에서 온라인으로 들어오는 90%의 새로운 인터넷 사용자들이 영어가 아닌 사용자들이다.