DARPA WEATH 프로그램
DARPA TIDES programTIDES(Translingual Information Detection, Extracting and Summary)는 미국 국방고등연구계획국(DARPA)이 자금을 지원하는 기술개발 프로그램으로 언어 데이터의 자동화된 처리와 이해에 중점을 두고 있다.이 프로그램의 주요 목표는 영어 사용자들이 원어와 상관없이 필요한 정보를 빠르고 효과적으로 찾고 해석할 수 있도록 하는 것이다.
구성 요소들
WEATH에 의해 개발되고 있는 기술의 네 가지 구성요소 기능은 다음과 같다.
- 탐지 – 필요한 정보 찾기
- 추출 – 주요 사실의 도출.
- 요약 – 정보를 읽을 수 있는 길이로 축소
- 번역 – 다른 언어에서 영어로 텍스트 변환
감지, 추출 및 요약에 대한 도구는 영어만 사용하는 사람들이 사용하기 위해 언어 내에서(단일적으로)그리고 언어에 걸쳐 작동해야 한다.TRAZE는 기술 개발 외에도 언어 자원이 제한된 언어 등 다른 언어에 빠르고 저렴하게 적응할 수 있는 방법을 연구하고 있다.WEATH는 구성 요소 기능을 함께 그리고 다른 기술과 통합하여 실제 애플리케이션을 위한 도구를 생산하는 것을 목표로 한다.
탐색 데이터 웨어하우스
FBI의 탐사 데이터 웨어하우스는 THE 프로그램에 의해 수집된 뉴스를 포함하는 오픈 소스 뉴스 라이브러리를 포함하고 있다.이 정보는 하아레츠, 프라브다, 요르단 타임스, 인민일보, 워싱턴포스트 등 전 세계 공공 웹사이트에서 수집된다.[1]MiTAP(Mitre Text and Audio Processing) 시스템을 사용한다.[2]
참고 항목
참고 및 참고 문헌 목록
- ^ FBI, IDW-S 시스템 보안 계획, 2003년 12월 3일 링크된 pdf 58-69페이지
- ^ FBI, Security Concept of Operations IDW, 2004 11 29페이지 50, 51페이지의 링크된 PDF
- FBI Information Resources Division (IRD) (2003-12-03). "Investigative Data Warehouse-SECRET (IDW-S) System Security Plan" (PDF). Electronic Frontier Foundation. p. 58.
- FBI Office of the Program Management Executive (2004-11-29). "Security Concept of Operations (S-CONOPS), Investigative Data Warehouse (IDW) Program" (PDF). Electronic Frontier Foundation. p. 50.