쓰기프린트
WriteprintWriteprint는 인터넷을 통해 저자식별을 확립하는 법의학 언어학에서 디지털 지문에 비유되는 방법이다. 정체성은 미지의 서면 텍스트와 의심스러운 저자(작가 불변자)의 알려진 샘플의 구별되는 스타일 특성을 비교함으로써 확립된다. 용의자가 없더라도, 글쓰기는 국적과 교육 등 저자의 잠재적인 배경 특성을 제공한다.[1]
작성자 식별에는 다음과 같은 5가지 측면이 있다.
- 어휘적 특징 - 문자와 단어를 사용하여 개인의 선호도를 식별하는 어휘 선택, 어휘 선택, 어휘 분석
- 대문자 및 소문자 사용, 특정 문자의 빈도, 단어 평균 길이, 발음의[2] 평균 길이
- 통사적 특징 - 문장 부호 및 하이픈, 수동적 음성의 사용 및 문장 복잡성 등 저자의 문장 방식 및 문장 구조 분석
- 구조적 특징 - 문단 길이, 간격 및 들여쓰기를 포함한 저자의 구성과 작품의 구조 배열을 분석한다.
- 예를 들어, 이메일 설정에서 문단 내 문장 배열, 작별 인사, 인사 및 서명을 포함한다.
- 내용별 특징 - 비속어 또는 두문자어의 사용을 포함하여, 문맥적으로 저작물의 주체에 유의한 언어의 분석. 좀 더 구체적으로, 이러한 특징들은 그들이 사용하는 키워드를 정확히 지적하여 대상의 관심사를 결정한다.
- 특이적 특징 - 잘못된 철자법, 단어 오용 및 부정확한 동사 형식과 같이 저자에게 고유한 오류 및 기타 문법적 요소의 분석. 이는 제어하기 어려울 수 있기 때문에 다른 특징과 결합했을 때 저자 식별에서 높은 정확도를 달성했다.[3]
위의 5가지 특징은 전통적인 저자식별 방법이지만, 온라인 텍스트만의 특징이 있다. 글꼴 선택, 이모티콘 사용, 다른 웹사이트로의 링크와 같은 기능들은 모두 전통적인 텍스트 분석에 없는 식별 경로를 제공한다.[4]
참고 항목
참조
- ^ Li, Jiexun; Zheng, Rong; Chen, Hsinchun (April 2006). "From Fingerprint to Writeprint". Communications of the ACM. 49 (4): 76–82. doi:10.1145/1121949.1121951.
- ^ Iqbal, F; Binsalleeh, H; Fung, B; Debbabi, M (October 2010). "Mining writeprints from anonymous e-mails for forensic investigation". Digital Investigation. 7 (1–2): 56–64. doi:10.1016/j.diin.2010.03.003.
- ^ Abbasi, Ahmed; Chen, Hsinchun; Nunamaker Jr., Jay F. (Summer 2008). "Stylometric Identification in Electronic Markets: Scalability and Robustness". Journal of Management Information Systems. 25 (1): 49–78. doi:10.2753/MIS0742-1222250103. JSTOR 40398926.
- ^ Rehmeyer, Juli (Jan 13, 2007). "Digital Fingerprints". Science News. 171 (2): 26–28. doi:10.1002/scin.2007.5591710210. JSTOR 3982506.