이미지 스팸

Image spam
그림 1. 깨끗한 스팸 이미지의 예
그림 2. OCR 기반 및 서명 기반 탐지를 회피하기 위한 난독화된 스팸 이미지의 예
그림 3. 평균 스팸 크기 대 이미지 스팸[1] 비율
그림 4. 스팸의 평균 크기 대 이미지 및 ZIP/RAR 스팸 비율(2011-2012, 주당)[2]

이미지 기반 스팸 [3][4]또는 이미지 스팸은 텍스트 스팸 메시지가 이미지에 포함되어 스팸 메일에 첨부되는 전자 메일 스팸의 일종이다.대부분의 이메일 클라이언트는 이미지 파일을 사용자에게 직접 표시하므로 이메일이 열리면 바로 스팸 메시지가 전달된다(첨부된 이미지 파일을 더 이상 열 필요가 없다).null

이미지 스팸의 목적은 대부분의 스팸 필터(예: SpamAssin, RadiousSpam, Bogofilter, SpamBayes)가 수행하는 전자 메일의 텍스트 콘텐츠 분석을 회피하는 데 있다.따라서, 같은 이유로, 첨부된 이미지와 함께 스팸 발송자들은 종종 이메일에 일부 "보거스" 텍스트, 즉 스팸이 아닌 합법적인 이메일에 가장 많이 나타날 가능성이 있는 단어들을 추가한다.이전 이미지 스팸 전자 메일에는 그림 1과 같이 텍스트가 깨끗하고 쉽게 읽을 수 있는 스팸 이미지가 포함되어 있었다.

결과적으로, 광학 문자 인식 도구는 스팸 이미지에 포함된 텍스트를 추출하기 위해 사용되었고, 스팸 필터에 의해 전자 메일 본문에 있는 텍스트와 함께 처리되거나, 보다 일반적으로는 보다 정교한 텍스트 분류 기법에 의해 처리될 수 있었다.[3][5]또한 서명(예: MD5 해싱)을 생성하여 이미 알려진 스팸 이미지를 쉽게 탐지하고 차단하였다.스팸 발송자는 캡차(CAPTCHA)와 마찬가지로 스팸 이미지에 일부 난독화 기법을 적용하여 내장된 텍스트를 OCR 도구로 읽지 못하게 하고 서명 기반 탐지를 잘못 유도하는 방식으로 대응했다.몇 가지 예는 그림 2에 나와 있다.

이에 컴퓨터 비전과 패턴 인식 기법을 활용한 이미지 스팸 검출 개선 문제가 제기됐다.[3][4][6][7]null

특히 몇몇 저자는 일반적 저수준 이미지 기능(예: 색상 수, 일반적인 색상 범위, 이미지 가로 세로 비율, 텍스트 영역),[6][7][8][9] 이미지 메타데이터 등을 사용하여 난독화된 이미지로 이미지 스팸을 인식할 수 있는 가능성을 조사하였다(종합[4] 조사는 참조).특히, 일부 저자들은 또한 이를 난독화하려는 적대적 시도를 나타내는 유물이 첨부된 영상에서 텍스트의 존재를 탐지하려고 시도했다.[10][11][12][13]null

이미지 스팸은 2004년에 시작되어 2006년 말에 정점을 찍었는데, 그 때 스팸의 50% 이상이 이미지 스팸이었다.2007년 중반부터 쇠퇴하기 시작해 2008년 사실상 사라졌다.[1]이런 현상의 배경은 이해하기 쉽지 않다.이미지 스팸의 감소는 제안된 대응책(예: 시각적 기능에 기초한 빠른 이미지 스팸 검출기)의 개선과 스팸 발송자가 주어진 시간 간격 동안 적은 양의 스팸을 보내도록 하는 이미지 스팸의 대역폭 측면에서 더 높은 요구 사항 모두에 기인할 수 있다.두 가지 요인 모두 스팸 메일을 스팸 발송자에게 다른 종류의 스팸보다 덜 편리하게 만들었을 수 있다.그럼에도 불구하고 2011년 말에 이미지 스팸이 재발견되었고, 이미지 스팸은 비록 적은 기간이지만 전체 스팸 트래픽의 8%에 달했다.[2]null

참고 항목

참조

  1. ^ a b IBM X-Force® 2010, Mid-Year Trend and Risk Report(2010년 8월)
  2. ^ a b IBM X-Force® 2012, Mid-Year Trend and Risk Report(2012년 9월)
  3. ^ a b c 조르지오 후메라, 이냐지오 필라이, 파비오 롤리,"Spam filtering based on the analysis of text information embedded into images". 머신러닝 리서치 저널 (컴퓨터 보안의 머신러닝에 관한 특별호), 제7권, 페이지 2699-2720, 2006/12/2006.
  4. ^ a b c 바티스타 Biggio, 조르조 Fumera, Ignazio Pillai, 파비오 Roli,Biggio, 바티스타;Fumera, 조르조, Pillai, Ignazio, Roli, 파비오(2011년)."설문 조사와 이미지에 관한 실험적 평가 spam 필터링 기술, 패턴 인식 불능".패턴 인식 불능. 32세(10):1436–1446. doi:10.1016/j.patrec.2011.03.022.볼륨 32을 발행하다. 10,152011년 7월, 페이지 1436-1446, ISSN 0167-8655.
  5. ^ "Bayes OCR Spam Assassin's Plugin".
  6. ^ a b Aradhye, H, Myers, G, Herson, J. A, 2005.이미지 기반 스팸 메일의 효율적인 고양이 자아화를 위한 이미지 분석.In: Proc.Int. Conf.문서 분석 및 인식에 관하여, 페이지 914–918.
  7. ^ a b 준설, M, 게바랴후, R, 엘리아스-바흐라흐, A, 2007.이미지 스팸에 대한 빠른 분류자 학습In: Proc.4차 콘프.전자 메일 및 안티스팸(CEAS)에서
  8. ^ Wu, C.-T, Chung, K.T, Zhu, Q, Wu, Y.L, 2005.안티스팸 필터링에 시각적 기능 사용In: Proc.IEEE Int.이미지 처리 관련 설명, Vol. III.pp. 501–504.
  9. ^ 류, Q, 진, Z, 청, H, 완, M, 2010.스팸 이미지의 효율적인 모델링.인: 인트.지능정보기술과 보안정보학에 대한 동정심.IEEE 컴퓨터 협회, 페이지 663–666.
  10. ^ "Fuzzy - OCR Spam Assassin's Plugin".
  11. ^ Battista Biggio, Giorgio Fumera, Ignazio Filai, Fabio Roli, "시각 정보를 이용한 이미지 스팸 필터링", 14 int.이미지 분석 및 처리(ICIAP 2007), 이탈리아 모데나, IEEE 컴퓨터 협회, 페이지 105--110, 10/09/2007.
  12. ^ 파비오 롤리, 바티스타 빅지오, 조르지오 후메라, 이그나지오 필라이, 리카르도 사타, "적대수리적 난독화 텍스트의 탐지에 의한 이미지 스팸 필터링", NIPS(신경 정보 처리 시스템) 워크샵, 휘슬러, 브리티시 컬럼비아, 캐나다, 2007년 8월 12일.
  13. ^ Battista Biggio, Giorgio Fumera, Ignazio Filai, Fabio Roli, "이미지 텍스트 기능을 사용한 이미지 스팸 필터링 개선", Email and Anti-Spam에 관한 제5차 컨퍼런스(CEAS 2008), Mountain View, CA, USA, 2008/2008/2008년 11월 21일.