스칸소프 문제

Scunthorpe problem
사용자 이름에서 cunt식별하는 정규 표현으로 인한 Wikipedia의 Scunthorpe 문제의 예

스팸 필터 또는 검색 엔진에 의해 웹 사이트, 전자 메일, 포럼 투고 또는 검색 결과가 의도하지 않게 차단되는 문제가 있습니다.이는 텍스트에 외설적이거나 허용할 수 없는 의미가 있는 것으로 보이는 문자열(또는 하위 문자열)이 포함되어 있기 때문입니다.이름, 약어 및 기술용어가 이 문제의 영향을 받는 것으로 가장 많이 언급됩니다.

이 문제는 컴퓨터가 문서 내에서 텍스트 문자열을 쉽게 식별할 수 있기 때문에 발생하지만, 이러한 종류의 단어를 해석하는 것은 아마도 여러 문화권에서 광범위한 문맥을 해석하는 상당한 능력을 필요로 하는데, 이것은 매우 어려운 작업입니다.그 결과 광범위한 차단 규칙은 잘못된 긍정으로 인해 무해한 문구에 영향을 줄 수 있습니다.

기원 및 이력

이 문제의 이름은 1996년 AOL의 불경 필터로 인해 영국 노스 링컨셔 스쿤소프 마을 주민들이 AOL과 계정을 만드는 것을 방해한 사건에서 따왔다.왜냐하면 마을 이름에 "cunt"[1]라는 하위 문자열이 포함되어 있기 때문이다.2000년대 초, 구글의 옵트인 세이프 서치 필터는 같은 오류를 범하여 사람들이 스쿤소프[2]포함한 지역 업체나 URL을 검색할 수 없게 했다.

회피책

Scunthorpe 문제는 [3][4]문맥에서 단어를 이해할 수 있는 필터를 만드는 것이 어렵기 때문에 완전히 해결하기가 어렵다.

하나의 솔루션은 알려진 잘못된 긍정의 화이트리스트를 작성하는 것입니다.화이트리스트에 표시되는 단어는 필터에 의해 무시될 수 있습니다.단, 그렇지 [5]않으면 허용되지 않는 텍스트가 포함되어 있어도 마찬가지입니다.

기타 예

외설 필터에 의한 잘못된 결정에는 다음이 포함됩니다.

거부된 웹 도메인 이름 및 계정 등록

  • 1998년 4월 Jeff Gold는 도메인 이름을 등록하려고 시도했다. shitakemushrooms.com하지만 서브스트링 똥 때문에 그는 인터에 의해 차단되었다.NIC 필터는 "7가지 더러운 단어"[6]를 금지합니다.(표고버섯은 식용균 렌티눌라 에도데스의 일본식 명칭입니다.)
  • 2000년 캐나다의 웹 필터링 소프트웨어 TV 뉴스 기사에 따르면 몬트리올 도시 공동체(프랑스어로 Communauté Urbaine de Montréal)의 웹사이트는 도메인 이름이 프랑스어 약자 CUM(www.cum.qc.ca)[7]이며, "cum"(다른 의미)은 정자를 뜻하는 영어 속어이다.
  • 2004년 2월 스코틀랜드에서 크레이그 콕번은 Hotmail에 음경을 뜻하는 속어인 서브스트링 콕을 포함하고 있기 때문에 Hotmail에 자신의 성(코번으로 발음)을 사용할 수 없다고 보고했다.이와는 별도로 소프트웨어 전문가라는 직함이 스팸 메일에 일반적으로 언급되는 발기부전 약물인 Cialis를 포함하고 있었기 때문에 직장 이메일에 문제가 있었습니다.Hotmail은 처음에 그에게 이름 C0ckburn을 쓰라고 말했다가 나중에 [8]금지령을 번복했다.2010년, 그는 BBC 웹사이트에 등록하는 것과 유사한 문제를 겪었는데, 여기서도 그의 성의 처음 네 글자가 콘텐츠 [9]필터에 문제를 일으켰다.
  • 2006년 2월, 린다 캘러한은 처음에 알라라는 부호를 가진 자신의 이름을 이메일 주소로 등록하는 것이 금지되었다.야후는 나중에 금지령을 [10]번복했다.
  • 2008년 7월, 닥터 허먼 1세.Libshitz는 자신의 이름이 포함된 이메일 주소를 Verizon에 등록할 수 없었습니다.Verizon은 처음에 그의 예외 요청을 거절했습니다.그 후의 성명에서, 버라이즌의 대변인은, 자신이 희망하는 E-메일 [11]주소를 승인하지 않은 것에 대해 사과했다.

차단된 웹 검색

  • 1996년 1월까지 몇 달 동안 슈퍼볼 XXX에 대한 일부 웹 검색은 필터링되었습니다.이는 게임과 사이트(XXX)의 로마 숫자포르노[12]식별하는 데 사용되었기 때문입니다.
  • RomansInSussex.co.uk의 웹 디자이너인 Gareth Roelofse는 2004년에 다음과 같이 말했다. "우리는 많은 도서관 넷 스테이션, 학교 네트워크 및 인터넷 카페가 도메인 이름에 '섹스'라는 단어를 가진 차단 사이트를 발견했다.이는 RomansInSussex.co.uk의 목표 [2]독자가 초등학생이기 때문에 어려운 과제였습니다."
  • 2008년 뉴질랜드 와카타네 마을의 무료 무선 서비스 필터는 필터의 음성 분석 결과 "whak"이 빌어먹을 소리처럼 들렸기 때문에 마을 이름과 관련된 검색을 차단했다. 마을 이름은 마오리어로, 마오리어로 "which"는 /f/로 가장 일반적으로 발음된다.그 후 마을은 필터의 [13]화이트리스트에 마을 이름을 올렸습니다.
  • 2011년 7월 시나 웨이보 마이크로블로그 사이트에서 장쩌민중국 공산당 총서기가 사망했다는 주장이 제기되면서 장쩌민이라는 이름의 중국 내 웹 검색이 차단됐다.강이라는 뜻의 장(江)이 같은 한자(江)로 쓰여 있어 창장(長江)을 비롯한 하천 관련 검색에서는 관련 법규 및 정책에 따라 이 검색 [14]결과를 표시할 수 없다는 메시지가 나왔다.
  • 2018년 2월 구글이 구글의 정책을 [15]위반하는 무기와 액세서리에 대한 결과를 표시하는 검색 시스템을 서둘러 수정한 후, 구글의 쇼핑 플랫폼에서의 웹 검색은 글루건, 건스 앤 로지스, 버건디 와인과 같은 품목에 대해 차단되었다.

차단된 이메일

  • 2001년에 야후! 메일HTML 이메일에서 사이트 스크립트가 발생할 가능성을 방지하기 위해 JavaScript 관련 문자열을 대체 버전으로 자동 대체하는 이메일 필터를 도입했습니다.필터는 "라는 용어를 하이픈으로 표시합니다.JavaScript", "JScript", "VBScript" 및 "LiveScript"; 및 치환 "eval", "mocha" 및 "expression"비슷하지만 동의어는 아니다.review", "espresso" 및 "statement" " 를 참조해 주세요.필터의 기입에는, 이러한 문자열 치환을 다음의 값으로 제한하려는 시도는 없었습니다.anchor script일부 허점을 남길 수 있도록 섹션과 속성 또는 단어 경계를 존중합니다.이것은 중세 [16][17][18]대신 미디어뷰와 같은 오류를 초래했다.
  • 2003년 2월 영국 하원의원들새로운 스팸 필터가 당시 논의 중인 성범죄 법안에 대한 언급과 [19]검열에 관한 자민당의 협의 문서에 관한 몇 가지 메시지를 포함한 이메일을 차단하고 있다는 것을 발견했다.또한 웨일즈어를 [20]인식하지 못했기 때문에 웨일즈어로 보낸 이메일을 차단했다.
  • 2004년 10월, 런던의 Horniman Museum은 필터가 이름을 horny man이라는 단어의 변형으로 잘못 취급했기 때문에 일부 이메일을 받지 못했다고 보고되었다.Horny는 "성적으로 흥분하거나 자극적인"[21]을 뜻하는 일반적인 속어이다.

여러 의미를 가진 단어에 대해 차단됨

  • 2004년 10월, 영국의 노리치 출신의 교사가 보낸 팬터마임 딕 휘팅턴의 광고 이메일은 때때로 음경의 [22]속어로 사용되는 딕이라는 이름의 사용 때문에 학교 컴퓨터에 의해 차단되었다.
  • 2006년 5월, 영국 맨체스터의 한 남성은 지역 의회에 계획 신청에 대해 불평하기 위해 쓴 이메일이 [23]구조물을 언급할 때 "기립"이라는 단어가 포함되어 있어 차단되었다는 것을 발견했다.
  • 위니펙기반을 둔 잡지인 The Beaver와 관련된 이메일과 웹 검색 차단으로 인해 출판사는 89년간의 [24][25]출판 후 2010년에 Canada's History로 이름을 바꾸게 되었다.출판사 데보라 모리슨은 "1920년에 비버는 완벽하게 적절한 이름이었다.다른 뜻은 [vulva]가 전혀 새로운 것이 아니지만, 인터넷의 발전과 함께 그 모호성은 완전히 새로운 도전이 되기 시작했습니다.그 이름이 우리의 성장을 방해했다.[26]
  • 2010년 6월 트위터는 계정을 개설하고 첫 트윗을 올린 지 29분 만에 룩셈부르크 사용자를 차단했다.트윗에는 "드디어! 가슴(파루스 메이저) 한 쌍이 내 새집에 입주했다.그 트윗이 새에 관한 것이라는 것을 지적하기 위한 라틴어 이름을 포함했음에도 불구하고, 그 계정을 차단 해제하려는 어떠한 시도도 [27]헛수고였다.
  • 2011년, 더들리의 한 의원은 검은 시골 음식 호모(미트볼의 일종이지만 게이 [28]남성을 경멸하는 용어이기도 한)에 대해 언급한 후 의회 보안 소프트웨어에 의해 불경죄로 플래그가 찍힌 이메일을 발견했다.
  • 사우스요크셔의 페니스톤 주민들은 마을 이름에 음경[29]포함되어 있어 이메일을 차단당했다.
  • 클리테로(영국 랭커셔주) 주민들은 마을 이름에 클리토리스[30]줄임말인 서브스트링 클리트가 포함되어 있어 거듭 불편을 겪고 있다.
  • cum laude, summa cum laude, magna cum laude 라틴어 우등 졸업에 대한 언급이 포함된 이력서는 (이 용법에서는) 라틴어cum이 포함되어 있기 때문에 스팸 필터에 의해 차단되어 왔지만, 영어 용법에서는 정액이나 사정 등의 [31]속어로 사용되기도 합니다.

뉴스 기사

  • 2008년 6월, 반LGBT 미국 가족 협회에 의해 운영되는 뉴스 사이트는 단거리 선수 타이슨 게이에 대한 AP통신 기사를 걸러내 "게이"를 "동성애자"로 대체함으로써 그의 이름을 "타이슨 동성애자"[32][33]로 만들었다.이 기능은 이전에 농구 선수인 루디 게이(Rudy Gay)의 이름을 "Rudy Honyual"[34]로 변경했다.
  • 단어 또는 문자열 "assign"은 "butt"로 대체될 수 있으며, "classic"은 "cluttic", "assignment"는 "buttuttic", "assignate"[35]는 "buttuttic"으로 대체될 수 있습니다.

다른.

  • 2008년 마이크로소프트는 성적 성향에 관련된 단어 사용을 금지하는 정책이 리처드 게이우드의 이름이 불쾌하게 여겨져 그의 "게이머태그"나 그의 이력 "[36]실명" 분야에서 사용될 수 없음을 확인했습니다.
  • 2011년, 비디오 게임 포켓몬 블랙과 화이트에서 포켓몬 코파그리거스는 종명에 서브스트링 게이지를 포함하고 있기 때문에 별명 없이 온라인에서 다른 플레이어와 거래될 수 없었다.이 시스템은 이후 별명 없이 포켓몬을 교환할 수 있도록 업데이트 되었다.Nosepass, ProbopassFroslass에서도 서브스트링 [citation needed]어스가 포함되어 있기 때문에 동일한 문제가 발생했습니다.
  • 2013년 스웨덴 파룬궁의 이름을 딴 파일 전송은 중국에 본사를 둔 Diakrit의 웹 연결을 중단시켰다.Diakrit은 파일명을 변경하여 문제를 해결했다.디아크릿의 프레드릭 버그만은 이 파일 이름이 중국에서 [37]설립된 금지된 종교 운동인 파룬궁에 대한 논의를 차단하기 위해 사용된 만리장성 검열을 촉발시켰다고 믿고 있다.
  • 2013년 11월, 페이스북은 영국 사용자들이 [38]같은 이름의 전통 음식을 언급하며 faggot이라는 단어를 사용하는 것을 일시적으로 차단했다.
  • 2014년 1월 온라인 게임 리그 오브 레전드(League of Legends)에서 사용되는 파일이 'Varus Expiration'이라는 이름으로 인해 일부 영국 ISP 필터에 의해 차단되었다고 합니다.Timer.luaobj' 및 'XerathMageChainsExtended'입니다.substring sex를 포함하는 luaobj'입니다.이것은 나중에 [39]수정되었습니다.
  • 2018년 5월, 식료품점 Publix의 웹사이트는 라틴어 summa cum laude가 들어간 케이크를 주문하는 것을 허용하지 않았다.고객은 특별한 지시사항을 포함하여 문제를 해결하려고 했지만, 결국 "Summa ---Laude"[40][41]라고 적힌 케이크가 나왔습니다.
  • 2020년 5월, 언론의 광범위한 조사에도 불구하고, 영국의 정치 고문인 도미닉 커밍스를 직접적으로 지칭하는 해시태그서브스트링과 함께 안티 [42]폰 필터를 트리거했기 때문에 트위터에서 트렌드를 형성할 수 없었다.
  • 2020년 10월, 트위터 불경 필터는 고생물학 [43]컨퍼런스에서 "뼈", "퍼빅", "스트림"이라는 단어를 금지시켰다.
  • 2021년 1월 페이스북은 데본의 랜드마크인 플리머스 호를 여성 [44]혐오적이라고 잘못 표기한 후 사용자들을 음해하고 금지한 것에 대해 사과했다.
  • 2021년 4월, 프랑스 비트슈의 공식 페이스북 페이지가 삭제되었다.이에 대해 코뮤니티 관계자들은 우편번호인 Mairie 57230을 참조하는 새로운 페이지를 만들었다.페이스북은 나중에 사과하고 원래 페이지를 복원했다.예방책으로, Rohrbach-lés-Bitche의 관계자들은 페이스북 페이지의 이름을 Ville de Rohrbach로 [45][46]바꾸었다.

「 」를 참조해 주세요.

레퍼런스

  1. ^ Clive Feather (25 April 1996). Peter G. Neumann (ed.). "AOL censors British town's name!". The Risks Digest. 18 (7).
  2. ^ a b McCullagh, Declan (23 April 2004). "Google's chastity belt too tight". CNET. Archived from the original on 16 June 2011.
  3. ^ Oberhaus, Daniel (29 August 2018). "Life on the Internet Is Hard When Your Last Name is 'Butts'". Vice. Retrieved 31 July 2022.
  4. ^ Gellis, Cathy (31 August 2018). "The Scunthorpe Problem, And Why AI Is Not A Silver Bullet For Moderating Platform Content At Scale". Techdirt. Retrieved 31 July 2022.
  5. ^ Veale, Tony (2021). Your Wit Is My Command: Building AIs with a Sense of Humor. MIT Press. p. 231. ISBN 978-0-262-04599-5. OCLC 1221016857.
  6. ^ Festa, Paul (27 April 1998). "Food domain found "obscene"". News.com. Archived from the original on 10 May 2020.
  7. ^ "Foire aux questions". radio-canada.ca. Archived from the original on 21 October 2012. Retrieved 24 February 2011.
  8. ^ Barker, Garry (26 February 2004). "How Mr C0ckburn fought spam". The Sydney Morning Herald. Archived from the original on 3 September 2009.
  9. ^ Cockburn, Craig (9 March 2010). "BBC fail – my correct name is not permitted". blog.siliconglen.com. Archived from the original on 30 September 2020.
  10. ^ "Is Yahoo Banning Allah?". Kallahar's Place. Archived from the original on 14 January 2016. Retrieved 24 February 2011.
  11. ^ Rubin, Daniel. "When your name gets turned against you". The Philadelphia Inquirer. Archived from the original on 5 August 2008. Retrieved 3 August 2008.
  12. ^ "E-Rate And Filtering: 어린이 인터넷 보호법의 재검토"의회 청문회일반.에너지 및 상업, 전기통신 및 인터넷에 관한 소위원회.2001년 4월 4일
  13. ^ "F-Word Town's Name Gets Censored By Internet Filter". Archived from the original on 1 December 2008. Retrieved 27 July 2011.{{cite news}}: CS1 maint: bot: 원래 URL 상태를 알 수 없습니다(링크).
  14. ^ Chin, Josh (6 July 2011). "Following Jiang Death Rumors, China's Rivers Go Missing". The Wall Street Journal. Archived from the original on 13 August 2011.
  15. ^ Molloy, Mark (27 February 2018). "Wine lovers cannot buy Burgundy tipple on Google as internet giant cracks down on 'gun' searches". The Telegraph. Archived from the original on 2 March 2018. Retrieved 27 February 2018.
  16. ^ "Yahoo admits mangling e-mail". BBC News. 19 July 2002. Archived from the original on 26 January 2021. Retrieved 21 June 2013.
  17. ^ "Hard news". Need To Know 2002-07-12. 12 July 2002. Retrieved 21 June 2013.
  18. ^ Knight, Will (15 July 2002). "Email security filter spawns new words". New Scientist. Archived from the original on 24 September 2020. Retrieved 21 June 2013.
  19. ^ "E-mail vetting blocks MPs' sex debate". BBC News. 4 February 2003. Archived from the original on 4 February 2021.
  20. ^ "Software blocks MPs' Welsh e-mail". BBC News. 5 February 2003. Archived from the original on 4 February 2021.
  21. ^ Kwintner, Adrian (5 October 2004). "Name of museum is confused with porn". News Shopper.
  22. ^ Jones, Sam (13 October 2004). "Panto email falls foul of filth filter". The Guardian. Archived from the original on 4 February 2021.
  23. ^ "E-mail filter blocks 'erection'". 30 May 2006. Archived from the original on 4 February 2021.
  24. ^ "The Beaver mag renamed to end porn mix-up". The Sydney Morning Herald. Agence France-Presse. 13 January 2010. Archived from the original on 9 November 2020. Retrieved 24 February 2021.
  25. ^ Austen, Ian (24 January 2010). "Web Filters Cause Name Change for a Magazine". The New York Times. Archived from the original on 9 November 2020. Retrieved 24 February 2021.
  26. ^ Sheerin, Jude (29 March 2010). "How spam filters dictated Canadian magazine's fate". BBC News. Archived from the original on 16 January 2021.
  27. ^ "Luxemburger Twitter-Neubenutzer nach 29 Minuten blockiert" [Luxembourg new Twitter user blocked after 29 minutes]. Tageblatt (in German). 22 June 2010. Retrieved 12 June 2010.[데드링크]
  28. ^ "Black Country Councillor Caught up in Faggots Farce". Birmingham Mail. 24 February 2011.
  29. ^ Tom Chatfield (17 April 2013). "The 10 best words the internet has given English". The Guardian.
  30. ^ Keyes, Ralph (2010). Unmentionables: From Family Jewels to Friendly Fire – What We Say Instead of What We Mean. John Murray. ISBN 978-1-84854-456-7.
  31. ^ Maher, Kris. "Don't Let Spam Filters Snatch Your Resume". Career Journal. Archived from the original on 23 October 2006. Retrieved 11 February 2008.
  32. ^ Frauenfelder, Mark (30 June 2008). "Homophobic news site changes athlete Tyson Gay to Tyson Homosexual". Boing Boing. Archived from the original on 4 February 2021.
  33. ^ Arthur, Charles (30 June 2008). "Computer autocorrects surname 'gay' to.. no, you guess". The Guardian. Archived from the original on 13 November 2020.
  34. ^ Mantyla, Kyle (30 June 2008). "The Dangers of Auto-Replace". Right Wing Watch. People for the American Way. Archived from the original on 25 October 2020. Retrieved 24 February 2021.
  35. ^ Moore, Matthew (2 September 2008). "The Clbuttic Mistake: When obscenity filters go wrong". The Telegraph. Archived from the original on 23 February 2020.
  36. ^ "Microsoft Confirms "Gaywood" Is An Offensive Surname, Mr. Gaywood Responds". May 2008. Archived from the original on 9 November 2012.
  37. ^ Mozur, Paul; Tejada, Carlos (13 February 2013). "China's 'Wall' Hits Business". The Wall Street Journal. Archived from the original on 10 September 2013. Retrieved 25 May 2013.
  38. ^ "Faggots and peas fall foul of Facebook censors". Express & Star. November 2013. Archived from the original on 10 May 2020.
  39. ^ Gibbs, Samuel (21 January 2014). "UK porn filter blocks game update that contained 'sex'". The Guardian. London. Archived from the original on 11 November 2020.
  40. ^ Ferguson, Amber (22 May 2018). "Proud mom orders 'Summa Cum Laude' cake online. Publix censors it: Summa … Laude". The Washington Post. Archived from the original on 24 February 2021. Retrieved 22 May 2018.
  41. ^ Amatulli, Jenna (22 May 2018). "Publix Censors Teen's 'Summa Cum Laude' Graduation Cake". The Huffington Post. Archived from the original on 5 September 2018.
  42. ^ Hern, Alex (27 May 2020). "Anti-porn filters stop Dominic Cummings trending on Twitter". The Guardian. Archived from the original on 20 February 2021.
  43. ^ Ferreira, Becky (15 October 2020). "A Profanity Filter Banned the Word 'bone' at a Paleontology Conference". Motherboard. Archived from the original on 23 February 2021.
  44. ^ Morris, Steven (27 January 2021). "Facebook apologises for flagging Plymouth Hoe as offensive term". The Guardian. Archived from the original on 29 January 2021.
  45. ^ Kempf, Cédric (12 April 2021). "Insolite : Bitche est censuré par Facebook". Radio Mélodie (in French).
  46. ^ Darmanin, Jules (13 April 2021). "Facebook takes down official page for French town of Bitche". POLITICO. Retrieved 3 July 2021.