El problema de Scunthorpe és el bloqueig involuntari de llocs web, correus electrònics, publicacions en fòrums o resultats de cerca per part d'un filtre de spam o un motor de cerca degut a que el seu text conté una cadena de lletres que semblen tenir un significat obscè o inacceptable. Els noms, les abreviatures i els termes tècnics se citen amb major freqüència com afectats pel problema.
El problema sorgeix perquè les computadores poden identificar fàcilment cadenes de text dins d'un document, però interpretar paraules d'aquest tipus requereix una habilitat considerable per a interpretar una àmplia gamma de contextos, la qual cosa és una tasca extremadament difícil. Com a resultat, les àmplies regles de bloqueig poden generar falsos positius que afectin frases innocents.
Etimologia i origen
El problema va rebre el seu nom d'un incident en 1996 en el qual el filtre de blasfèmies de AOL va impedir que els residents de la ciutat de Scunthorpe, North Lincolnshire, Anglaterra, creessin comptes amb AOL, perquè el nom de la ciutat conté la subcadena "cunt" (una manera vulgar en anglès de referir-se a la vagina i que a més s'utilitza com a insult).[1] A principis de la dècada dels 2000, els filtres SafeSearch opcionals de Google van cometre el mateix error, i els serveis i empreses locals que incloïen a Scunthorpe en els seus noms o URL es trobaven entre els exclosos d'aparèixer en els resultats de cerca[2]
Solucions alternatives
El problema de Scunthorpe és difícil de resoldre per complet a causa de la dificultat de crear un filtre capaç de comprendre paraules en context.[3][4] Una solució consisteix a crear una llista blanca de falsos positius coneguts. El filtre pot ignorar qualsevol paraula que aparegui en la llista, encara que contingui text que d'una altra manera no estaria permès.[5]
Altres exemples
Noms de domini web i registres de comptes rebutjats
L'abril del 1998, Jeff Gold va intentar registrar el nom de dominishitakemushrooms.com, però a causa de la subcadena "shit" (merda), va ser bloquejat per un filtre de InterNIC que prohibia les "set paraules brutes".[6] (Shiitake (en català Xiitake), també comunament escrit shitake, és el nom japonès del fong comestible Lentinula edodes.)
En 2000, una notícia de la televisió canadenca sobre el programari de filtrat web va descobrir que el lloc web de la Comunitat Urbana de Mont-real (Communauté Urbaine de Montréal, en francès) estava completament bloquejat perquè el seu nom de domini era el seu acrònim francès CUM (www.cum.qc.ca); "cum", que entre altres significats, és l'argot de l'idioma anglès per a semen.[7]
Al febrer de 2004 a Escòcia, Craig Cockburn va informar que no podia usar el seu cognom (pronunciat "Coburn") a Hotmail perquè conté la subcadena "cock", una paraula vulgar per a referir-se al penis. D'altra banda, va tenir problemes amb el correu electrònic del seu lloc de treball perquè el seu càrrec, "programari specialist" (especialista en programari), contenia la subcadena cialis, un medicament per a la disfunció erèctil que s'esmenta comunament en els correus electrònics no desitjats. Hotmail inicialment li va dir que lletregés el seu nom C0ckburn (amb un zero en lloc de la lletra "o"), però després va revertir la prohibició.[8] En 2010, va tenir un problema similar en registrar-se en el lloc web de la BBC, on novament els primers quatre caràcters del seu cognom van causar un problema per al filtre de contingut.[9]
Al febrer de 2006, a Linda Callahan se li va impedir inicialment registrar el seu nom en Yahoo! com una adreça de correu electrònic, ja que contenia la subcadena "allah". Yahoo! més tard va revocar la prohibició.[10]
Al juliol de 2008, el Dr. Herman I. Libshitz no va poder registrar una adreça de correu electrònic amb el seu nom en Verizon perquè el seu cognom contenia la subcadena "shit" (merda) i Verizon inicialment va rebutjar la seva sol·licitud d'excepció. En una declaració posterior, una portaveu de Verizon es va disculpar per no aprovar la seva adreça de correu electrònic desitjada.[11]
El cadena "kunt" també està prohibit per al registre en Wikimedia. Les persones de Lakuntza no poden crear comptes usant el seu nom d'ubicació; de manera similar, no es pot utilitzar la paraula "hezkuntza" (educació), paraula habitual a l'hora de crear comptes des del col·legi.
Cerques web bloquejades
En els mesos previs a gener de 1996, es van filtrar algunes cerques web de Super Bowl XXX, perquè el número romà per al joc i el lloc (XXX) també s'usa per a identificar pornografia.[12]
Gareth Roelofse, el dissenyador web de Romansinsussex.co.uk, va assenyalar en 2004: "Trobem moltes estacions d'Internet de biblioteques, xarxes escolars i cibercafés que bloquegen llocs amb la paraula 'sexe' en el nom de domini. Aquest va ser un desafiament per a Romansinsussex.co.uk perquè el seu públic objectiu són els nens en edat escolar".[13]
En 2008, el filtre del servei sense fil gratuït de la ciutat de Whakatane a Nova Zelanda va bloquejar les cerques que involucraven el propi nom de la ciutat perquè l'anàlisi fonètica del filtre va considerar que "whak" sonava com "fuck"; el nom de la ciutat està en maori, i en l'idioma maori "wh" es pronuncia més comunament com a /f / . Posteriorment, la ciutat va col·locar el nom de la ciutat en la llista blanca del filtre.[14]
Al juliol de 2011, les cerques en la web a la Xina sobre el nom Jiang van ser bloquejades després d'afirmacions en el lloc de microblogging Sina Weibo que l'exsecretari general del Partit Comunista Xinès (PCCh), Jiang Zemin, havia mort. Atès que la paraula "Jiang", que significa "riu", està escrita amb el mateix caràcter xinès (江), les cerques relacionades amb rius, inclòs el Yangtze (Cháng Jiāng), van generar el missatge: "D'acord amb les lleis, reglaments i polítiques pertinents, els resultats d'aquesta cerca no es pot mostrar".[15]
Al febrer de 2018, les cerques web en la plataforma de compres de Google es van bloquejar per a articles com a pistoles de cola, Guns N' Roses (conté gun en el nom) i vi de Borgonya (borgonya, en anglès burgundy, conté "gun") després que Google parchó precipitadament el seu sistema de cerca que mostrava resultats d'armes i accessoris que violaven les polítiques establertes de Google.[16]
Correus electrònics bloquejats
Al febrer de 2003, els membres del Parlament en la Cambra dels Comuns del Regne Unit van descobrir que un nou filtre de spam estava bloquejant els correus electrònics que contenien referències al projecte de llei de delictes sexuals que s'estava debatent en aquest moment, així com alguns missatges relacionats amb un document de consulta dels liberals demòcrates sobre la censura.[17] També va bloquejar els correus electrònics enviats en gal·lès perquè no reconeixia l'idioma.[18]
A l'octubre de 2004, es va informar que el Museu Horniman de Londres no estava rebent alguns dels seus correus electrònics perquè els filtres van tractar erròniament el seu nom com una versió de les paraules "horny man".[19]
Bloquejat per paraules amb múltiples significats
Al maig de 2006, un home a Manchester (Regne Unit) va descobrir que els correus electrònics que va escriure al seu ajuntament per a queixar-se d'una sol·licitud de planificació havien estat bloquejats perquè contenien la paraula "erecció" quan es referien a una estructura.[20]
Els correus electrònics bloquejats i les cerques en la web relacionades amb The Beaver, una revista amb seu en Winnipeg, van fer que l'editorial canviés el seu nom a Canada's History en 2010, després de 89 anys de publicació.[21][22] L'editora Deborah Morrison va comentar: "En 1920, The Beaver era un nom perfectament apropiat. I encara que el seu altre significat [vulva] no és res nou, la seva ambigüitat va començar a plantejar un desafiament completament nou amb l'avanç d'Internet. El nom es va convertir en un impediment per al nostre creixement".[23]
En 2011, un regidor en Dudley va trobar un correu electrònic marcat com a blasfem pel programari de seguretat del seu consell després d'esmentar fagots, un plat de Black Country (són un tipus de mandonguilles, però també un terme pejoratiu per als homes homosexuals).[24]
Els correus electrònics dels residents de Penistone en South Yorkshire han estat bloquejats perquè el nom de la ciutat inclou la subcadena peni.[25]
Els residents de Clitheroe (Lancashire, Anglaterra) han estat molestats repetidament perquè el nom de la seva ciutat inclou la subcadena "clit", que és l'abreviatura de "clítoris".[26]
Els currículums que contenen referències a graduar-se amb honors en llatí, com cum laude, magna cum laude i summa cum laude, han estat bloquejats pels filtres de spam a causa de la inclusió de la paraula cum, que en llatí significa amb (en aquest ús), però a vegades s'usa com a argot per a semen o ejaculació en anglès.[27]
Articles de notícies
Al juny de 2008, un lloc de notícies dirigit pel grup anti-LGBT American Family Association va filtrar un article de Associated Press sobre el velocista Tyson Gay, reemplaçant les instàncies de "gai" per "homosexual", donant així el seu nom com "Tyson Homosexual".[28] Aquesta mateixa funció havia canviat prèviament el nom del jugador de bàsquet Rudy Gay a "Rudy Homosexual".[29]
Altres
A l'abril de 2021, es va eliminar la pàgina oficial de Facebook de la Comuna francesa de Bitche. En resposta, els funcionaris de la comuna van crear una nova pàgina que fa referència al codi postal, Mairie 57230. Facebook després es va disculpar i va restaurar la pàgina original. Com a mesura de precaució, els funcionaris de Rohrbach-lès-Bitche van canviar el nom de la seva pàgina de Facebook a Ville de Rohrbach.[30][31]