Zdroj: Electronic Frontier Foundation
Foto 360b/Shutterstock
Dnes, Google zahájena „origin trial“ Federated Learning of Cohorts (aka stádo), jeho experimentální nová technologie pro cílení reklam. V milionech instancí prohlížeče Google Chrome byl v tichosti přepnut přepínač: tyto prohlížeče začnou své uživatele třídit do skupin podle chování a poté sdílet štítky skupin se sledovacími nástroji třetích stran a inzerenty po celém webu. Pro zkušební verzi byla vybrána náhodná skupina uživatelů, kteří se v současné době mohou odhlásit pouze do zakázání cookies třetích stran.
Ačkoli Google oznámila, to se blížilo, společnost byla až doteď skoupá na podrobnosti o soudu. Probrali jsme to blogu, e-mailové konference, návrhy webových standardů, a Zdrojový kód prohlížeče Chromium abychom přesně zjistili, co se děje.
EFF to už napsal FLoC je hrozný nápad. Zahájení této zkušební verze společností Google – bez upozornění jednotlivcům, kteří budou součástí testu, natož jejich souhlasu – je konkrétním porušením důvěry uživatelů ve služby technologie, která by neměla existovat.
Níže popisujeme, jak bude tato zkušební verze fungovat, a některé z nejdůležitějších technických podrobností, které jsme se dosud dozvěděli.
FLoC má nahradit soubory cookie. V pokusu je doplní.
Google navrhl FLoC, aby pomohl inzerentům zacílit reklamy, jakmile budou reklamy třetí strany cookies odejít. Během zkušebního období budou sledovači moci sbírat FLoC ID Kromě toho na soubory cookie třetích stran.
To znamená, že všichni sledovači, kteří aktuálně sledují vaše chování na zlomku webu pomocí souborů cookie, nyní obdrží také vaše ID kohorty FLoC. ID kohorty je přímým odrazem vašeho chování na webu. To by mohlo doplnit profily chování, které již mnoho sledovačů udržuje.
Zkušební verze se dotkne až 5 % uživatelů Chrome po celém světě.
Bylo nám řečeno, že zkušební verze je v současné době nasazena pro 0.5 % uživatelů Chrome v některých regionech – prozatím to znamená Austrálie, Brazílie, Kanada, Indie, Indonésie, Japonsko, Mexiko, Nový Zéland, Filipíny a uživatelé v USA. ve vhodných regionech budou vybrány zcela náhodně, bez ohledu na většinu nastavení reklam a soukromí. Ve výchozím nastavení budou odhlášeni pouze uživatelé, kteří v prohlížeči Chrome vypnuli soubory cookie třetích stran.
Kromě toho má tým za FLoC požadováno že Google navýšil vzorek na 5 % uživatelů, aby společnosti zabývající se reklamními technologiemi mohly lépe trénovat modely pomocí nových dat. Pokud bude žádosti vyhověno, budou do zkušební verze zařazeny další desítky nebo stovky milionů uživatelů.
Uživatelé byli do zkušební verze zapsáni automaticky. Neexistuje žádné vyhrazené odhlášení (zatím).
Jak je popsáno výše, náhodná část uživatelů Chrome bude do zkušební verze zaregistrována bez upozornění, natož souhlasu. Tito uživatelé nebudou vyzváni, aby se přihlásili. V aktuální verzi Chromu se uživatelé mohou odhlásit ze zkušební verze pouze do vypnutí všech souborů cookie třetích stran.
Budoucí verze Chromu budou přidány vyhrazené ovládací prvky pro „izolovaný prostor ochrany osobních údajů společnosti Google“ včetně FLoC. Není však jasné, kdy tato nastavení začnou fungovat, a uživatelé, kteří chtějí vypnout FLoC, musí také vypnout soubory cookie třetích stran.
Vypnutí souborů cookie třetích stran není obecně špatný nápad. Koneckonců, soubory cookie jsou jádrem problémů s ochranou soukromí, které chce Google podle svých slov řešit. Úplné vypnutí je však hrubé protiopatření a narušuje mnoho vymožeností (jako je jednotné přihlášení), na které uživatelé webu spoléhají. Mnoho uživatelů Chromu, kteří dbají na ochranu soukromí, používá cílenější nástroje, včetně rozšíření jako Ochrana soukromí Badger, abyste zabránili sledování založenému na souborech cookie. Rozšíření pro Chrome zatím bohužel nemohou kontrolovat, zda uživatel zpřístupní FLoC ID.
Webové stránky také nejsou požádány o přihlášení.
FLoC vypočítá štítek na základě vaší historie procházení. Ve zkušební verzi Google jako výchozí použije každý web, který zobrazuje reklamy– což je většina stránek na webu. Weby se mohou odhlásit ze zahrnutí do výpočtů FLoC odesláním hlavičky HTTP, ale někteří poskytovatelé hostingu nedávají svým zákazníkům přímou kontrolu nad hlavičkami. Mnoho majitelů stránek si o zkušební verzi nemusí vůbec být vědomo.
To je problém, protože to znamená, že weby ztrácejí určitou kontrolu nad tím, jak jsou zpracovávána data jejich návštěvníků. Právě teď se musí správce webu vědomě rozhodnout, že na svou stránku začlení kód od inzerenta. Weby si mohou, alespoň teoreticky, vybrat partnerství s inzerenty na základě jejich zásad ochrany osobních údajů. Nyní však budou informace o návštěvě uživatele na tomto webu zabaleny do jeho FLoC ID, které bude široce dostupné (více o tom v další části). I když má webová stránka přísné zásady ochrany osobních údajů a vztahy s odpovědnými inzerenty, jejich návštěva může ovlivnit to, jak vás sledovači vidí v jiných kontextech.
FLoC ID každého uživatele – štítek, který odráží historii jeho procházení za poslední týden – bude k dispozici všem webovým stránkám nebo trackerům, kteří je budou chtít.
Kdokoliv může registrovat pro zkušební verzi Chrome. Poté může přistupovat k FLoC ID pro uživatele, kteří byli vybráni pro zkušební verzi, kdykoli může spouštět JavaScript. To zahrnuje rozsáhlý ekosystém bezejmenných inzerentů, ke kterým se váš prohlížeč připojí, kdykoli navštívíte většinu stránek zobrazujících reklamy. Pokud jste součástí zkušební verze, desítky společností mohou získat vaše FLoC ID z každého webu, který navštívíte.
K dispozici bude více než 33,000 XNUMX možných kohort.
Jedna z nejdůležitějších částí specifikace FLoC, která zůstala nedefinována, je přesně to, kolik kohort existuje. Google spustil a předběžný experiment s 8bitovými ID kohort, což znamenalo, že existovalo pouze 256 možných skupin. To omezilo množství informací, které by se sledovací nástroje mohly naučit z ID kohorty uživatele.
Zkoumání nejnovější verze prohlížeče Chrome však odhalilo, že živá verze FLoC používá 50bitové identifikátory kohorty. Kohorty se pak spojí do 33,872 100 celkových kohort, což je více než XNUMXkrát více než v prvním experimentu Google. Google řekl, že zajistí „tisíce” lidí jsou seskupeny do každé kohorty, takže nelze nikoho identifikovat pomocí samotné kohorty. Ale ID kohorty budou stále odhalovat spoustu nových informací – kolem 15 bitů— a dá otisky prstů masivní noha nahoru.
Soud pravděpodobně potrvá do července.
Každý sledovač, inzerent nebo jiná třetí strana se může přihlásit prostřednictvím Portál Origin Trial společnosti Google začít shromažďovat FLoC od uživatelů. Stránka aktuálně uvádí, že zkušební verze může trvat až do 13. července. Google také objasnil, že přesné detaily technologie – včetně způsobu výpočtu kohort – se budou měnit a mohli jsme vidět několik iterací seskupovacího algoritmu FLoC. mezi dneškem a tím.
Google plánuje audit FLoC pro korelace s „citlivými kategoriemi“. Stále tomu chybí větší obrázek.
Google se zavázal zajistit, že kohorty nebudou příliš úzce korelovány s „citlivé kategorie“ jako rasa, sexualita nebo zdravotní stavy. Aby to bylo možné sledovat, Google plánuje shromažďovat data o tom, které stránky uživatelé v jednotlivých kohortách navštěvují. Vydalo a whitepaper popisující svůj přístup.
Jsme rádi, že vidíme konkrétní návrh, ale whitepaper obchází nejpalčivější problémy. Otázka, kterou by měl Google řešit, je „můžete cílit na lidi ve zranitelných skupinách“; whitepaper to omezuje na „můžete cílit na lidi, kteří navštívili konkrétní web“. To je nebezpečné přílišné zjednodušení. Spíše než pracovat na těžkém problému se Google rozhodl zaměřit se na jednodušší verzi, které věří umět řešit. Mezitím se nepodařilo vyřešit nejhorší potenciální škody FLoC.
Během zkušebního období bude každý uživatel, který zapnul „Chrome Sync“ (umožnil Googlu shromažďovat jeho historii prohlížení) a který nezakázal žádné z několika výchozích nastavení sdílení, sdílet své ID kohorty připojené k jeho historii prohlížení se společností Google.
Google poté zkontroluje, zda každý uživatel nenavštívil nějaké stránky, které považuje za součást „citlivé kategorie“. WebMD může být například označen v kategorii „lékařské“ nebo PornHub v kategorii „pro dospělé“. Pokud příliš mnoho uživatelů v jedné kohortě navštívilo určitý druh „citlivého“ webu, Google tuto kohortu zablokuje. Všichni uživatelé, kteří jsou součástí „citlivých“ kohort, budou místo toho umístěni do „prázdné“ kohorty. Samozřejmě, sledovači budou stále moci vidět, že uvedení uživatelé jsou součástí „prázdné“ kohorty, což odhalí, že byli původně klasifikováni jako nějaký druh „citlivých“.
U původního testu se Google při provádění auditu spoléhá na svou obrovskou mezipaměť personalizovaných údajů o prohlížení. V budoucnu Google plánuje použít jiné technologie na ochranu soukromí dělat totéž, aniž byste znali historii prohlížení jednotlivců.
Bez ohledu na to, jak to Google dělá, tento plán nevyřeší větší problémy s FLoC, diskriminací a predátorským cílením. Návrh spočívá na předpokladu, že lidé v „citlivých kategoriích“ navštíví konkrétní „citlivé“ webové stránky a že lidé, kteří nejsou v těchto skupinách, nebudou navštěvovat uvedené stránky. Ale chování neintuitivně koreluje s demografickými údaji. Je vysoce pravděpodobné, že určité demografické skupiny navštíví jinou podmnožinu webu než jiné demografické skupiny a že takové chování nebude zachyceno rámováním „citlivých stránek“ Google. Lidé s depresí mohou například vykazovat podobné chování při prohlížení, ale ne nutně prostřednictvím něčeho tak explicitního a přímého, jako je například návštěva „depression.org“. Mezitím jsou sledovací společnosti dobře vybaveny k tomu, aby shromažďovaly provoz od milionů uživatelů, propojovaly je s údaji o demografii nebo chování a dekódovaly, které kohorty jsou spojeny s jakými citlivými vlastnostmi. Systém Google založený na webových stránkách, jak je navržen, to nemůže nijak zastavit.
Jak jsme řekli před, „Google se může rozhodnout demontovat staré lešení pro sledování, aniž by je nahradil něčím novým a jedinečně škodlivým.“ Google nedokázal řešit škody způsobené FLoC, ani nás o tom přesvědčit umět být řešen. Místo toho spouští test, který bude sdílet nová data o milionech nic netušících uživatelů. To je další krok špatným směrem.
ZNetwork je financován výhradně ze štědrosti svých čtenářů.
Darovat