Budoucnost je v AI - 3 - GDPR vs. AI

Uplatnění GDPR na AI přináší mnoho otázek. Jde o osobní nebo anonymní data, jaké jsou role a povinnosti účastníků a co je standardní a nestandardní provoz AI systému?

Budoucnost je v AI - 3 - GDPR vs. AI

Vztah mezi dnešními AI nástroji a GDPR je jakýkoli, jen ne idylický. GDPR má již svůj věk a snažil se být technologicky neutrálním předpisem, který postihne všechno. V důsledku pak jsou mnohé požadavky GDPR schematické a jsou ušité na míru jednoduchým až triviálním systémům a aplikacím, u nichž se předpokládá, že jeden zpracovatelský proces rovná se jedna aplikace či databáze.

Bohužel v případě jejich aplikace na komplexnější softwarová řešení či platformy je nutné pro mnohé požadavky plynoucí z GDPR aplikovat dosti složitá intelektuálně-byrokratická cvičení. Komplikace do věci vnáší dále množství účastníků dodavatelského řetězce, kteří se podílí na provozu a používání AI systému. Ti pak z pohledu GDPR mohou mít různé kombinace rolí správce-zpracovatel, mohou se vyskytovat ve vícero zemích a mohou spadat pod různá smluvní ujednání a jurisdikce.

I pro dnes již obvyklé nástroje, jako je třeba cloudový CRM či sdílený repositář zdrojových kódů, představují některé lakonicky formulované požadavky GDPR nepříliš snadno řešitelný problém.

V případě typického AI systému lze konstatovat, že i menší AI řešení představují relativně komplikované a sofistikované systémy, jsou obvykle cloudové, provozované nadnárodními firmami, zahrnují přenosy osobních údajů z EU, často zahrnují zpracování zvláštních kategorií osobních údajů.

Z toho plyne, že například plnění požadavků na minimalizaci dat, slučitelnost účelů a dalších základních pilířů GDPR je nejen komplikované, ale navíc i obtížně měřitelné. Je obtížné nich neumí jasně a deterministicky popsat algoritmus použitý pro danou úlohu zadanou uživatelem, ani na úrovni platformy určit rizika pro práva a svobody subjektů údajů. Snad se tedy shodneme, že z pohledu GDPR je typický AI systém velmi komplexní, ale také zajímavý problém. Zcela správně také tušíte, že prostorů pro různé právní názory a případné pokuty se zde nachází množství větší než malé.

Jak z toho ven? Pojdme si to rozložit na činitele

Při rozboru problémů se za užitečnou pomůcku obvykle považuje rozložení problému na menší kousky. Při popisu problému je také šikovné vypomoct si přirovnáním k něčemu, co je všeobecně známé. A tímto se po můstku dostáváme k obrázku mistra Yódy na kole.

Tento obrázek jsem si vypůjčil od Daniela Dočekala, který jej publikoval na LinkedInu. Velmi se mi líbí, neboť, i když to autor zřejmě takto nezamýšlel, umožňuje krásně ilustrovat, jaké jsou hlavní aspekty dnes nejčastěji využívaných AI systémů z pohledu budoucího AI Actu a následně se jim postupně a zjednodušeně podívat na zoubek z pohledu GDPR.

Vidím zde následující aspekty:

  1. Mistr Yóda značí moudrost či znalost, kterou dovnitř AI systému vložil tvůrce.

  2. Kolo je technologií, která vloženou moudrost rozpohybovala. U technologie je nutné, aby využitý algoritmus byl dostatečně známý, řádně otestovaný a aby produkoval správné a očekávané výstupy.

  3. Rozmazané okolí naznačuje silniční síť a infrastrukturu, která reprezentuje natrénovanou znalost, která Yódovi umožní dojet z bodu A do bodu B, podobně jako mapa pomáhá cestovateli. Trénovací data musí být získána zákonným způsobem a nesmí trpět systematickými vadami.

  4. Sanitka reprezentuje bezpečnostní prvky, které do AI je nutné vložit proto, aby se nevymkla kontrole a byla v souladu s legislativou. Soulad je nutné pravidelně testovat. Nad AI také bude muset fungovat systém řízení kvality a provozovatel bude muset umět bezpečnost doložit.

  5. Registrační číslo kola značí registraci AI systému v databázi EU. Registrace zajistí, že AI systém a jeho provozovatel plní regulatorní pravidla a tedy také to, že je daný AI systém bezpečný pro uživatele.

  6. Posledním prvkem pak je člověk, který má detailní znalost problematiky, který z mnoha možných výstupů z AI nástroje vybral právě tento obrázek a tím validoval výstup z AI předtím, než jej zveřejnil, tedy zpřístupnil uživatelům.

Proč je to důležité?

Odstraníte-li u budoucí AI kteroukoli z těchto komponent a budete jej chtít provozovat v EU, pak sice možná získáte AI systém, který bude něco dělat, ale zároveň získáte i velký problém. Získáte nástroj, který nebude v souladu se evropským právem. Pokuty za porušení regulace podle poslední verze návrhu AI Actu mohou být až na 40M€ (či až 7% globálního obratu), ale také se můžete dostat do konfliktu s GDPR, za jehož porušení lze uložit pokuty až 20M€ (nebo až 4% obratu). A lze si snadno představit i kombinaci pokut podle obou předpisů.

Mnozí ze čtenářů pravděpodobně již dnes jsou v roli uživatele, poskytovatele nebo distributora AI systému, tak jak je vidí budoucí AI Act. Je velmi pravděpodobné, že si nejsou vědomi povinností, které jim z toho již brzy vzejdou.

Zároveň ale pro všechny stávající uživatele či provozovatele AI systémů již dnes platí mnoho nejen zákonných povinností. Například díky obvyklému způsobu trénování AI systému, které spočívá v "seškrábání" všech dostupných tematických dat z Internetu, již dnes jsme téměř všichni v roli subjektu údajů (ve smyslu článku 4 odst. 1 GDPR). A to obvykle nedobrovolně.

Jak při používání AI, tak při jejím trénování dochází ke sběru a zpracování velkých množství dat a jedním z klíčových aspektů pro posouzení souladu tak bude proces trénování AI. Nejprve ale stojí za vysvětlení otázka, jaké údaje vlastně AI systém zpracovává.

Jsou v AI systému osobní údaje?

Podle GDPR jsou „osobními údaji“ veškeré informace o identifikované nebo identifikovatelné fyzické osobě (dále jen „subjekt údajů“);

Z definice tedy identifikovatelnou fyzickou osobou je fyzická osoba, kterou lze přímo či nepřímo identifikovat, zejména odkazem na určitý identifikátor, například jméno, identifikační číslo, lokační údaje, síťový identifikátor nebo na jeden či více zvláštních prvků fyzické, fyziologické, genetické, psychické, ekonomické, kulturní nebo společenské identity této fyzické osoby.

Mnoho lidí, a to bohužel i v IT světě, si dodnes neuvědomuje, že i kombinace údajů, které zdánlivě vypadají jako absolutně neosobní (velikost boty, barva očí, výška, barva vlasů atd.) mohou v některých případech, zejména v kombinaci s jinými údaji, vést s velmi vysokou jistotou na identifikaci osoby. Takový soubor dat, nachází-li se v uspořádaném systému, pak je souborem osobních údajů.

Autor tím naráží na časté promluvy programátorů a prodejců AI, kteří mluví o "anonymních datech" a neosobních údajích. Ve skutečnosti je velké množství dat, které AI systémy zpracovávají, nutno považovat za osobní údaje dle GDPR.

Zpracovatelské aktivity dle AI Actu a GDPR

Prvním a kriticky důležitým krokem při posuzování souladu s GDPR, respektive ještě předtím, než se do něj pustíme, je správné určení rolí v rámci jednotlivých zpracovatelských aktivit.

Vulgárně řečeno, GDPR v principu nějaký AI systém vlastně vůbec nezajímá. Nařízení je celé postavené kolem procesů (neboli činností či účelů). AI systém tyto procesy podporuje, případně s ním nějak interagují. Nedává tedy příliš smysl mluvit o "souladu AI systému s GDPR".

Vždy je nutné mluvit o zajištění souladu konání správce či zpracovatele při zpracování osobních údajů v rámci dané zpracovatelské aktivity, která se týká AI systému.

Provozní stavy AI systému

AI systém se v rámci životního cyklu nachází v následujících provozních stavech:

  1. Standardní provoz

    • Provozování AI systému pro zákazníky, resp. uživatele (provozovatelem)

    • Monitorování provozu AI systému (provozovatelem)

    • Používání AI systému (zákazníkem, resp. uživatelem)

    • Provoz povinných procesů pro zajištění souladu při užívání AI systému (zákazník, resp. uživatel)

  2. Nestandardní provoz

    • Vývoj AI systému

    • Trénování AI systému

    • Ověření kvality a funkčnosti AI systému, testování

    • Zavedení systému řízení kvality (včetně kybernetické bezpečnosti a souladu se zákony)

    • Uvedení AI systému na trh EU

    • Marketing, prodej, customizace AI systému

    • Stažení AI systému z trhu, likvidace dat

Standardní provoz a účely zpracování

Standardní je režim provozu, pro který je celý AI systém navržený tak, aby provozovateli vydělával peníze a uživateli přinášel užitek. V jednoduchosti tedy jde o obvyklý provoz, za který zákazníci či uživatelé platí, při němž je již AI systém natrénovaný a nastavený. 

Návrh AI Actu definuje v čl. 3 odst. 12

určený účel, je „použití systému AI určené poskytovatelem, včetně konkrétního kontextu a podmínek použití, které jsou uvedeny v informacích dodaných poskytovatelem v návodu k použití, v propagačních nebo prodejních materiálech a prohlášeních, jakož i v technické dokumentaci“.

V článku 3 odst. 13 doplňuje, že

důvodně předvídatelné nesprávné použití, je „použití systému UI způsobem, který není v souladu s jeho určeným účelem, avšak může vyplývat z důvodně předvídatelného lidského chování nebo z interakce s jinými systémy“.

Standardní provoz tedy znamená AI systém, který, až bude platit AI Act, byl již řádně uveden na trh Unie včetně všech povinných náležitostí a je používán pro jeho určený účel a je zabráněno jeho použití pro předvídatelné nesprávné použití.

Ve vztahu k GDPR umožňuje „určený účel“ podle AI Actu dovodit „účel a prostředky zpracování“.

Řekněme, že provozovatel(é) AI systému jakožto platformy předurčují „prostředky zpracování“ (tj. co AI systém jako technologická platforma umí nabídnout) a je to Uživatel (obvykle v roli správce), který určuje "účely" zpracování, tedy cíle operací a činností, pro něž onu platformu využije.

Zde ale může nastat množství konstelací a výsledné určení rolí se může lišit v závislosti na činnosti účastníka v dodavatelském řetězci AI systému. Může se také snadno stát, že u některých zpracovatelských aktivit provozovatel a uživatel určují účely zpracování společně. A budou proto společnými správci.

Abychom mohli mluvit o správně určených zpracovatelských aktivitých ve smyslu GDPR, správce by tak každopádně měl umět definovat činnosti kolem AI systému v přiměřené míře detailu. Například zamýšlí provádět výpočet mezd v HR systému v rámci procesu odměňování zaměstnanců, při němž jsou využívány konkrétní kategorie osobních údajů od konkrétních kategorií subjektů údajů, bez nichž není možné výpočet, k němuž zaměstnavatele zavazuje smlouva či zákon či jiný titul, provést.

A následně správce pro tento účel zpracování určí i prostředky zpracování, tedy například tak, že pro provedení oněch výpočtů hodlá využít právě AI systém ABC od provozovatele XYZ.

Až budeme později mluvit o povinnosti provést DPIA dle článku 35 GDPR, znovu se k tomuto tématu vrátíme.

Nestandardní provoz

Jedná se o režim provozu, který není standardním provozem, zejména je-li AI systém „nesprávně používán“, neprošel řádně testováním či vykazuje vady. Také sem patří činnosti předcházející jeho uvedení do standardního provozu, včetně vývoje, trénování, aj. 

Zde opět platí, že „určený účel“ neznamená „účel zpracování osobních údajů“. V rámci nestandardního provozu sice značnou část prostředků pro zpracování určuje Provozovatel, ale dle GDPR musí účely zpracování určit správce.

V dalších pokračováních se podíváme na GDPR aspekty provozu AI systémů v obou provozních režimech.

Loading...