Chiedere i dati che ChatGPT ha raccolto su di me a OpenAI è stata un’impresa. Ed è andata peggio del previsto

Date:

Anche la distribuzione dei file all’interno delle cartelle non sembra avere alcuna logica e, a complicare ulteriormente le cose, nell’archivio erano presenti più copie dello stesso file. Per riuscire a capirci qualcosa abbiamo dovuto installare un file manager alternativo che permette di visualizzare la struttura delle cartelle in modalità “ad albero” e usare una serie di filtri per cercare i vari file sulla base della loro estensione.

Una procedura di questo genere non rispetta in alcun modo lo spirito del Gdpr – sottolinea Dimalta -. L’accessorio ai dati deve avere caratteristiche di trasparenza e leggibilità. Se il cittadino si trova di fronte un archivio estremamente complesso e deve fare fronte a problemi tecnici per consultarlo, la risposta non soddisfa quanto previsto nel regolamento”.

Cosa sa di noi OpenAI

Al di là di ciò che abbiamo comunicato al chatbot utilizzando il servizio, i dati personali raccolti da OpenAI sono piuttosto scarni. Capire esattamente quali informazioni registrate, però, non è facilissimo. Anche il contenuto dei file, infatti, non è esattamente “human friendly”.

Le conversazioni con il chatbot sono contenuto in un gigantesco file Html decisamente comprensibilema altre informazioni sono piuttosto criptiche. Un esempio è quello delle informazioni di contatto, inserite in un file .csv. La tabella, che per essere letta deve comunque essere “normalizzata”, presentava 256 colonne e due righe. In tutto 512 campi di cui… erano 425 vuoti. Meno complesso il file relativo al profilo utente, che invece conteneva “solo” 87 colonne.

Chiedendo a ChatGPT per analizzare i documentiil chatbot li ha classificati come classici file di esportazione da Salesforce. Si tratta di uno dei software Crm (Customer Relationship Management) più diffuso a livello aziendale. Insomma: quello che ha fatto OpenAI è stato semplicemente iniziare l’esportazione di un report da un software usato da tecnici e spedirlo all’utente di turno, senza traduzione e spiegazioni di sorta.

Tra i dati identificativi emergono la geolocalizzazione (effettuata analizzando l’indirizzo IP), i dati relativi al browser utilizzato, la lingua e il sistema operativo del dispositivo. Curiosamente, quest’ultimo dato riportava la versione sbagliata di Windows. Nonostante il profilo sia stato utilizzato più volte anche da iPhone, infine, nel profilo non sono presenti informazioni relative allo smartphone. Merito, probabilmente, delle nuova politica di Mela in tema di privacy che impediscono alle app di rastrellare informazioni.

Quali dati hanno usato per addestrare l’AI?

Rispetto ad altri servizi, ChatGPT ha una particolarità che riguarda la possibilità che OpenAI utilizzi le conversazioni con il chatbot per addestrare l’algoritmo. Il contrario, però, è possibile. Nel primo messaggio di risposta alla richiesta di accesso ai dati che abbiamo ricevuto viene chiarito.

Condividi l'articolo:

Popolari

IN EVIDENZA
Related