Quale strumento scegliere

Dipende da quanti dati hai.

  • Pochi dati, da sistemare una volta (una lista di contatti, un elenco copiato male): incollali direttamente nell'assistente conversazionale e fatteli riordinare. Veloce, nessuno strumento da imparare.
  • Tanti dati in un foglio, da pulire ripetutamente: chiedi all'AI una formula (per Excel o Google Fogli) o una macro che esegua la pulizia, così la rilanci ogni volta che arrivano dati nuovi.
  • Dati molto sporchi o in grande quantità (migliaia di righe da più fonti): chiedi uno script in Python, che gestisce i file di dati senza i limiti di un foglio.

La pulizia dati significa rendere uniforme ciò che è stato scritto in modi diversi: "Mario Rossi", "rossi mario", "ROSSI M." sono la stessa persona per te, non per il computer.

Come si fa

Da browser, foglio o terminale, il principio è lo stesso.

  1. Definisci come devono essere i dati puliti. Decidi il formato di arrivo: nomi con iniziale maiuscola, date come 2026-06-15, numeri senza puntini, una colonna per ogni informazione. Senza un traguardo chiaro, la pulizia gira a vuoto.

  2. Mostra all'AI un campione. Incolla qualche riga sporca e una riga come la vuoi pulita: l'esempio vale più di mille spiegazioni.

    La sintassi operativa:

    Questi sono nomi e città scritti in modo disordinato:
    mario rossi - MILANO
    Rossi, Mario (milano)
    LUCIA BIANCHI – Roma
    
    Riordinali in una tabella con tre colonne: Nome, Cognome, Città. Nome e Cognome con l'iniziale maiuscola, Città con l'iniziale maiuscola. Restituisci una tabella pulita e segnala le righe che non riesci a interpretare con sicurezza.
    
  3. Controlla il risultato sul campione. Verifica che l'AI abbia interpretato bene prima di darle tutto. Se sbaglia, aggiusta l'esempio e ripeti.

  4. Estendi al resto. Per pochi dati, incolla tutto. Per un foglio grande, chiedi la formula o lo script che applica la stessa pulizia a tutte le righe.

  5. Tieni a vista le righe dubbie. I dati che l'AI non sa interpretare vanno controllati a mano, non indovinati. Chiedile sempre di segnalarli invece di tirare a indovinare.

Esempio concreto

Elena ha raccolto iscrizioni a un evento da tre canali diversi: i nomi sono scritti in tutti i modi, le città a volte maiuscole a volte no, alcune righe hanno nome e cognome invertiti. Incolla un campione all'AI con l'istruzione dell'esempio. L'assistente le restituisce una tabella ordinata in tre colonne e segnala due righe ambigue. Elena controlla quelle due a mano, poi chiede all'AI di pulire allo stesso modo l'intero elenco. Da trecento righe caotiche a una tabella pronta per le etichette, in mezz'ora invece di un pomeriggio.

Quando NON funziona (e come rimediare)

Se l'AI indovina male le righe ambigue

Di fronte a un dato confuso, l'AI tende a riempire il vuoto con un'ipotesi, che può essere sbagliata. Rimedio: nell'istruzione chiedi esplicitamente di "segnalare le righe incerte invece di indovinare". Le righe segnalate le sistemi tu: meglio dieci dubbi onesti che dieci errori nascosti.

Se i dati sono troppi per incollarli nella chat

L'assistente ha un limite di quanto testo accetta in una volta. Rimedio: per grandi quantità non incollare i dati, chiedi lo strumento. Fatti dare una formula del foglio o uno script Python che applichi la pulizia a tutte le righe restando sul tuo computer.

Se la pulizia perde o altera dati buoni

Una regola troppo aggressiva (togliere tutti i doppioni) può cancellare righe legittime che si somigliano. Rimedio: lavora su una copia, e chiedi all'AI di mostrarti cosa toglierebbe prima di toglierlo. Per i doppioni, fatti dare l'elenco dei sospetti da controllare, non la cancellazione automatica.

Se ogni volta che arrivano dati nuovi devi rifare tutto

Pulire a mano a ogni aggiornamento è insostenibile. Rimedio: trasforma la pulizia in uno strumento riutilizzabile. Chiedi all'AI una formula o una macro che pulisca la colonna in automatico, così quando incolli dati nuovi la pulizia parte da sola.

Un consiglio da chi lo usa davvero

L'esempio batte la spiegazione, sempre. Quando chiedi all'AI di pulire dati, non descrivere a parole come li vuoi: mostrale una riga sporca e accanto la stessa riga come deve diventare. L'AI impara il modello da quell'esempio meglio di qualsiasi elenco di regole. Due o tre righe di "prima e dopo" e capisce esattamente cosa intendi. È il modo più veloce per ottenere il risultato giusto al primo colpo, su qualsiasi tipo di dato disordinato.

Domande frequenti

Quanto sono affidabili i dati puliti dall'AI?

Affidabili sui casi chiari, da verificare sui casi ambigui. L'AI uniforma benissimo ciò che segue un modello; sui dati confusi può sbagliare interpretazione. Per questo conviene farle segnalare i dubbi e controllarli, invece di fidarsi alla cieca di tutta la tabella.

Posso pulire dati che contengono informazioni personali?

Con cautela. Incollare nomi, email o dati sensibili in un assistente online significa mandarli su un server esterno. Per dati personali, valuta uno strumento che gira sul tuo computer (uno script Python) così i dati non escono dalla tua macchina, e rispetta sempre le regole sulla privacy.

Funziona anche con dati in lingue diverse o caratteri strani?

Sì, l'AI gestisce più lingue e caratteri accentati. Le difficoltà arrivano con codifiche rovinate (i caratteri che diventano simboli illeggibili): in quel caso segnala all'AI il problema e chiedile di gestire la codifica, oppure correggi la fonte.

Conviene pulire i dati con l'AI o sistemare la fonte che li genera sporchi?

Se i dati arrivano sporchi sempre allo stesso modo, la vera soluzione è a monte: sistemare il modulo, il foglio o il processo che li produce disordinati. Pulire ogni volta cura il sintomo; un campo di inserimento ben fatto (date con un calendario, città da un elenco) impedisce che il disordine nasca. L'AI è ottima per recuperare il pasticcio esistente, ma il pasticcio che non si crea è quello che ti fa risparmiare di più.