Quale strumento scegliere

Per estrazioni occasionali, qualsiasi assistente AI nella normale conversazione: incolli il testo e chiedi i campi. Per estrarre dallo stesso tipo di documento molte volte (cento fatture, centinaia di email), conviene fissare un prompt-modello con campi e regole sempre uguali, così ogni estrazione segue lo stesso schema. Se i documenti sono immagini o foto (scontrini, biglietti), usa uno strumento che "legge" le immagini: glieli mostri e lui estrae il testo prima di strutturarlo. Parti dalla conversazione con un esempio; standardizza in un modello quando i documenti diventano tanti.

Come si fa

  1. Elenca i campi che vuoi, con precisione. Non "i dati importanti", ma "data, fornitore, importo totale, numero fattura". L'AI estrae bene solo ciò che le nomini.
  2. Imponi una regola contro le invenzioni. È il passaggio che salva i tuoi dati. Se un campo non c'è nel testo, l'AI deve dirlo, non riempirlo a caso.
  3. Dai le regole per i casi ambigui. La sintassi operativa:
Estrai dal testo qui sotto questi campi: data, mittente, importo, scadenza.
Restituiscili come tabella con una riga per documento.
Regole: le date in formato giorno/mese/anno; gli importi come numero senza simbolo di valuta;
se un campo non è presente nel testo scrivi "non presente" e non dedurlo.
Se compaiono più date, usa come "scadenza" quella più lontana nel tempo.
[incolla il testo]
  1. Aggiungi un esempio se il formato è particolare. Mostrare una riga già compilata come la vuoi ("esempio di output corretto: ...") guida l'AI meglio di mille spiegazioni.
  2. Verifica i campi critici. Importi, date, codici: controlla un campione contro il testo originale prima di fidarti dell'intero lotto.

Esempio concreto

Ricevi venti email di candidatura, ognuna scritta a modo suo: chi mette il telefono in firma, chi nel corpo, chi gli anni di esperienza in una frase, chi in un'altra. A mano significherebbe aprire e copiare venti volte. Incolli tutte le email all'AI con il prompt: "Per ogni candidato estrai: nome, email, telefono, anni di esperienza, ruolo desiderato. Tabella con una riga per candidato. Se un dato non c'è scrivi 'non presente', non inventarlo." In pochi secondi hai una tabella ordinata di venti righe. Quelli con "non presente" nel telefono li individui subito e sai a chi richiederlo. Il caos di venti formati diversi è diventato una griglia su cui puoi finalmente ordinare e filtrare.

Quando NON funziona (e come rimediare)

Se l'AI inventa i dati mancanti

È il rischio numero uno: di fronte a un campo assente, tende a riempirlo con qualcosa di plausibile. Rimedio: metti sempre la regola esplicita "se manca, scrivi 'non presente' e non dedurre", e poi controlla che l'abbia rispettata. Un importo verosimile ma inventato è peggio di un campo vuoto.

Se sbaglia i casi ambigui (più date, più importi)

Senza istruzioni, sceglie a caso quale data o importo mettere. Rimedio: dai la regola di disambiguazione nel prompt ("se ci sono più importi, usa il totale finale", "se ci sono più date, usa quella di scadenza"). Tu conosci il documento, l'AI no.

Se su lotti lunghi salta righe o si ferma a metà

Su molti documenti insieme, l'AI può troncare. Rimedio: lavora a blocchi più piccoli (dieci documenti per volta) e chiedi alla fine "quante righe hai estratto?" per controllare che il numero corrisponda agli input.

Un consiglio da chi lo usa davvero

La regola "non inventare, scrivi 'non presente'" non è un dettaglio: è la differenza tra dati affidabili e dati avvelenati. Un campo vuoto lo vedi e lo gestisci; un campo riempito di fantasia entra nei tuoi calcoli e nelle tue decisioni senza che te ne accorga. Mettila in ogni prompt di estrazione e verifica sempre che l'AI l'abbia rispettata davvero, perché a volte la dichiara e poi inventa lo stesso. I dati sbagliati costano più del tempo che credevi di risparmiare.

Domande frequenti

Posso estrarre dati da una foto o da un PDF?

Sì, con uno strumento che legge le immagini e i documenti: gli mostri il file e prima ricava il testo, poi lo struttura. La qualità dipende dalla leggibilità: una foto nitida dà risultati buoni, una sfocata o storta genera errori. Per i documenti che contano, verifica i campi estratti contro l'originale.

In che formato conviene farsi dare i dati estratti?

Tabella se li porti in un foglio di calcolo; CSV se li importi in un programma; un formato come il JSON (un modo standard per organizzare dati a coppie nome-valore) se li passi a un'altra applicazione. Scegli in base a dove andranno: chiedi all'AI direttamente il formato della destinazione.

L'estrazione automatica è abbastanza affidabile per dati importanti?

Per ridurre il lavoro sì, per fidarsi alla cieca no. Su dati che contano — importi, scadenze, codici fiscali — l'AI sbaglia abbastanza da rendere obbligatorio un controllo. Il modo serio di usarla è come primo passaggio che ti porta dal caos a una griglia ordinata, seguito da una verifica umana sui campi critici. Salti la verifica solo dove un errore non fa danno.