Estrazione ed elaborazione dati da documenti statici tramite AI
I modelli LLM (Large Language Model), come ad esempio ChatGPT, sono strumenti avanzati di Intelligenza Artificiale capaci di comprendere ed elaborare testi in modo estremamente accurato. Tuttavia, per ottenere risultati soddisfacenti quando si utilizza un LLM, è importante tenere presente alcune regole fondamentali. Per meglio illustrare questi nuovi strumenti e la loro applicazione, rappresenteremo nel seguito un caso pratico in cui l’uso dei modelli LLM si rivela particolarmente utile per l’estrazione e l’elaborazione dei dati da documenti statici.
Indice
1. Utilizzo di Modelli LLM nell’attività professionale
2. Dal Bilancio PDF all’Excel: un caso pratico
3. Osservazioni conclusive
1. Utilizzo di Modelli LLM nell’attività professionale
Quando si utilizza l’Intelligenza Artificiale con i LLM (Large Language Model) come ChatGPT, è importante considerare che:
- i risultati ottenuti dipendono sempre da ciò che vieni impartito dall’utente come prompt di comando;
- è sempre opportuno chiedere di ripetere eventuali conteggi per verificare l’accuratezza del primo elaborato ottenuto;
- infine, procedere a una valutazione d’insieme del risultato ottenuto con il proprio scetticismo, esperienza e preparazione professionale.
Proviamo quindi a rappresentare un caso pratico: la ricezione di un bilancio in formato PDF che dobbiamo analizzare o semplicemente trasformare in formato Excel per successive elaborazioni.
2. Dal Bilancio PDF all’Excel: un caso pratico
In questo primo caso d’uso, ipotizziamo di ricevere un bilancio di verifica annuale in formato PDF, una situazione piuttosto comune quando si tratta di clientela esterna che affida allo studio la redazione del bilancio europeo o che necessita della revisione legale dei conti.
Solitamente, il professionista riclassifica il bilancio in Excel o con altri strumenti per poter effettuare le analisi necessarie e fornire consulenza al cliente. La riclassificazione e la trascrizione dei numeri sono attività che possono richiedere tempo e non sono esenti da errori di trascrizione.
Il bilancio può arrivare, ad esempio, in questo formato:
Estrarre dati da un file di questo tipo utilizzando lo strumento Power Query di Excel potrebbe non essere facile a causa della struttura del PDF a sezioni contrapposte. Vediamo quindi come è possibile utilizzare un modello di LLM, in particolare ChatGPT-4.
Per prima cosa, eseguiamo l’upload del file PDF così com’è e aiutiamo il modello a capire cosa gli abbiamo inviato, assicurandoci che abbia compreso correttamente.
Il prompt potrebbe essere il seguente:
In questo caso, ChatGPT risponde che ha compreso la struttura del file e ci restituisce un primo feedback.
Risposta: Sì, ho compreso la struttura del file. Il documento rappresenta un bilancio di esercizio a sezioni contrapposte dell’anno 2023 di uno studio professionale. Il bilancio è suddiviso nelle seguenti sezioni principali:
Le colonne del bilancio sono:
|
A questo punto possiamo chiedere direttamente a ChatGPT di trascriverci tutto il contenuto del PDF sotto forma di tabella, in modo da poterlo gestire direttamente in Excel:
Risposta: Ho incontrato alcuni problemi tecnici nel completare la trasformazione dei dati in tabelle tramite l’ambiente di calcolo. Pertanto, procederò con la trasformazione manuale delle sezioni principali del bilancio in formato tabellare. Stato Patrimoniale (Attivo)
omissis.. Stato Patrimoniale (Passivo)
omissis… Conto Economico (Costi)
omissis… Conto Economico (Ricavi)
omissis… Ora verificheremo che i totali delle singole sezioni corrispondano ai totali riportati nel bilancio:
Questi totali devono combaciare con i rispettivi totali nel bilancio. Sembra che ci sia una discrepanza nei totali delle sezioni. Procediamo con una verifica dettagliata per identificare eventuali errori o omissioni. |
Il sistema si è accorto che le somme delle tabelle rielaborate non quadrano; anche il lettore avrà notato una duplicazione di alcuni costi e ricavi.
Pertanto, formuliamo la seguente richiesta:
Il sistema si accorge delle differenze e ripropone le tabelle precedenti corrette. Siccome il formato dei numeri non corrisponde a quello utilizzato in Italia chiediamo a chatGPT di invertire le virgole con i punti.
Risposta: Stato Patrimoniale (Attivo)
omissis… Queste tabelle sono ora pronte per essere copiate e incollate in un file Excel. Se hai bisogno di ulteriori modifiche o assistenza, fammelo sapere! |
A questo punto sarà possibile riportare i dati su un foglio Excel.
3. Osservazioni conclusive
Abbiamo visto come trasformare un documento statico, come un PDF, in un elaborato dinamico e interoperabile.
Questo stesso procedimento può essere applicato anche a un’immagine, ad esempio uno screenshot di un bilancio. Allo stesso modo, si potrebbe utilizzare questa tecnica per importare un file PDF di un libro giornale di periodo per estrarre i dati da analizzare successivamente in Excel.
Quello che abbiamo descritto è solo un esempio, utilizzabile come base di partenza. Uno stimolo per iniziare a testare alcune applicazioni di Intelligenza Artificiale al fine di familiarizzare con questa nuova tecnologia e comprendere come possa essere utile nella propria attività professionale.
Ne parleremo al Convegno in aula – Laboratorio di Intelligenza Artificiale per gli studi professionali. Scopri tutte le date disponibili.
L’Intelligenza Artificiale al servizio del CommercialistaScopri la contabilità intelligente DK Mind del nostro software per commercialistiCon Datev Koinos hai a disposizione un kit completo di soluzioni che ti garantiscono efficienza e innovazione, per il presente e il futuro del tuo studio: software gestionali, servizi digitali e ora anche algoritmi intelligenti. Scopri DK Mind la piattaforma web di servizi per lo studio commercialista basati su tecnologie di intelligenza artificiale. Fatti trovare pronto al cambiamento! |