Estrazione ed elaborazione dati da documenti statici tramite AI

post-image
Condividi

I modelli LLM (Large Language Model), come ad esempio ChatGPT, sono strumenti avanzati di Intelligenza Artificiale capaci di comprendere ed elaborare testi in modo estremamente accurato. Tuttavia, per ottenere risultati soddisfacenti quando si utilizza un LLM, è importante tenere presente alcune regole fondamentali. Per meglio illustrare questi nuovi strumenti e la loro applicazione, rappresenteremo nel seguito un caso pratico in cui l’uso dei modelli LLM si rivela particolarmente utile per l’estrazione e l’elaborazione dei dati da documenti statici.

Indice

1. Utilizzo di Modelli LLM nell’attività professionale
2. Dal Bilancio PDF all’Excel: un caso pratico
3. Osservazioni conclusive

1. Utilizzo di Modelli LLM nell’attività professionale

Quando si utilizza l’Intelligenza Artificiale con i LLM (Large Language Model) come ChatGPT, è importante considerare che:

  1. i risultati ottenuti dipendono sempre da ciò che vieni impartito dall’utente come prompt di comando;
  2. è sempre opportuno chiedere di ripetere eventuali conteggi per verificare l’accuratezza del primo elaborato ottenuto;
  3. infine, procedere a una valutazione d’insieme del risultato ottenuto con il proprio scetticismo, esperienza e preparazione professionale.

Proviamo quindi a rappresentare un caso pratico: la ricezione di un bilancio in formato PDF che dobbiamo analizzare o semplicemente trasformare in formato Excel per successive elaborazioni.

2. Dal Bilancio PDF all’Excel: un caso pratico

In questo primo caso d’uso, ipotizziamo di ricevere un bilancio di verifica annuale in formato PDF, una situazione piuttosto comune quando si tratta di clientela esterna che affida allo studio la redazione del bilancio europeo o che necessita della revisione legale dei conti.

Solitamente, il professionista riclassifica il bilancio in Excel o con altri strumenti per poter effettuare le analisi necessarie e fornire consulenza al cliente. La riclassificazione e la trascrizione dei numeri sono attività che possono richiedere tempo e non sono esenti da errori di trascrizione.

Il bilancio può arrivare, ad esempio, in questo formato:

Estrarre dati da un file di questo tipo utilizzando lo strumento Power Query di Excel potrebbe non essere facile a causa della struttura del PDF a sezioni contrapposte. Vediamo quindi come è possibile utilizzare un modello di LLM, in particolare ChatGPT-4.

Per prima cosa, eseguiamo l’upload del file PDF così com’è e aiutiamo il modello a capire cosa gli abbiamo inviato, assicurandoci che abbia compreso correttamente.

Il prompt potrebbe essere il seguente:

In questo caso, ChatGPT risponde che ha compreso la struttura del file e ci restituisce un primo feedback.

Risposta:
Sì, ho compreso la struttura del file. Il documento rappresenta un bilancio di esercizio a sezioni contrapposte dell’anno 2023 di uno studio professionale.
Il bilancio è suddiviso nelle seguenti sezioni principali:

  1. Stato Patrimoniale:
    • Attività: Include immobilizzazioni (immateriali e materiali), attivo circolante (crediti e disponibilità liquide), e ratei e risconti attivi.
    • Passività: Include patrimonio netto, trattamento di fine rapporto, debiti (verso banche, fornitori, istituti previdenziali e altri), e ratei e risconti passivi.
  2. Conto Economico:
    • Costi: Include i costi della produzione (materie prime, servizi, godimento beni di terzi, personale), ammortamenti e svalutazioni, oneri finanziari e imposte sul reddito.
    • Ricavi: Include il valore della produzione, altri ricavi e proventi, e proventi finanziari.

Le colonne del bilancio sono:

  • Codice conto: Identifica univocamente ogni voce di bilancio.
  • Descrizione del conto: Dettaglia la natura del conto.
  • Valore nel periodo 2023: Indica l’importo registrato nel periodo di riferimento.

A questo punto possiamo chiedere direttamente a ChatGPT di trascriverci tutto il contenuto del PDF sotto forma di tabella, in modo da poterlo gestire direttamente in Excel:

Risposta:
Ho incontrato alcuni problemi tecnici nel completare la trasformazione dei dati in tabelle tramite l’ambiente di calcolo. Pertanto, procederò con la trasformazione manuale delle sezioni principali del bilancio in formato tabellare.

Stato Patrimoniale (Attivo)

Descrizione Valore
Immobilizzazioni immateriali 1,212.89
Spese di costituzione e modifica società 2,177.50
F.do amm. spese di costituzione -964.61
Immobilizzazioni materiali 8,226.42
Mobili e arredi 5,080.00
Hardware IT 9,202.80

omissis..

Stato Patrimoniale (Passivo)

Descrizione Valore
Patrimonio Netto 37,859.00
Capitale 11,000.00
Capitale sociale quote 11,000.00
Riserva legale 2,200.00

omissis…

Conto Economico (Costi)

Descrizione Valore
Costi della Produzione 177,298.10
Costi per materie prime, sussidiarie 3,201.83
Oneri accessori-anticipo spese c/cliente 3,201.83
Costi per servizi 50,776.12
Costi produz. servizi e appalti a terzi 5,098.19
Addebito spese da fornitori 68.00
Costi altri servizi 4,505.42
Costi altri servizi indeducibili 109.89

omissis…

Conto Economico (Ricavi)

Descrizione Valore
Valore della Produzione 196,379.72
Ricavi per prestazioni Italia 179,658.45
Altri ricavi e proventi 16,721.27
Rivalsa bolli 2.00
Abbuoni e arrotondamenti attivi 52.67
Sopravvenienze attive ordinarie 960.00

omissis…

Ora verificheremo che i totali delle singole sezioni corrispondano ai totali riportati nel bilancio:

  • Totale Attivo: 123,730.80
  • Totale Passivo: 109,821.03
  • Totale Costi: 182,471.57
  • Totale Ricavi: 196,381.34

Questi totali devono combaciare con i rispettivi totali nel bilancio. Sembra che ci sia una discrepanza nei totali delle sezioni. Procediamo con una verifica dettagliata per identificare eventuali errori o omissioni.

Il sistema si è accorto che le somme delle tabelle rielaborate non quadrano; anche il lettore avrà notato una duplicazione di alcuni costi e ricavi.

Pertanto, formuliamo la seguente richiesta:

Il sistema si accorge delle differenze e ripropone le tabelle precedenti corrette. Siccome il formato dei numeri non corrisponde a quello utilizzato in Italia chiediamo a chatGPT di invertire le virgole con i punti.

Risposta:
Stato Patrimoniale (Attivo)

Descrizione Valore
Spese di costituzione e modifica società 2.177,50
F.do amm. spese di costituzione -964,61
Mobili e arredi 5.080,00
Hardware IT 9.202,80
F.do amm. mobili e arredi -1.241,42
F.do amm. hardware IT -5.020,08
Beni non superiori a € 516,46 582,92

omissis…

Queste tabelle sono ora pronte per essere copiate e incollate in un file Excel. Se hai bisogno di ulteriori modifiche o assistenza, fammelo sapere!

A questo punto sarà possibile riportare i dati su un foglio Excel.

3. Osservazioni conclusive

Abbiamo visto come trasformare un documento statico, come un PDF, in un elaborato dinamico e interoperabile.

Questo stesso procedimento può essere applicato anche a un’immagine, ad esempio uno screenshot di un bilancio. Allo stesso modo, si potrebbe utilizzare questa tecnica per importare un file PDF di un libro giornale di periodo per estrarre i dati da analizzare successivamente in Excel.

Quello che abbiamo descritto è solo un esempio, utilizzabile come base di partenza. Uno stimolo per iniziare a testare alcune applicazioni di Intelligenza Artificiale al fine di familiarizzare con questa nuova tecnologia e comprendere come possa essere utile nella propria attività professionale.

Ne parleremo al Convegno in aula – Laboratorio di Intelligenza Artificiale per gli studi professionali. Scopri tutte le date disponibili.

L’Intelligenza Artificiale al servizio del Commercialista

Scopri la contabilità intelligente DK Mind del nostro software per commercialisti

Con Datev Koinos hai a disposizione un kit completo di soluzioni che ti garantiscono efficienza e innovazione, per il presente e il futuro del tuo studio: software gestionali, servizi digitali e ora anche algoritmi intelligenti.

Scopri DK Mind la piattaforma web di servizi per lo studio commercialista basati su tecnologie di intelligenza artificiale. Fatti trovare pronto al cambiamento!

Articoli correlati


TAG