Skip to main content

Data-driven era – l’eccesso di informazioni e l’Information Extraction

Data-driven era: l’eccesso di informazioni e l’Information Extraction

Effetti collaterali della sovrabbondanza di informazioni.

Nell’attuale era data-driven, organizzazioni e individui generano e scambiano enormi volumi di informazioni, spesso in formati non strutturati o semi-strutturati, attraverso vari canali.

Questa proliferazione di dati, unita alla crescente massa di contenuti online, complica significativamente l’accesso a informazioni precise e pertinenti, nonostante i progressi nei motori di ricerca.

Il risultato è un sovraccarico informativo che ostacola la rapida individuazione dei dati necessari, talvolta richiedendo interventi manuali per la ricerca e l’inserimento dei dati.

In questo scenario, emerge la necessità di sviluppare strumenti e metodi più sofisticati per non solo estrarre dati pertinenti da fonti strutturate e non strutturate, ma anche per affrontare la sfida di questa era digitale rappresentata dalla sovrabbondanza ed eterogeneità delle informazioni.

Un approccio efficace: l’Information Extraction

Una tecnologia che può dare risposte a questa necessità è l’Information Extraction (IE):

essa rappresenta un ramo avanzato del Natural Language Processing (NLP) e dell’Intelligenza Artificiale (IA), dedicato all’identificazione e all’estrazione automatica di dati specifici, strutturati e significativi da testi non strutturati o semi-strutturati.

Questa tecnologia trova impiego in numerosi ambiti caratterizzati dalla presenza di ampie quantità di testo non organizzato, con l’obbiettivo di convertire tali contenuti in informazioni strutturate e prontamente accessibili.

Alla base dell’Information Extraction troviamo metodologie di NLP e IA, le quali consentono di elaborare testi con una precisione e un’efficienza sempre maggiori, facilitando l’estrazione di dati dal contenuto informativo strategico.

Una volta estratti, questi dati diventano risorse preziose per il supporto decisionale o per l’alimentazione di processi automatici.

I testi oggetto dell’elaborazione da parte del processo di Information Extraction possono provenire da una ampia varietà di fonti e sono rappresentati in vari formati; vediamo nel seguito qualche esempio:

  • Documenti Digitali:
    Report aziendali, documenti PDF, documenti Word, fogli di calcolo Excel e presentazioni PowerPoint.
  • Pagine Web:
    Contenuti HTML da applicativi aziendali, siti web, blog, portali di notizie e forum online.
  • Database di Testo:
    Collezioni di articoli scientifici, Curricula Vitae, brevetti, documentazione tecnica e archivi di notizie.
  • E-mail e Comunicazioni di Messaggistica:
    Archivi di e-mail aziendali, chat da piattaforme di instant messaging come WhatsApp o Telegram, messaggi da piattaforme di collaborazione come Zoom, Meet o Microsoft Teams.
  • Registrazioni di Call Center:
    Trascrizioni di conversazioni telefoniche con i clienti o tra membri del personale.

Ambiti di applicazione.

Vediamo ora degli esempi contesti e settori di mercato in cui sia utile e strategico utilizzare l’Information Extraction:

  1. Business Intelligence e Analisi di Mercato:
    L’IE può essere utilizzata per estrarre dati da rapporti finanziari, notizie di settore, e social media per identificare tendenze, opportunità di mercato, e sentiment dei consumatori.
  2. Analisi dei flussi finanziari:
    Estrazione dati dai flussi di rendicontazione bancaria e documenti aggiuntivi extra-flussi al fine di gestire automaticamente processi di riconciliazione o effettuare analisi riguardanti, ad esempio, le abitudini di pagamento dei clienti oppure le dinamiche dei flussi di cassa con predizione di scenari futuri.
  3. Sicurezza Informatica:
    Nella sicurezza informatica, l’IE aiuta nell’analisi di log applicativi o flussi del traffico di rete per identificare minacce e anomalie derivanti da intrusioni, malware o frodi interne ed esterne.
  4. Knowledge Management:
    In ambito aziendale, può aiutare a organizzare e rendere accessibili grandi volumi di documentazione interna, estrarre dati da contratti, report e comunicazioni interne.
  5. Medicina e Ricerca Biomedica:
    Nella ricerca medica, l’IE può estrarre informazioni da articoli scientifici, report di studi clinici e cartelle cliniche elettroniche, facilitando la meta-analisi e l’identificazione di pattern nelle diagnosi e terapie.
  6. Servizi al Cliente e CRM:
    Nell’assistenza clienti, l’IE può analizzare feedback, recensioni di prodotti e comunicazioni dei clienti per migliorare il servizio, identificare i punti di forza e debolezza dei prodotti.
  7. Ricerca Legale e Conformità:
    Utilizzata per estrarre informazioni rilevanti da grandi dataset di documenti legali, brevetti, e pubblicazioni normative al fine di identificare requisiti di conformità e potenziali violazioni.
  8. Media e Giornalismo:
    L’IE può analizzare grandi quantità di contenuti multimediali per identificare eventi, persone, luoghi e temi rilevanti, aiutando nella creazione di contenuti riassuntivi o analitici.
  9. Social Media:
    Post, tweet, commenti e recensioni pubblicati su piattaforme di social media come Facebook, Twitter, LinkedIn e siti di recensioni come TripAdvisor.

Il nostro utilizzo per l’efficientamento dei processi di back-office.

In K Linx utilizziamo l’Information Extraction per l’analisi dei flussi finanziari di incasso da pagamenti non strutturati, al fine di riconciliare gli stessi con le fatture pertinenti, utilizzando, quando presenti, anche documenti di preavviso, mandati di pagamento o altre specifiche di dettaglio.

Utilizziamo inoltre questa tecnologia in ottica più generalizzata per l’estrazione dati da documenti digitali in contesti cross-industry come ad esempio in progetti di digitalizzazione dell’apertura sinistri o della liquidazione degli stessi nel settore INSURANCE.

La nostra roadmap prevede di espandere progressivamente gli ambiti di applicazione della soluzione iXtract (former K Word) includendo in primis l’Information Extraction da applicativi intranet ai fini della fraud-detection, dove al riguardo abbiamo un track record d’eccezione avendo sviluppato progetti di internal fraud detection su clienti istituzionali e finanziari.

La soluzione che abbiamo implementato si basa su un mix di approcci tecnologici, fra cui l’Intelligenza Artificiale declinata con modelli di deep learning, algoritmi tradizionali di pattern matching e ricerche di tag di prossimità, il tutto integrato anche da un motore LLM opzionale.

Mario S. Farris

Efficacia ed Efficienza nei processi aziendali.

PROCESSI EFFICACI, EFFICIENTI O… ENTRAMBI?

In questo articolo approfondisco e metto a confronto due termini fondamentali nel mondo del lavoro e della produttività, EFFICACIA ed EFFICIENZA, spesso usati come se fossero intercambiabili, ma che in realtà hanno significati distinti.

Da anni mi dedico all’automazione e all’efficientamento di processi aziendali, e la mia esperienza come imprenditore e consulente per realtà di vari settori, in particolare nel finance, mi ha permesso di apprezzare la differenza e l’importanza di essere sia efficaci che efficienti.

L’importanza dell’efficacia

L’EFFICACIA riguarda la capacità di raggiungere gli obiettivi prefissati e ottenere i risultati desiderati.

Quando siamo efficaci significa che le nostre azioni producono l’impatto previsto e portano al successo delle nostre iniziative.

L’efficacia si focalizza sul “cosa” otteniamo, indipendentemente dal modo in cui lo facciamo.


Il ruolo dell’efficienza

L’EFFICIENZA, invece, si riferisce al modo in cui sfruttiamo le risorse disponibili (tempo, denaro, risorse umane etc.) per raggiungere gli obiettivi.

Essere efficienti significa utilizzare al meglio queste risorse, riducendo gli sprechi e migliorando la produttività.

L’efficienza riguarda il “come” facciamo le cose, cercando di ottimizzare il processo e minimizzare i costi..

Idealmente, vorremmo e dovremmo essere sia efficaci che efficienti nel nostro lavoro, in modo da ottenere i migliori risultati possibili, con il minor sforzo e spreco di risorse.

A mio modo di vedere, l’EFFICIENZA porta implicitamente con sé anche il concetto di EFFICACIA, con il plus dell’ottimizzazione di come raggiungiamo il nostro scopo.

Calandoci nelle realtà operative della nostra quotidianità, tra le tecnologie oggi disponibili, l’intelligenza artificiale può aiutarci proprio ad essere più efficienti, ottimizzando una vasta gamma di processi, permettendoci di risparmiare tempo e risorse.

Ma cos’ha l’intelligenza artificiale di così speciale?

Per rispondere a questa domanda, parliamo anzitutto di “traditional computing”, ossia le automazioni di processo realizzate con linguaggi di programmazione tradizionali (COBOL, JAVA, C#, Python etc.) dove il business analyst e lo sviluppatore debbono identificare in modo molto preciso ed esaustivo i vari scenari del processo in esame e le tipologie di dati trattati, implementando le tipiche logiche di programmazione if – then – else.

Cosa succede se si verificano degli scenari inaspettati oppure dei dati non rientranti nelle tipologie o contenuti attesi?

L’automatismo si blocca, oppure quei dati vengono scartati lasciando alla supervisione degli operatori tutte quelle situazioni non gestite dal processo automatico.

Le peculiarità del cognitive computing.

Negli ultimi anni, grazie alla nuova primavera che sta vivendo l’intelligenza artificiale, ci viene in soccorso la “cognitive computing”, che diversamente da quanto visto per il traditional compunting, per poter essere applicata su un particolare processo non necessita di istruzioni specifiche sul da farsi, bensì di un addestramento intensivo (il cd machine learning) basato su una mole consistente di dati di training.

Tale apprendimento genera delle mappature statistiche interne all’algoritmo di cognitive computing, tale per cui in fase di esercizio l’algoritmo è in grado di gestire una gamma di situazioni certamente superiore a quante potrebbe gestirne un algoritmo tradizionale, emulando in un certo qual modo quello che farebbe un essere umano che si basa su esperienze precedentemente acquisite per poter affrontare anche scenari di intervento mai verificatisi in precedenza.

Con il vantaggio di una maggiore velocità di esecuzione e la possibilità di essere operativi 24h/24h.

E da qui, grazie ad un cambio di paradigma e con il supporto di tecnologie come l’intelligenza artificiale, si potrà passare da una semplice EFFICACIA ad una più soddisfacente EFFICIENZA.

Immagina come migliorerebbero in quest’ottica i processi della tua azienda, quelli che più di altri sono densi di attività ripetitive, tediose e onerose!

Grazie all’AI, queste attività sarebbero svolte automaticamente, in minor tempo, con meno operatori e a costi inferiori…

Concludo con qualche esempio pratico su progetti di automazione ed efficientamento che abitualmente svolgiamo in K Linx per nostri clienti:

  • > la verifica o la quadratura di flussi che oggi effettui con excel, a fatica e con possibili errori di copia-incolla;
  • > la riconciliazione finanziaria degli incassi da bonifici o altri incassi manuali;
  • > varie operazioni di data entry o altre attività a basso valore aggiunto.

Mario S. Farris

Articoli correlati: