30
Scuola Politecnica e delle Scienze di Base Corso di Laurea in Ingegneria Informatica elaborato di laurea Analisi Predittiva e Apprendimento Automatico Anno Accademico 2016/2017 relatore Ch.mo Prof. Filippo Neri candidato Giovanni Tondo matr. N46002390

Analisi Predittiva e Apprendimento Automatico · Ovviamente, non si può avere una certezza assoluta, ma si tratta di uno studio probabilistico. Gli Advanced Predictive Analytics

Embed Size (px)

Citation preview

Page 1: Analisi Predittiva e Apprendimento Automatico · Ovviamente, non si può avere una certezza assoluta, ma si tratta di uno studio probabilistico. Gli Advanced Predictive Analytics

Scuola Politecnica e delle Scienze di Base Corso di Laurea in Ingegneria Informatica

elaborato di laurea

Analisi Predittiva e Apprendimento Automatico

Anno Accademico 2016/2017 relatore

Ch.mo Prof. Filippo Neri candidato Giovanni Tondo matr. N46002390

Page 2: Analisi Predittiva e Apprendimento Automatico · Ovviamente, non si può avere una certezza assoluta, ma si tratta di uno studio probabilistico. Gli Advanced Predictive Analytics

Alla mia bicicletta veloce

Page 3: Analisi Predittiva e Apprendimento Automatico · Ovviamente, non si può avere una certezza assoluta, ma si tratta di uno studio probabilistico. Gli Advanced Predictive Analytics

Analisi predittiva e apprendimento automatico

Indice

Indice .................................................................................................................................................... 3

Introduzione ......................................................................................................................................... 4

Capitolo 1: Previsione di eventi futuri da dati storici.................................................................... 5

1.1 Analisi predittiva ................................................................................................................... 5

1.2 Apprendimento automatico ................................................................................................... 6

Capitolo 2: Ambiti di applicazione ............................................................................................... 8

2.1 Ambiti di applicazione .......................................................................................................... 8

Capitolo 3: Le fonti ..................................................................................................................... 10

3.1 I dati ..................................................................................................................................... 10

3.2 Big Data ............................................................................................................................... 11

3.2.1 Crescita tridimensionale ............................................................................................... 12

Capitolo 4: Tecniche predittive ................................................................................................... 14

4.1 Tecniche .............................................................................................................................. 14

4.1.1 Reti Neurali ....................................................................................................................... 14

4.1.2 Alberi di Decisione ........................................................................................................... 16

4.1.3 Regressione ....................................................................................................................... 17

4.1.4 Support Vector Machine(SVM) ........................................................................................ 17

4.1.5 Simulazione Monte Carlo ................................................................................................. 18

Capitolo 5: Tecnologie disponibili .............................................................................................. 20

Capitolo 6: Un caso di studio: manutenzione predittiva .................................................................... 22

6.1 Manutenzione classica ......................................................................................................... 22

6.2 Cos’è la manutenzione predittiva ........................................................................................ 22

6.3 Obiettivi della manutenzione predittiva .............................................................................. 23

6.4 Come avviene la manutenzione predittiva .......................................................................... 23

Conclusioni ........................................................................................................................................ 26

Sviluppi Futuri ................................................................................................................................... 27

Bibliografia ........................................................................................................................................ 29

Page 4: Analisi Predittiva e Apprendimento Automatico · Ovviamente, non si può avere una certezza assoluta, ma si tratta di uno studio probabilistico. Gli Advanced Predictive Analytics

Analisi predittiva e apprendimento automatico

4

Introduzione

Conoscere il futuro è considerato da sempre per l’uomo un sogno. Dall’alba dei tempi oracoli e

visionari hanno tentato di provare che è possibile avere un’anteprima degli eventi futuri:

interpretando i cambiamenti del clima, osservando il volo degli uccelli, interpellando divinità e dei.

Uno dei primi esperimenti scientifici seri di analisi predittiva fu quello di Norbert Wiener per

prevedere il comportamento dei piloti tedeschi con l’obiettivo di colpirli in volo. Il metodo

consisteva nel prendere come input la traiettoria del velivolo in base al movimento osservato,

considerare le manovre più probabili fatte dal pilota e prevedere dove l’aereo si sarebbe diretto in

modo che un proiettile potesse colpirlo. Dal 1940 i computer sono diventati molto più veloci ed i

dati storici a disposizione molto maggiori. La sfida di oggi è sempre di più conoscere in anticipo

gli eventi, i comportamenti ed i loro mutamenti o come dice Eric Siegel saper “Chi clicca, compra,

mente o muore”. Questo lavoro vuole essere una fotografia dello stato dell’arte sulla tecnologia che

apprende dall’esperienza (dati) per prevedere il comportamento futuro e fornire una guida per dare

un supporto a decisioni efficaci e migliori.

Page 5: Analisi Predittiva e Apprendimento Automatico · Ovviamente, non si può avere una certezza assoluta, ma si tratta di uno studio probabilistico. Gli Advanced Predictive Analytics

Analisi predittiva e apprendimento automatico

5

Capitolo 1: Previsione di eventi futuri da dati storici

1.1 Analisi predittiva L’analisi predittiva utilizza i dati insieme ad analisi, tecniche di apprendimento automatico e

statistiche per creare un modello predittivo per la previsione di eventi futuri. È chiara la definizione

di Eric Siegel, secondo cui i Predictive Analytics sono una tecnologia che apprende dall’esperienza

per predire il comportamento futuro di individui, eventi e fenomeni in modo da ottenere decisioni

migliori. Il termine "analisi predittiva" non descrive una particolare tecnica statistica o di

apprendimento automatico, ma, piuttosto, l'applicazione di una tecnica per creare una previsione

quantitativa per il futuro. Frequentemente, le tecniche di apprendimento automatico con

supervisione vengono utilizzate per prevedere un valore futuro (ad esempio, la temperatura domani

sarà 30°) o stimare una probabilità (ad esempio, la probabilità di pioggia domani è del 75 %).

L’analisi predittiva è spesso discussa nel contesto dei Big Data considerando che le imprese

applicano algoritmi per ricavare spunti da grandi insiemi di dati. Questi modelli predittivi possono

essere applicati per la produzione in un ambiente IT o in un sistema embedded.

L’analisi predittiva consente di utilizzare modelli statistici per attività di forecasting: serve, in

pratica, a fare stimare ciò che accadrà nel futuro. Ovviamente, non si può avere una certezza

assoluta, ma si tratta di uno studio probabilistico. Gli Advanced Predictive Analytics o APA, come

vengono definiti da IDC, sono strumenti potenti, inseriti in svariati processi, che a partire dai dati a

disposizione permettono agli utilizzatori di modellare, simulare e prevedere andamenti futuri, con

Page 6: Analisi Predittiva e Apprendimento Automatico · Ovviamente, non si può avere una certezza assoluta, ma si tratta di uno studio probabilistico. Gli Advanced Predictive Analytics

Analisi predittiva e apprendimento automatico

6

una certa probabilità. Oggi il mercato richiede soluzioni che abbiano completezza e velocità.

L’evoluzione tecnologica, software e hardware degli ultimi anni ha abilitato soluzioni fino a pochi

anni fa impensabili, in grado di eseguire query a una velocità notevole, su enormi volumi di dati.

Queste soluzioni rendono i principali processi aziendali molto più veloci, mettendo a disposizione

funzionalità di analisi e reporting molto più rapide ed affidabili rispetto ai vecchi metodi ed offrono

un supporto alle decisioni intelligenti e rapide basate su un patrimonio di informazioni e dati

disponibili. Fino a non molti anni fa gli strumenti utilizzati erano complicati da utilizzare ed erano

richieste particolari competenze: conoscenze matematiche e statistiche per creare, utilizzare e

aggiornare i modelli analitici. Oggi, molte delle attività sono velocizzate da strumenti completi,

efficaci ed efficienti che semplificano enormemente il lavoro. I modelli di predizione vengono

creati in modo automatico e ottimizzato, utilizzabili da subito all’interno dei processi di business.

Gli APA aiutano a prevedere i mutamenti, permettendo di pianificare e realizzare strategie mirate

ed efficaci per migliorare ed ottimizzare performance, per prevedere fenomeni disastrosi.

Grazie agli APA, quindi, si può avere una migliore e più profonda comprensione di fenomeni ed

eventi rispetto a quanto possibile con gli strumenti classici, perché si possono prevedere

comportamenti e performance in diversi campi e settori.

1.2 Apprendimento automatico In questo studio si vuole dare particolare rilievo alle tecniche di apprendimento automatico.

È proprio attraverso questo processo che i dati si rivelano una risorsa potentissima.

L’apprendimento automatico (Machine Learning) è un campo dell’intelligenza artificiale che tratta

algoritmi che consentono ad un agente di apprendere in modo autonomo.

Page 7: Analisi Predittiva e Apprendimento Automatico · Ovviamente, non si può avere una certezza assoluta, ma si tratta di uno studio probabilistico. Gli Advanced Predictive Analytics

Analisi predittiva e apprendimento automatico

7

Emerge la necessità di creare dei modelli che abilitino gli agenti a produrre output di dati futuri in

modo autonomo a partire da una serie di dati di input.

La figura seguente dà un’idea di come sia fondamentale nel processo di predizione il Machine

Learning

Figura 1 Purtroppo (o fortunatamente) è doveroso notare il limite del Machine Learning rispetto ad una

mente umana: un agente programmato dall’uomo infatti potrà solo dare degli output elaborando

dati già visti in precedenza mentre l’uomo, grazie alla capacità del tutto umana è in grado di

giungere a conclusioni ragionando per similitudini, associazioni, pensieri ed associazione di

situazioni, anche solo simili in minima parte a quelle oggetto di valutazione.

Page 8: Analisi Predittiva e Apprendimento Automatico · Ovviamente, non si può avere una certezza assoluta, ma si tratta di uno studio probabilistico. Gli Advanced Predictive Analytics

Analisi predittiva e apprendimento automatico

8

Capitolo 2: Ambiti di applicazione

2.1 Ambiti di applicazione

L’analisi predittiva trova spazi in molteplici ambiti e settori, sia in quelli della ricerca scientifica

sia in quelli commerciali di mercato. Nel settore dell'energia, tipicamente si prevede la richiesta di

elettricità per il futuro dimensionando opportunamente i fabbisogni necessari, la previsione è

comunemente utilizzata dagli operatori della rete al fine di garantire un’adeguata programmazione

della generazione di energia per soddisfare la richiesta degli utilizzatori.

Nei mercati Banking e Finance sono fondamentali i punteggi di affidabilità di solvibilità creditizia

e di rating, in ambito industriale e di produzione sono tematiche fondamentali e strategiche quelle

che riguardano la manutenzione predittiva di macchinari e veicoli.

In ambito commerciale la previsione di vendita al dettaglio e all’ingrosso consente di gestire con

efficienza le scorte di materiale, nel marketing è possibile per esempio, sapere in anticipo quali

saranno i clienti che l’organizzazione potrà perdere nel prossimo futuro, quali servizi aggiuntivi

potranno essere venduti ai clienti attuali o quali nuovi prodotti saranno maggiormente apprezzati

sul mercato per affinare una opportuna strategia commerciale. In questo modo, si possono sfruttare

al meglio i dati già disponibili nei sistemi dei CRM (Customer Relationship Management) per

migliorare le previsioni della domanda o degli acquisti per ottimizzare le performance.

Oggi ogni azienda competitiva che fa marketing, controllo di gestione e monitoraggio del ciclo di

Page 9: Analisi Predittiva e Apprendimento Automatico · Ovviamente, non si può avere una certezza assoluta, ma si tratta di uno studio probabilistico. Gli Advanced Predictive Analytics

Analisi predittiva e apprendimento automatico

9

vita dei propri servizi, necessita di confrontarsi con strumenti più o meno evoluti di Predictive

Analytics in tutta le aree aziendali a cominciare da quelle di vendita, dei crediti, dei rischi degli

approvvigionamenti.

I settori in cui la competitività si misura sul valore che ogni cliente apporta al business sono i primi

che si doteranno di soluzioni di analisi predittiva: Retail, GDO (grande distribuzione organizzata)

fino al manufacturing. È possibile inoltre effettuare un’analisi sul rischio di abbandono dei singoli

clienti, analisi che ha consentito di costruire una “classifica” dei clienti più “a rischio” che sono

stati poi opportunamente gestiti in anticipo rispetto a una decisione di abbandono, consentendo di

innescare un processo virtuoso di fidelizzazione.

Vi sono settori che sono da anni soliti utilizzare strumenti di Predictive Analytics, e sono quei

settori in cui le attività di vendita e produzione sono essenzialmente basate sulle previsioni. Tra

questi sicuramente ci sono il fashion, il food & beverage e il retail specializzato, le banche ed i

provider di telecomunicazioni. Altro settore dove l’analisi predittiva è di grande utilità è quello

medico sanitario all’interno del quale possiamo osservare una grande diffusione delle cosiddette

applicazioni di Electronic Health care Predictive Analytics (e-HPA). Un esempio è APACHE

(Acute Physiology and Chronic Health Examination) un sistema per attribuire una misura del

rischio di mortalità nei reparti di cure intensive. Con le applicazioni e-HPA si identificano invece

quelle pratiche in cui l’analisi di grandi quantità di dati e l’utilizzo di sofisticati modelli matematici

rendono necessario l’affiancamento di un computer al medico.

Page 10: Analisi Predittiva e Apprendimento Automatico · Ovviamente, non si può avere una certezza assoluta, ma si tratta di uno studio probabilistico. Gli Advanced Predictive Analytics

Analisi predittiva e apprendimento automatico

10

Capitolo 3: Le fonti

3.1 I dati

Le fonti di dati utilizzate per creare modelli predittivi spesso includono database SQL, file di log di

attrezzature, immagini, video, audio e dati raccolti dai sensori. La diffusione dei canali digitali

(mobile, web, social…) avvenuta negli ultimi anni ha aumentato enormemente la quantità di dati

disponibili, il numero delle fonti e la complessità dei dati da analizzare: i dati sono oggi interni ed

esterni alle organizzazioni, possono essere strutturati e non strutturati, si trovano offline o online.

Avere tanti dati a disposizione non è un valore di per sé, ma lo è invece la loro combinazione:

l’analisi predittiva mette in relazione dati che possono sembrare non correlati tra loro e genera

nuove conoscenze, che a loro volta possono generare nuove opportunità. Una volta, la difficoltà

principale era disporre di adeguate quantità di dati e di informazioni storiche per poi poterle

gestire. Oggi web-social, multicanalità, assieme alla diffusione di strumenti anche open source in

grado di maneggiare big data, rendono le funzioni d’analisi predittiva alla portata di chi ne

comprende l’importanza. Gli APA sono in grado non solo di analizzare grandi volumi di dati per

approfondire la conoscenza di eventi e fenomeni ma garantiscono anche risultati significativi a

condizione che i dati su cui operano siano affidabili.

La sfida maggiore per l’analisi predittiva è integrarsi nell’architettura delle informazioni già

esistente nelle organizzazioni, con gli ERP, la BI e le altre applicazioni utilizzate. La difficoltà

maggiore rimane quindi la reperibilità di dati storici affidabili, il miglioramento della qualità del

dato risulta essere un tema fondamentale per l’utilizzo di tecniche di previsione per il buon esito di

Page 11: Analisi Predittiva e Apprendimento Automatico · Ovviamente, non si può avere una certezza assoluta, ma si tratta di uno studio probabilistico. Gli Advanced Predictive Analytics

Analisi predittiva e apprendimento automatico

11

un sistema adeguato. L’utilizzo di tecniche di Predictive Analytics risulta tanto più di successo

quanto migliore è la visualizzazione del risultato in maniera dinamica e intuitiva, questo campo

tende quindi a essere intimamente collegato con la visual analytics che vede fiorire tool di

presentazione e visualizzazione dei dati grazie a cruscotti e report specifici proprio perché la

velocità dell’occhio umano consente di cogliere collegamenti, schemi e raggruppamenti in maniera

veloce anche con enormi quantità di dati. La raccolta minuziosa di dati storici rappresenta uno

snodo significativo tra il tentare di comprendere i fenomeni attraverso l’analisi dei dati con un

approccio euristico e l’affidarsi a un procedimento algoritmico basato sulla statistica e su tecniche

di esplorazione automatica del dato.

3.2 Big Data L’enorme potenzialità degli APA è dovuta anche alla possibilità di poter usufruire di una grande

mole di dati, che oggi si ha a disposizione grazie al fenomeno dei Big Data.

La mole e la complessità di dati vecchi e nuovi rappresentano una ricchezza ed un’opportunità, ma

anche una grande sfida per le organizzazioni per quanto concerne i sistemi IT e lo sfruttamento ed

utilizzo delle informazioni.

Con il termine Big Data si intende una raccolta di dati di enormi dimensioni, la cui dimensione e

complessità è tale da non poter essere trattata con i normali strumenti per l’analisi dei dati.

La nascita dei Big Data è dovuta al forte incremento di dati che si hanno a disposizione grazie alle

tecnologie usate oggi. Basti pensare ai dati prodotti dai social network, dalle carte di credito, dai

sensori utilizzati nelle industrie.

Page 12: Analisi Predittiva e Apprendimento Automatico · Ovviamente, non si può avere una certezza assoluta, ma si tratta di uno studio probabilistico. Gli Advanced Predictive Analytics

Analisi predittiva e apprendimento automatico

12

3.2.1 Crescita tridimensionale I Big Data sono nati grazie a tre caratteristiche peculiari che li distinguono:

-volume -varietà -velocità

Figura 2

La prima di queste indica che si tratta di un’enorme mole di dati da trattare. Il volume di dati è

estremamente grande, grazie alle informazioni ottenute dalle tecnologie utilizzate in ogni ambito.

Un esempio è avere a disposizione i dati registrati quotidianamente o addirittura più volte al giorno

dai sensori di un’industria, oppure trattare i dati che produce Twitter quotidianamente, così come

Facebook o Instagram.

Page 13: Analisi Predittiva e Apprendimento Automatico · Ovviamente, non si può avere una certezza assoluta, ma si tratta di uno studio probabilistico. Gli Advanced Predictive Analytics

Analisi predittiva e apprendimento automatico

13

La varietà è dovuta al fatto che i dati raccolti sono molto diversi l’uno dall’altro, una sfida dei Big

Data è quindi riuscire a trovare il modo di analizzarli nonostante l’eterogeneità, si pensi ad esempio

a dati strutturati e non-strutturati.

In quest’ambito sono generalmente utilizzati i cosiddetti database NoSQL.

La velocità dipende dalla produzione rapida e continua di nuove informazioni da salvare e

analizzare.

Page 14: Analisi Predittiva e Apprendimento Automatico · Ovviamente, non si può avere una certezza assoluta, ma si tratta di uno studio probabilistico. Gli Advanced Predictive Analytics

Analisi predittiva e apprendimento automatico

14

Capitolo 4: Tecniche predittive

4.1 Tecniche

Le principali tecniche utilizzate nell’analisi predittiva sono le seguenti:

• Regressione lineare e non lineare

• Simulazioni Monte Carlo

• Reti neurali

• Macchine a vettori di supporto (SVM)

• Strutture ad alberi di decisione

4.1.1 Reti Neurali

Le reti neurali sono una tecnica utile per ottenere predizioni sia nel caso di una relazione lineare tra

predittori e obiettivo (in questo caso il risultato si avvicinerà molto a quello di un modello lineare

tradizionale), sia in presenza di una relazione non-lineare.

La topologia della rete è un grafo orientato con nodi, neuroni artificiali, archi e pesi sinaptici.

Una rete neurale si costruisce prendendo come esempio il modo di elaborare informazioni del

cervello. Si compone di diversi strati:

• Strato di input

• Uno o più strati nascosti

• Strato di output

Page 15: Analisi Predittiva e Apprendimento Automatico · Ovviamente, non si può avere una certezza assoluta, ma si tratta di uno studio probabilistico. Gli Advanced Predictive Analytics

Analisi predittiva e apprendimento automatico

15

Allo strato di input sono associate le unità che rappresentano i campi di input, allo strato di output

quindi sono associate le unità che rappresentano i campi obiettivo.

Alla connessione tra unità è sempre associato un peso che stabilisce un’intensità di connessione. I

dati di input passano al primo strato e i valori vengono propagati allo strato successivo, alla fine si

otterrà un risultato nello strato degli output.

La rete apprende correggendo i pesi ogni volta che sbaglia previsione. All’inizio i pesi saranno

assegnati casualmente e saranno presentati in maniera iterata degli esempi di cui si conosce

l’output per poter ottenere un confronto con il risultato ottenuto, modificando gradualmente i pesi.

In questo modo può avvenire l’apprendimento, al termine del quale si potranno presentare al

modello casi sconosciuti ottenendo una predizione plausibile.

Un esempio di una rete neurale applicata per una predizione in ambito clinico è rappresentata nella

figura seguente:

Page 16: Analisi Predittiva e Apprendimento Automatico · Ovviamente, non si può avere una certezza assoluta, ma si tratta di uno studio probabilistico. Gli Advanced Predictive Analytics

Analisi predittiva e apprendimento automatico

16

Figura 3

Per l’implementazione di soluzioni di questo tipo generalmente si utilizza il linguaggio di

programmazione Python, un linguaggio ad alto livello orientato agli oggetti.

4.1.2 Alberi di Decisione

Le strutture ad alberi di decisione sono modelli utilizzati per ottenere strumenti di classificazione

che, una volta ottenute le regole decisionali, permettono di prevedere osservazioni future.

L’apprendimento automatico consiste nel riuscire ad estrapolare un albero di decisione da un set di

esempi costituiti da input e output, ovvero il training set. Questo algoritmo permette di classificare

nuove situazioni in modo autonomo.

Questa tecnica risulta particolarmente utile quando si desidera visualizzare le partizioni di dati in

sottoinsiemi pertinenti per il problema create dagli attributi all'interno dei dati. La presentazione di

insiemi di regole si rivela utile quando si desidera visualizzare la relazione tra un determinato

gruppo di elementi e una conclusione specifica.

Page 17: Analisi Predittiva e Apprendimento Automatico · Ovviamente, non si può avere una certezza assoluta, ma si tratta di uno studio probabilistico. Gli Advanced Predictive Analytics

Analisi predittiva e apprendimento automatico

17

Anche per sfruttare questa tecnica si può utilizzare il linguaggio di programmazione Python, dato

che questo linguaggio permette una facile implementazione di questo tipo di funzioni.

4.1.3 Regressione

La tecnica della regressione è un potente mezzo statistico che permette di effettuare predizioni.

Questa tecnica si concentra sullo studio della relazione presente tra una variabile risposta o di

output o dipendente, ed una serie di variabili indipendenti di input, i regressori appunto. La

relazione può essere rappresentata nel seguente modo:

Alla funzione f che si può chiamare componente sistematica, si aggiunge un termine dato dalla

presenza di un errore imprevedibile.

Si è in presenza di una regressione lineare se la funzione è di tipo lineare, altrimenti si tratta di

regressione non-lineare. Il linguaggio R risulta essere il più utilizzato per analisi statistiche di

questo tipo.

4.1.4 Support Vector Machine(SVM)

Support Vector Machine (SVM) è una tecnica di classificazione e regressione robusta. Risulta

particolarmente utile nel caso in cui si hanno un numero di campi predittore molto elevato

(nell’ordine delle migliaia).

SVM mappa i dati a uno spazio di funzioni altamente dimensionale in modo che sia possibile

categorizzare i punti dati, anche quando i dati non sono separabili linearmente in altro modo. Viene

trovato un separatore tra le categorie e quindi i dati vengono trasformati in modo che il separatore

Page 18: Analisi Predittiva e Apprendimento Automatico · Ovviamente, non si può avere una certezza assoluta, ma si tratta di uno studio probabilistico. Gli Advanced Predictive Analytics

Analisi predittiva e apprendimento automatico

18

possa essere tracciato come un iperpiano. In seguito, è possibile utilizzare le caratteristiche dei

nuovi dati per prevedere il gruppo al quale deve appartenere un nuovo record.

Di seguito è riportata la rappresentazione dei dati prima e dopo la trasformazione:

Figura 4

La retta ottenuta si chiama iperpiano del margine massimo. SVM è quindi l’algoritmo utilizzato per

trovare i vettori di supporto e utilizzarli per trovare l’iperpiano.

SVM è molto utilizzato per algoritmi di riconoscimento facciale, riconoscitore di grafia. Per

utilizzare questa tecnica si può usufruire di una libreria chiamata LIBSVM, scritta in C++ e

contenente anche un wrapper Python.

4.1.5 Simulazione Monte Carlo

La simulazione Monte Carlo si basa su un principio: valutare il comportamento statistico di

campioni casuali attraverso il processo empirico di estrarre molti campioni e osservando il loro

comportamento.

La simulazione avviene approssimando il contesto reale d’interesse con un modello controllabile

che ne sintetizza gli aspetti più rilevanti.

In questo modo si può accrescere la comprensione del comportamento del contesto studiato,

verificando o negando ipotesi su di esso.

Page 19: Analisi Predittiva e Apprendimento Automatico · Ovviamente, non si può avere una certezza assoluta, ma si tratta di uno studio probabilistico. Gli Advanced Predictive Analytics

Analisi predittiva e apprendimento automatico

19

Page 20: Analisi Predittiva e Apprendimento Automatico · Ovviamente, non si può avere una certezza assoluta, ma si tratta di uno studio probabilistico. Gli Advanced Predictive Analytics

Analisi predittiva e apprendimento automatico

20

Capitolo 5: Tecnologie disponibili

Il mercato degli APA è in fermento. Sono numerose le acquisizioni delle aziende leader di mercato

di altre aziende che hanno sviluppato soluzioni avvincenti di analisi predittiva. Ad esempio, SAP

ha acquisito KXEN, formando la base dell’offerta di “InfiniteInsight”. Altre acquisizioni sono state

fatte come parte di una strategia più globale legata ai Big Data, come nel caso di Dell che ha

acquisito “StatSoft”. Un’altra tendenza importante è l’aumento di strumenti, linguaggi e ambienti

open source (come R, Weka o Mahout) significativo per la diffusione della tecnologia APA in

generale. Infine, secondo IDC, la diffusione degli strumenti di visual data discovery e altri

strumenti semplificati APA promuoveranno l’adozione dell’analisi predittiva in un pubblico più

vasto di business, perché forniscono meno flessibilità dei tool più potenti per la modellizzazione,

ma hanno un’interfaccia utente grafica di più facile comprensione per gli utenti. Una tecnologia

presente sul mercato è Accenture Analytics Applications Platform che permette di offrire

applicazioni specifiche per mercato e per processo di business in grado di fornire supporto

quotidiano ai decision maker e ai business user, in modo da rendere le Predictive Analytics

utilizzabili in automatico e in tempo reale per raggiungere importanti obiettivi come la riduzione

dei costi e l’aumento dei ricavi. Anche IBM è presente sul mercato con il prodotto IBM SPSS

Modeler, una piattaforma di Predictive Analytics per inserire l'intelligence predittiva nel processo

decisionale gestito da persone, gruppi, sistemi e aziende.

In Zucchetti sono state sviluppate le Infinity Analytics, funzionalità avanzate di business

intelligence, che si possono integrare a tutti gli applicativi di gestione aziendale, per estrarre i dati

generati dall’impresa e trasformarli in informazioni utili a prendere decisioni.

Page 21: Analisi Predittiva e Apprendimento Automatico · Ovviamente, non si può avere una certezza assoluta, ma si tratta di uno studio probabilistico. Gli Advanced Predictive Analytics

Analisi predittiva e apprendimento automatico

21

Vi è poi sempre più la tendenza di sfruttare gli strumenti previsionali per valutare quali sono le

nuove linee di prodotto o i nuovi mercati. Sinfo One ad esempio supporta questa linea di tendenza

con una soluzione basata su tecnologia Oracle Hyperion.

Page 22: Analisi Predittiva e Apprendimento Automatico · Ovviamente, non si può avere una certezza assoluta, ma si tratta di uno studio probabilistico. Gli Advanced Predictive Analytics

Analisi predittiva e apprendimento automatico

22

Capitolo 6: Un caso di studio: manutenzione predittiva

Si vuole ora riportare un’applicazione dell’analisi predittiva nel mondo industriale, in particolare

per ciò che riguarda l’organizzazione della manutenzione.

6.1 Manutenzione classica

La manutenzione classica si basa su quella correttiva e preventiva:

• la correttiva consiste nella riparazione dei componenti guasti al termine del servizio del mezzo

• la preventiva riguarda le operazioni previste con scadenze fisse, in genere temporali

Gli svantaggi di questo tipo di manutenzione sono diversi. Innanzitutto, si subiscono gli effetti dei

guasti che saranno riparati successivamente, inoltre le scadenze date dalla manutenzione preventiva

possono raggruppare attività non omogenee.

6.2 Cos’è la manutenzione predittiva

La Manutenzione predittiva è un tipo di manutenzione preventiva che viene effettuata a seguito

dell'individuazione di uno o più parametri che vengono misurati ed estrapolati utilizzando

appropriati modelli matematici allo scopo di individuare il tempo residuo prima del guasto.

Riuscire ad individuare precocemente le anomalie consentirebbe una migliore gestione

dell'esercizio e delle manutenzioni, evitando importanti ripercussioni di tipo economico ed

Page 23: Analisi Predittiva e Apprendimento Automatico · Ovviamente, non si può avere una certezza assoluta, ma si tratta di uno studio probabilistico. Gli Advanced Predictive Analytics

Analisi predittiva e apprendimento automatico

23

ambientale. Per tale motivo, è necessario associare alle tradizionali pratiche manutentive nuove e

più innovative strategie basate su azioni predittive.

L'analisi dello stato di salute del macchinario consente non solo di anticipare il verificarsi di un

guasto, ma anche di indirizzare efficacemente le risorse di manutenzione là dove il macchinario lo

richiede. Il risultato finale è l'ottimizzazione delle risorse economiche ed il miglioramento

dell'indice di efficienza complessiva economica.

6.3 Obiettivi della manutenzione predittiva

I principali obiettivi che si pone l’approccio della manutenzione predittiva sono una riduzione dei

costi di manutenzione, un aumento della affidabilità e della disponibilità.

Questi obiettivi si possono raggiungere tramite gli effetti dell’applicazione dell’analisi predittiva.

In particolare, attraverso il miglioramento nella gestione dei guasti nel processo manutentivo, il

superamento delle scadenze di tempo o chilometri con modifiche strutturali ai piani di

manutenzione, ed infine una diminuzione sostanziale dei guasti in esercizio.

6.4 Come avviene la manutenzione predittiva

Per poter applicare una manutenzione predittiva sono necessarie le installazioni di strumenti

opportuni.

Gli interventi di Trenitalia per il proprio progetto di manutenzione predittiva ad esempio, sono

stati:

• l’installazione di strumenti di telediagnostica di bordo in grado di trasmettere i propri dati

• l’installazione negli impianti di manutenzione di strumenti per la diagnosi

Page 24: Analisi Predittiva e Apprendimento Automatico · Ovviamente, non si può avere una certezza assoluta, ma si tratta di uno studio probabilistico. Gli Advanced Predictive Analytics

Analisi predittiva e apprendimento automatico

24

• un nuovo sistema di gestione della manutenzione, il Dynimic Maintenance Management

System

In questo modo sui treni sono installati computer connessi agli strumenti di bordo e dotati di

collegamento dati cellulare in grado di trasmettere con scarico dati diagnostici a terra.

Ai dati generati dalla strumentazione di bordo si aggiungono le informazioni generate da centinaia

di sensori.

La manutenzione predittiva può essere approcciata in due modi diversi:

• classificare situazioni di anormalità e monitorarne con continuità la distanza

• identificare la normalità e misurarne con continuità lo scostamento

Nel primo caso le anomalie sono classificate sulla base dei ritorni di esperienza: riserve,

accudienze che hanno provocato problemi in esercizio. Il sistema ricerca se ci sono condizioni sui

dati di processo ripetute.

Nel secondo si possono identificare le configurazioni più probabili e trovarne gli scostamenti.

L’analisi predittiva avviene consultando due insiemi di indicatori:

• indicatori di salute

• indicatori di vita residua

Si tiene conto dello stato funzionale attuale attraverso le misure di parametri specifici. La

manutenzione viene fatta quando tali indicatori escono dal range di normale funzionamento.

Tali indicatori sono elaborati a partire dalle misure che arrivano dagli strumenti integrate con

quelle dei sistemi diagnostici di terra più dati che vengono da altre fonti (ad esempio sistemi di

circolazione, sistemi rilevazione meteo etc.).

Sulla base di questi indicatori il sistema Big Data incrocia la salute e la vite dei componenti

proiettando la vita residua dei componenti nel dominio dell’indicatore prescelto.

Page 25: Analisi Predittiva e Apprendimento Automatico · Ovviamente, non si può avere una certezza assoluta, ma si tratta di uno studio probabilistico. Gli Advanced Predictive Analytics

Analisi predittiva e apprendimento automatico

25

L’algoritmo di predizione può essere implementato tramite le reti neurali, utilizzando ad esempio

l’ambiente di lavoro Matlab. Di seguito si riporta una figura come esempio di sessione di lavoro su

Matlab per l’analisi dei dati da sensori adoperando la tecnica di apprendimento delle reti neurali.

Figura 5

Page 26: Analisi Predittiva e Apprendimento Automatico · Ovviamente, non si può avere una certezza assoluta, ma si tratta di uno studio probabilistico. Gli Advanced Predictive Analytics

Analisi predittiva e apprendimento automatico

26

Conclusioni

Lo svolgimento dell’elaborato ha permesso di fare diverse osservazioni.

Innanzitutto, si è notato che tra le varie possibili tecniche per l’analisi predittiva non ce n’è una

migliore delle altre, ma ognuna di queste può risultare la più utile in base al contesto di utilizzo.

Nel caso della manutenzione predittiva, ad esempio, è stata la tecnica delle reti neurali la più

conveniente per creare un modello predittivo utilizzando i dati trasmessi dai sensori industriali.

Si è inoltre osservato che al momento vi sono molte discussioni in merito ad un problema etico

dell’intelligenza artificiale: gli strumenti dell’analisi predittiva devono necessariamente rimanere

esclusivamente un supporto alle decisioni dell’uomo, dato che un’analisi etica non può essere

demandata ad una macchina. Dovrà essere sempre il progettista il responsabile di questo tipo di

decisioni.

Page 27: Analisi Predittiva e Apprendimento Automatico · Ovviamente, non si può avere una certezza assoluta, ma si tratta di uno studio probabilistico. Gli Advanced Predictive Analytics

Analisi predittiva e apprendimento automatico

27

Sviluppi Futuri

I principali sviluppi dei sistemi di predizione andranno verso un più capillare utilizzo ed una

maggiore diffusione di questi strumenti che avranno un notevole miglioramento delle prestazioni in

termini di affidabilità e di precisione dei dati prodotti. In seguito ad un’analisi svolta

dall’università Bocconi di Milano è risultato che la diffusione dei Predictive Analytics è ancora

parziale, circa il 24% delle aziende ne fa utilizzo. È prevista però una diffusione tale da

raddoppiare questa percentuale entro un anno.

Dal punto di vista della ricerca, la strada che si sta percorrendo è concentrata verso la Knowledge

Augmentation, ossia un percorso di ottimizzazione e miglioramento mediante moderni e più

evoluti motori di Machine Learning.

In effetti, ancora si registrano dei bug nelle applicazioni di intelligenza artificiale, tali bug in alcuni

casi potrebbero far sorridere, in altri potrebbero essere responsabili di conseguenze fatali. Per

esempio, in molti test dei veicoli senza conducente il sistema di AI ha interpretato erroneamente

della segnaletica stradale a causa di alcune imperfezioni che all’occhio umano sarebbero passate

inosservate.

Risulta necessario, quindi, effettuare un miglioramento delle tecniche e dei sistemi per poter ridurre

il margine di errore. Infatti, il futuro che si prospetta vede una forte presenza delle macchine e

Page 28: Analisi Predittiva e Apprendimento Automatico · Ovviamente, non si può avere una certezza assoluta, ma si tratta di uno studio probabilistico. Gli Advanced Predictive Analytics

Analisi predittiva e apprendimento automatico

28

intelligenze artificiali a supporto dell’uomo, causando un grande impatto nel mondo lavorativo,

creando ad esempio nuove tipologie di competenze e nuove tipologie di lavori.

Page 29: Analisi Predittiva e Apprendimento Automatico · Ovviamente, non si può avere una certezza assoluta, ma si tratta di uno studio probabilistico. Gli Advanced Predictive Analytics

29

Bibliografia

[1] Eric Siegel, Predictive Analytics: the power to predict who will click, buy, lie or die, wiley,

2013 , 1-11

[2] A.Waller S.Fawcett, Data Science,Predictive Anaytics: a revolution that wil transform supply

chain design and management, Journal of buisness logistics, 2013, 77-84

[3] Philip Russom, Big Data Anaytics, Fourth Quarter 2011

[4] Toby Segaran, Programming Collective Intelligence, 2007, O’Reilly

[5] www.ibm.com, https://www.ibm.com/analytics/data-science/predictive-analytics , 1/02/2018

[6] www.gartner.com,

https://www.gartner.com/technology/home.jsp?utm_expid=.ZOWJVOSPSSa8IBKZs6ZG3A.0&ut

m_referrer=, 10/02/2018

[7] www.datamanager.it, http://www.datamanager.it/2015/02/predire-futuro-si-puo/ , 2/02/2018

[8] www.sas.com, https://www.sas.com/it_it/insights/big-data/what-is-big-data.html , 5/02/2018

[9] www.idc.com , https://www.idc.com/home.jsp , 25/01/2018

[10] www.cifi.it , http://www.cifi.it/ (collegio ingegneri ferroviari itliani) , 18/02/2018

Page 30: Analisi Predittiva e Apprendimento Automatico · Ovviamente, non si può avere una certezza assoluta, ma si tratta di uno studio probabilistico. Gli Advanced Predictive Analytics

30

Figura 1 tratta da Predictive Analytics: the power to predict who will click, buy, lie or die, wiley,

2013

Figura 2 tratta da http://bigobject.blogspot.it

Figura 3, Figura 4 tratte da www.ibm.com

Figura 5 tratta da it.mathwork.com