Tutto_Misure n.3 - 2021

Page 65

MISURE E FIDATEZZA

s

Rubrica a cura di L. Cristaldi, (loredana.cristaldi@polimi.it), M. Catelani, M. Lazzaroni, L. Ciani Articolo di Vincenzo Manzoni

vmanzoni@tenaris.com

La qualità del dato in processi di data science Il caso Tenaris DATA QUALITY IN DATA SCIENCE PROCESSES: THE TENARIS CASE This paper is aimed at highlighting the importance of assessing data quality in data science processes when used to achieve industrial innovation. In particular, the stages of signal processing and generation of the training set are considered, as critical steps. A metrological-sound approach is still much needed to fully exploit the available data, especially when coming from the field.

RIASSUNTO L’articolo sottolinea l’importanza di garantire la qualità dei dati nell’impiego della data science nell’innovazione industriale. In particolare, vengono analizzati i due step critici di elaborazione dei segnali e di generazione deli dati di addestramento. Se ne deduce la necessità di un approccio metrologicamente corretto per poter sfruttare appieno i dati disponibili, soprattutto quelli provenienti dal campo. LA DATA SCIENCE NEI PROCESSI interattive, distribuite ai nostri clienti inD’INNOVAZIONE INDUSTRIALE terni attraverso interfacce web e mobi-

Tenaris è tra i maggiori produttori e fornitori globali di tubi in acciaio e servizi per l’industria energetica mondiale e per altre applicazioni industriali. Nel 2016 Tenaris ha creato un dipartimento di Data Science all’interno dell’area di Industrial Processes Innovation con lo scopo di migliorare i propri processi industriali sfruttando i dati. Il dipartimento ha due sotto-dipartimenti: il primo di Advanced Data Analytics e l’altro di Statistical Modeling. I prodotti risultanti da un’attività di data analytics sono distanti dall’acquisizione dei dati dal campo. Quindi, a maggior ragione, è ancora più importante quantificare la qualità di un dato per capire se la qualità è sufficiente per far parte dei nostri prodotti. Prima di entrare nel merito di cosa è per noi la qualità del dato, di come quantificarla e quali azioni prendere nei vari scenari, vediamo quali sono i principali prodotti data-driven realizzati da Tenaris. Il primo prodotto sono visualizzazioni

parti dei nostri processi produttivi. Il terzo prodotto sono ottimizzatori di funzioni di costo che tengono conto di vincoli di disponibilità di materiale, vincoli di processo, vincoli d’impianto. Questi tre prodotti sono accomunati dal fatto che partono tutti da dataset di dati di processo di alta qualità. Inoltre, la loro qualità (intesa, rispettivamente, come affidabilità delle metriche mostrate, accuratezza delle previsioni dei modelli e ottimo della funzione di costo) deriva dalla qualità dei dati d’input. Per questo il sapere quantificare la qualità dei dati che provengono dal campo e definire come comportarsi in funzione di diversi scenari ha un ruolo importante per la qualità finale dei nostri prodotti. L’architettura tecnologica che ci permette di passare dagli input ai prodotti finali (come detto precedentemente, visualizzazioni interattive, modelli data driven e ottimizzatori) è raffigurata in Fig. 1. A sinistra si possono vedere i principali input, raccolti dal campo da automazione e che ci vengono resi disponibili attraverso due modalità: file di testo, per i sistemi legacy non ancora integrati nei nostri sistemi di automazione, o database relazionali per i sistemi più recenti. Nella figura si vedo-

le. Queste visualizzazioni interattive mostrano metriche misurate direttamente dai nostri processi produttivi o ricavate attraverso il signal processing di serie storiche. Gli scopi finali di queste visualizzazioni interattive sono diversi. Un esempio è il monitoraggio che le nostre macchine operino all’interno del proprio regime nominale. Un altro esempio è l’assessment di una particolare fase del nostro processo produttivo con lo scopo di definire un piano di miglioramento. Come diretta conseguenza, la stessa visualizzazione interattiva verrà usata anche per il monitoraggio del piano di miglioramento. Il secondo prodotto sono modelli data-driven, prevalentemente Figura 1 – Architettura Data Science. L’architettura reale con tecniche di maè stata semplificata per esigenze di presentazione chine learning, di T_M

N.

3/21  65


Turn static files into dynamic content formats.

Create a flipbook
Issuu converts static files into: digital portfolios, online yearbooks, online catalogs, digital photo albums and more. Sign up and create your flipbook.
Tutto_Misure n.3 - 2021 by Tutto_Misure - Issuu