Tutto_Misure 03/2011

Page 53

VISIONE ARTIFICIALE

A cura di Giovanna Sansoni (giovanna.sansoni@ing.unibs.it)

Visione e taratura Il back stage della visione industriale

VISION AND CALIBRATION THE BACKSTAGE OF INDUSTRIAL VISION The section on Artificial Vision is intended to be a “forum” for Tutto_Misure readers who wish to explore the world of components, systems, solutions for industrial vision and their applications (automation, robotics, food&beverage, quality control, biomedical). Write to Giovanna Sansoni and stimulate discussion on your favorite topics. RIASSUNTO La rubrica sulla visione artificiale vuole essere un “forum” per tutti i lettori della rivista Tutto_Misure interessata a componenti, sistemi, soluzioni per la visione artificiale in tutti i settori applicativi (automazione, robotica, agroalimentare, controllo di qualità, biomedicale). Scrivete alla Prof. Sansoni e sottoponetele argomenti e stimoli. In una rivista incentrata sul tema delle misure, sulla taratura e la calibrazione degli strumenti e sulla valutazione delle relative incertezze di misura, non potevo esimermi dal dare il mio contributo in materia di taratura e calibrazione di sistemi di visione. Con il termine camera calibration si identifica tutto l’insieme di operazioni che fanno di un sensore, quale è la telecamera, un sistema di misura. Che si tratti di una singola telecamera, di un set di telecamere, che si abbia a che fare con un sistema 2D o con un sistema 3D, il nocciolo della questione è stabilire una relazione che consenta di trasformare i valori contenuti in una matrice (immagine) in misure espresse nel mondo reale, corredate del proprio dato d’incertezza. Anche con le telecamere dunque, bisogna tarare e calibrare. La taratura implica che si osservi il dato di precisione, mentre la calibrazione serve per migliorare le prestazioni di accuratezza. Si deve comunque adottare un approccio per confronto e far cooperare le due fasi fino all’ottenimento delle prestazioni desiderate. Per fare questo, bisogna approcciare il problema in modo tipicamente

matematico: si cerca cioè di ricondurre il funzionamento del dispositivo ad alcune equazioni che tengono conto di tutti i processi che intervengono nell’acquisizione di un’immagine; conoscendo la struttura di questo modello matematico, eseguire la calibrazione di un particolare dispositivo reale significa stimare i valori dei coefficienti che ne descrivono il funzionamento nel modo più accurato possibile. Scrivere il modello di funzionamento di una telecamera significa stabilire il legame che esiste fra il mondo reale (e tridimensionale) in cui è espressa la scena e la matrice di livelli di grigio che la rappresenta. Non è un passaggio banale questo, poiché implica (i) che si definisca un sistema di riferimento solidale con la scena, (ii) che lo si metta in relazione con il sistema di riferimento solidale con la telecamera, (iii) che si scelga il livello di sofisticazione con il quale modellizzare il sistema ottico in ingresso alla telecamera, (iv) che si descriva la matrice sensore al suo interno, e, infine, (v) che si ponga in relazione la matrice immagine con la matrice sensore. Vengono quindi presi in considerazione quattro sistemi di riferimento, due tridi-

mensionali, esterni al dispositivo, e due bidimensionali, interni ad esso; inoltre bisogna decidere come modellizzare il sistema di lenti: limitarsi a ‘scommettere’ che l’influenza di distorsioni ottiche sia trascurabile semplifica enormemente il problema, perché ne consente la formulazione in termini lineari; viceversa, la compensazione di errori legati a effetti di distorsione ottica richiede la scrittura di modelli che coinvolgono un maggior numero di parametri, inevitabilmente in relazione non lineare con gli altri. Uno dei modelli più utilizzati per effettuare la ‘Camera Calibration’ è il così detto modello Pin-hole [1]. Esso utilizza 3 parametri di rotazione e 3 di traslazione, che servono per istruire la telecamera sulla sua posizione e orientamento rispetto alla scena reale (parametri estrinseci). Questo modello utilizza un solo parametro per descrivere il sistema di lenti in ingresso alla telecamera, ed è la lunghezza focale; esso definisce il piano sensore mediante due opportuni fattori di scala, che lo mettono in relazione all’immagine. Questa, infine, è descritta dalla sua risoluzione, e dalle coordinate dell’elemento centrale. Dunque in tutto sono 11 parametri, organizzati in un sistema lineare, che ha come termini noti le coordinate di ciascun elemento dell’immagine. Quando invece si voglia tenere in considerazione l’elemento distorsione le cose si complicano. Infatti la distorsione può essere semplicemente geometrica, oppure ottica, e anche qui c’è una bella casistica. Distorsione tangenziale? Distorsione radiale? Ambedue? Fino a che punto sofisticare il problema e renderne complessa la soluzione? Fra i modelli sviluppati particolare importanza hanno quelli che compensano il contributo di distorsione radiale. La letteratura è ricchissima di proposte, metodi e soluzioni [2]. La versione base, che è stata proposta alla fine degli anni

T_M

N.

3/11 ƒ 211


Turn static files into dynamic content formats.

Create a flipbook
Issuu converts static files into: digital portfolios, online yearbooks, online catalogs, digital photo albums and more. Sign up and create your flipbook.