In matematica, e in particolare in analisi numerica, per interpolazione si intende un metodo per individuare nuovi punti del piano cartesiano a partire da un insieme finito di punti dati, nell'ipotesi che tutti i punti si possano riferire ad una funzione di una data famiglia di funzioni di una variabile reale.
Nelle attività scientifiche e tecnologiche, e in genere negli studi quantitativi di qualsiasi fenomeno, accade molto spesso di disporre di un certo numero di punti del piano ottenuti con un campionamento o con apparecchiature di misura e di ritenere opportuno individuare una funzione che passi per tutti i punti dati o almeno nelle loro vicinanze (vedi curve fitting).
Definizione del problema
Sia data una sequenza di n numeri reali distinti chiamati nodi e per ciascuno di questi sia dato un secondo numero . Ci proponiamo di individuare una funzione di una certa famiglia che sia in grado di descrivere una relazione tra l'insieme degli e quello degli , ovvero
.
Una coppia viene chiamato punto dato ed viene detta funzione interpolante, o semplicemente interpolante, per i punti dati.
Talora i valori , quando si intendono riferiti a una funzione definita, si scrivono .
Esempio
Si supponga di avere la seguente tabella, che dà alcuni valori di una funzione che si può considerare nota in altra sede.
0
0
1
0,8415
2
0,9093
3
0,1411
4
-0,33
5
-0,9589
6
-0,2794
L'interpolazione consente di stabilire il valore di per valori di compresi tra gli estremi dell'intervallo in esame ma che non sono tra quelli per cui è noto, ad esempio per .
Esistono molti metodi differenti di interpolazione; verranno di seguito descritti, a grandi linee, solo quelli più rilevanti per la comprensione della problematica.
Per capire se il metodo scelto e la funzione interpolante trovata sono adatti, occorre rispondere a quattro quesiti di linea generale:
Uno dei metodi più semplici è l'interpolazione lineare. Si consideri di voler determinare nell'esempio precedente.
Poiché 2.5 è il punto medio fra 2 e 3, è ragionevole individuare come il valore medio fra e : in tal modo si ottiene .
In generale, l'interpolazione lineare per ogni coppia di punti dati consecutivi, denotati e , definisce come funzione interpolante nell'intervallo :
.
Questa formula può essere interpretata come valutazione della media ponderata.
L'interpolazione lineare è rapida e facile, ma non è molto precisa e porta ad ottenere una funzione non differenziabile nei punti .
La seguente stima dell'errore indica la scarsa precisione dell'interpolazione lineare. Indichiamo con la funzione interpolante e supponiamo che la sia compresa fra e e che sia due volte differenziabile.
Allora l'errore dell'interpolazione lineare è
.
Quindi, l'errore è proporzionale al quadrato della distanza fra i punti dati.
Altri metodi, comprese l'interpolazione polinomiale e l'interpolazione spline, descritti di seguito, producono funzioni più lisce ed errori di interpolazione proporzionali a potenze superiori della distanza fra i punti dati, quindi sono preferibili.
L'interpolazione polinomiale può considerarsi una generalizzazione dell'interpolazione lineare. Mentre l'interpolante lineare è una sequenza di funzioni lineari, nell'interpolazione polinomiale si cerca come interpolante un polinomio di un grado opportuno (grado che nel caso dell'interpolazione lineare sarebbe pari a 1).
Per il problema dato sopra si trova che il seguente polinomio di sesto grado passa attraverso tutti i sette punti:
.
Assegnando , troviamo che .
In generale, quando si hanno n punti dati, esiste esattamente un polinomio di grado n−1 che passa attraverso tutti tali punti. L'errore di interpolazione è proporzionale alla distanza fra i punti dati elevata alla potenza n-esima.
L'interpolante, inoltre, in quanto polinomio, è illimitatamente differenziabile. L'interpolazione polinomiale, quindi, evita tutte le difficoltà incontrate dalla interpolazione lineare.
Se si riprendono i 4 quesiti visti in precedenza, si vede che l'interpolazione polinomiale presenta alcuni svantaggi. Il calcolo del polinomio d'interpolazione è molto costoso in termini computazionali e l'interpolazione polinomiale non risulta molto esatta nell'intero dominio della funzione; in particolare nei punti estremi dell'intervallo si manifesta il cosiddetto fenomeno di Runge. Questi svantaggi possono essere evitati usando altre interpolazioni, in particolare l'interpolazione spline.
Dei tre, l'ultimo non produce mai asintoti e garantisce un modesto errore anche con piccoli intervalli, anche con le funzioni che con i polinomi causano il fenomeno di Runge.
Il vantaggio dell'approssimazione razionale è che, ad esempio nella funzione , l'interpolazione polinomiale causa delle forti oscillazioni, soprattutto fuori dai valori tabellati (estrapolazione), mentre la razionale ha meno oscillazioni e coinvolge meno calcoli dell'interpolazione spline, essendo generalmente implementata in per il calcolo dei pesi, da farsi una tantum per i valori tabulati, e per l'interpolazione.
Mentre l'interpolazione lineare utilizza una funzione lineare per ciascuno degli intervalli , la interpolazione spline si serve nei suddetti intervalli di polinomi di grado piccolo, scegliendoli in modo che due polinomi successivi si saldino in modo liscio. La funzione che si ottiene con un procedimento di questo genere si chiama funzione spline.
Per esempio, la spline naturale cubica è a tratti cubica, due volte differenziabile e presenta derivata seconda uguale a zero nei punti finali. La spline naturale cubica che interpola i punti nella tabella qui sopra è così definita
La funzione interpolante ottenuta con la interpolazione spline, come quella ottenuta con la interpolazione polinomiale, rispetto a quella ottenuta con l'interpolazione lineare, presenta errori inferiori, è più liscia, risulta più facile da valutare e non soffre del fenomeno di Runge.
In alcuni ambiti applicativi può accadere di disporre non solo di alcuni valori della funzione che vogliamo interpolare, ma anche di valori della sua derivata. In questi casi si trattano i cosiddetti problemi della interpolazione di Hermite.
Nozioni collegate
Si usa il termine estrapolazione per l'attività finalizzata a trovare valori di una funzione reale per valori della che sono al di fuori dell'intervallo dell'asse reale che contiene i punti nei quali sono noti i valori che essa assume.
Nei problemi di regressione o di adattamento di curve (curve fitting) si abbandona il vincolo che impone alla funzione interpolante di passare esattamente per i punti dati e si richiede solo una curva approssimante che si avvicini il più possibile ai punti dati.
Un problema diverso dalla interpolazione, ma strettamente collegato con esso, è l'approssimazione di una funzione complicata mediante una più semplice e che presenti un andamento simile. Supponiamo di conoscere la funzione di partenza , ma che questa sia tanto complessa da non potersi valutare efficientemente. Possiamo allora considerare un determinato insieme dei suoi punti e cercare di interpolarli per individuare una funzione più semplice. Naturalmente quando si utilizzerà la funzione approssimante per calcolare nuovi valori si avranno risultati diversi dagli ottenibili se calcolassimo la funzione originale; tuttavia, in certi ambiti applicativi e in seguito all'adozione di opportuni metodi di interpolazione, il vantaggio della maggiore semplicità e della conseguente maggiore manovrabilità può rendere poco rilevante l'errore.
La teoria dell'approssimazione studia come trovare la migliore approssimazione di una funzione con una funzione che appartiene ad una classe predeterminata e quanto risulta buona una tale funzione approssimante. Naturalmente si incontrano delle limitazioni a quanto una interpolante riesca ad approssimare la funzione originale.
Whittaker, Edmund Taylor; Robinson G (1924): The calculus of observations, Blackie & Sons. (capitoli 1-4 per interpolazione polinomiale e capitolo 10 per interpolazione con serie di Fourier).