Virhe merkitsee kokeellisissa tieteissä yleensä mittauksiin liittyvää virhearviota, joka kuvaa mittauksen tarkkuutta. Mittausvirheet voidaan jakaa kolmeen eri ryhmään: karkea virhe, systemaattinen virhe ja satunnainen virhe. Tässä artikkelissa tarkastelemme, kuinka virhe ilmoitetaan ja miten satunnaisen virheen osuus lasketaan.
Satunnainen eli tilastollinen eli statistinen virhe on mittauksissa aina läsnä. Satunnaisen virheen osuus alkaa näkyä, kun mittalaite on tarpeeksi tarkka. Esimerkiksi jos jousen venymää mittaa metrimitalla senttimetrin tarkkuudella on melko varmaa, että saa aina tulokseksi saman tuloksen. Kuitenkin, jos edelleen mittaa samaa venymää millimetrin kymmenesosan tarkkuudella, saa joka kerta hieman eri tuloksen. Yleensä mittaustulokset noudattavat normaalijakaumaa ja seuraavassa käsitellään tarkemmin tätä erikoistapausta. Kun sama mittaus toistetaan useamman kerran, saadaan otos, josta voidaan laskea otoskeskiarvo x ¯ {\displaystyle {\overline {x}}} , otoshajonta s {\displaystyle s} ja keskiarvon keskivirhe s x ¯ {\displaystyle s_{\overline {x}}} .
Otoshajonta s {\displaystyle s} kertoo mille välille [ x ¯ − s , x ¯ + s ] {\displaystyle [{\overline {x}}-s\ {,}\ {\overline {x}}+s]} seuraava mittauspiste noin 68 %:n (niin sanottu "1 sigma"-todennäköisyys) todennäköisyydellä osuu. Keskiarvon keskivirhe s x ¯ {\displaystyle s_{\overline {x}}} kertoo mille välille [ x ¯ − s x ¯ , x ¯ + s x ¯ ] {\displaystyle [{\overline {x}}-s_{\overline {x}}\ {,}\ {\overline {x}}+s_{\overline {x}}]} seuraavan otoksen otoskeskiarvo noin 68 %:n todennäköisyydellä osuu. Näin ollen keskiarvoa ilmoitettaessa tulee käyttää keskiarvon keskivirhettä ellei jakauman hajonta ole itsessään kiinnostava.
Otoskeskiarvo lasketaan N {\displaystyle N} :stä havainnosta ( x 1 , x 2 , . . . , x N ) {\displaystyle (x_{1}{,}x_{2}{,}...{,}x_{N})} :
otoshajonta
ja keskiarvon keskivirhe
Tieteellisessä julkaisussa jokaiselle tulokselle tulisi ilmoittaa virhe, jotta tuloksia, eri mittausmenetelmiä ja niiden tarkkuuksia voidaan vertailla keskenään. Kokeen ja teorian vertailu myös edellyttää tarkkaa tietoa siitä, millä välillä tulos kokeen mukaan on ehdottomasti (esimerkiksi 95 %:n tarkkuudella, niin sanottu "kaksi sigma"-todennäköisyys), jotta teorioita voidaan parantaa ja niiden puutteet havaita. Virheiden ilmoittamisen käytäntö on hyvin kirjava ja siksi lukijalle saattaa jäädä epäselväksi onko ilmoitettu virhe jakauman hajonta, keskiarvon keskivirhe, mittarin lukematarkkuus vai kenties niin sanottu maksimivirhe eli suurin mahdollinen poikkeama tuloksesta. Tämä tulisi aina selkeästi ilmoittaa.
Virheen merkkinä käytetään yleensä symbolia Δ {\displaystyle \Delta } tai δ {\displaystyle \delta } . Absoluuttinen virhe kirjoitetaan suureen yhteyteen käyttämällä ± {\displaystyle \pm } -merkkiä. Esimerkiksi suureen x {\displaystyle x} virhe merkitään Δ x {\displaystyle \Delta x} , ja kun tulos ilmoitetaan, se kirjoitetaan x ± Δ x {\displaystyle x\pm \Delta x} . Tällä tavoin ilmoitetaan suureen virherajat. Toisin sanoen, jos virhe on keskiarvon keskivirhe, on noin 68 %:n todennäköisyys, että uuden mittaussarjan keskiarvo antaa tuloksen väliltä x − Δ x {\displaystyle x-\Delta x} ja x + Δ x {\displaystyle x+\Delta x} . Jos halutaan antaa tarkemmat virherajat, voidaan ilmoittaa, millä todennäköisyydellä, joka on suurempi kuin tämä niin sanottu 1 σ {\displaystyle 1\sigma } -todennäköisyys (noin 68 %), tulos on tällä välillä.
Joskus virhe ilmoitetaan suluissa tuloksen perässä. Erityisesti taulukoissa tällainen tapa on yleinen tilan säästämiseksi. Esimerkiksi Planckin pituus saatetaan ilmoittaa 1,616 255 ( 18 ) ⋅ 10 − 35 m = ( 1,616 255 ± 0,000 018 ) ⋅ 10 − 35 m {\displaystyle 1{,}616\,255(18)\cdot 10^{-35}\,\mathrm {m} =(1{,}616\,255\pm 0{,}000\,018)\cdot 10^{-35}\,\mathrm {m} } , missä virhe on siis 0 , 18 ⋅ 10 − 39 m {\displaystyle 0{,}18\cdot 10^{-39}\,\mathrm {m} } .
Suhteellinen virhe Δ x x {\displaystyle {\frac {\Delta x}{x}}} on toinen tapa ilmoittaa virhe ja yleensä se annetaan prosenteissa eli kerrotaan sadalla.
Jännite vastuksen yli mitattiin kuusi kertaa volttimittarilla. Mittarin lukematarkkuus oli 0 , 01 V {\displaystyle 0{,}01\ {\textrm {V}}} . Mittaustuloksiksi saatiin 4 , 98 V {\displaystyle 4{,}98\ {\textrm {V}}} , 4 , 96 V {\displaystyle 4{,}96\ {\textrm {V}}} , 5 , 04 V {\displaystyle 5{,}04\ {\textrm {V}}} , 5 , 01 V {\displaystyle 5{,}01\ {\textrm {V}}} , 7 , 23 V {\displaystyle 7{,}23\ {\textrm {V}}} ja 4 , 96 V {\displaystyle 4{,}96\ {\textrm {V}}} . Mittausten päätyttyä huomattiin heti, että yksi arvoista oli hyvin paljon suurempi kuin muut ja pääteltiin, että mittauksen yhteydessä on täytynyt sattua karkea virhe, joten mittaustulos 7 , 23 V {\displaystyle 7{,}23\ {\textrm {V}}} hylättiin.
Hyväksyttyjen mittaustulosten keskiarvoksi saadaan U = 4,990 00 V {\displaystyle U=4{,}99000\ {\textrm {V}}} ja sen keskiarvon keskivirheeksi Δ U = 0,015 49 V {\displaystyle \Delta U=0{,}01549\ {\textrm {V}}} . Absoluuttinen virhe ilmoitetaan aina pyöristettynä eli U = 4,990 ± 0,015 V {\displaystyle U=4{,}990\pm 0{,}015\ {\textrm {V}}} . Toisin sanoen on 68 %:n todennäköisyys sille, että otoksen keskiarvo olisi välillä 4,975 V {\displaystyle 4{,}975\ {\textrm {V}}} ja 5,005 V {\displaystyle 5{,}005\ {\textrm {V}}} , jos se toistettaisiin.
Suhteellinen virhe on 0,015 V / 4,990 V ⋅ 100 = 0 , 3 % {\displaystyle 0{,}015\ {\textrm {V}}/4{,}990\ {\textrm {V}}\cdot 100=0{,}3\ \%} . Tällä kertaa toistomittauksen virhe oli suurempi kuin mittarin lukematarkkuus, joten on perusteltua ilmoittaa toistomittauksesta saatu virhe. Jos toistomittauksen virhe olisi ollut pienempi kuin mittarin lukematarkkuus, olisi lukematarkkuus kenties kuvannut virhettä paremmin. Kuvittele esimerkiksi tilanne, jossa saataisiin joka mittauksesta sama tulos. Tällöin keskiarvon keskivirhe on nolla, vaikka lukematarkkuuden äärellisyydestä johtuen virhe ei tietenkään ole koskaan nolla.