1. Lääkärilehti
  2. Ajassa
  3. Mikä on p-arvon arvo?
Tiede­pääkirjoitus 48/2020 vsk 75 s. 2573

Mikä on p-arvon arvo?

Kuvituskuva 1

Timo Muhonen

Jos p < 0,05, on tulos merkittävä. Jos p > 0,05, tulos on negatiivinen eikä hoidolla ole vaikutusta. Suunnilleen näin meille on opetettu ja näin olemme tulkinneet tutkimustuloksia.

Amerikan tilastotieteilijäyhdistyksen suosituksen (11 Wasserstein RL, Schirm AL, Lazar NA. Moving to a world beyond “p < 0.05”. The American Statistician 2019;73 suppl 1:1–19. doi: 10.1080/00031305.2019.1583913) mukaisesti huippulehdet kehottavat kirjoittajiaan vähentämään p-arvojen käyttöä (22 Harrington D, D’Agostino RB Sr, Gatsonis C ym. New guidelines for statistical reporting in the journal. N Engl J Med 2019;381:285–6.). Mistä on oikein kysymys? Miten voimme jatkossa arvioida, onko uusi tutkimustulos merkittävä?

Onneksi nykyään laatulehdet vaativat esittämään myös käyttökelpoisia tuloksia.

Kerrataanpa aluksi, mitä p-arvo tarkoittaa. Se on yleensä todennäköisyys sille, että vähintään havaitun suuruinen ero ilmaantuisi hoitoryhmien välille sattumalta, vaikka hoidot olisivat yhtä hyviä. Se ei siis kerro mitään havaitun eron suuruudesta tai sen kliinisestä merkittävyydestä eikä edes siitä, että tulos olisi jollakin todennäköisyydellä oikea ja toistettavissa. Se kertoo vain ja ainoastaan todennäköisyyden saada vähintään näin poikkeava tulos, jos hoitojen välillä ei olisi eroa.

Mistä on peräisin ratkaisevana pidetty raja-arvo p < 0,05? Biostatistiikan kehittäjä Fischer käytti sitä ilman perustelua laskuesimerkkinä artikkelissaan vuonna 1925. Tämän sata vuotta sitten yhden tutkijan valitseman luvun vaikutus lääketieteeseen ja muihin tieteenaloihin on ollut valtava. Todennäköisyydellä p = 0,05 on kuitenkin heikko kytkös siihen, mitä alitajuisesti pidämme normaalivaihtelun rajana. Jos arvomme virvokkeiden maksajan kolikkoa heittämällä, useimmat meistä alkavat neljän (p = 0,06) tai viimeistään viiden (p = 0,03) peräkkäisen tappion jälkeen epäillä, ettei kyse olekaan pelkästä sattumasta.

Helposti erehdymme ajattelemaan, että p > 0,05 tarkoittaa, ettei hoidosta ole hyötyä (33 Reito A. Ei vaikutusta eikä eroa – ei oikeaa tilastollista päättelyä. Suom Lääkäril 2020;75:1385.). Tällöin on hyvä tarkistaa, mikä oli tutkimuksen tilastollinen voima odotetun eron havaitsemisessa. Tyypillinen arvo on 80 %. Siis joka viides tutkimus päätyy "ei-merkitsevään" p-arvoon, vaikka kaikki ennakko-oletukset pitäisivät paikkansa ja ero olisi todellinen.

Vielä useammin "ei-merkitsevän" p-arvon taustana on tilastollisen voiman puute. On haettu hyvin suurta eroa ja minimoitu potilasmäärä sen mukaisesti. Kun ero osoittautuu odotettua pienemmäksi, p-arvo ei saavuta maagista 0,05:n tasoa. Tämä ei tarkoita sitä, etteikö eroa olisi, vaan että eroa ei onnistuttu havaitsemaan. Heikkovoimaisista tutkimuksista ei valitettavasti voi päätellä hoitovaikutuksen olemassaoloa tai olemattomuutta.

Lue myös

Pitkäkestoisissa tutkimuksissa joudutaan jakamaan p-arvo 0,05 useammalle välianalyysille. Tällöin usein ajaudutaan tilanteeseen, että lopulta saavutettu p-arvo on kyllä alle 0,05, mutta ei alle kyseiseen analyysiin varatun p-arvon. Tällöin tutkimus ei ole saavuttanut tilastollista merkitsevyyttä eikä lääke todennäköisesti saa myyntilupaa. Luottamusvälejä tarkastellen voimme kuitenkin tehdä hyvin luotettavan arvion hoidon hyödyn suuruudesta ja sen varmuudesta.

Nolona luen 30 vuoden takaisia kelpo lehdissä julkaistuja havaintojani melanooman ennustetekijöistä. Olen kertonut tuloksistani vain p-arvot. Näistä ei ole mitään hyötyä ilman arviota riskin suuruudesta. Onneksi nykyään laatulehdet – mukaan lukien Lääkärilehti – vaativat esittämään myös käyttökelpoisia tuloksia (44 https://www.laakarilehti.fi/kirjoitusohjeet/alkuperaistutkimus/).

Potilaamme ja yhteiskunta odottavat meiltä lääkäreiltä valistunutta arviota hoitopäätöstemme vaikutuksen suuruudesta ja varmuudesta. Näistä saamme parhaan käsityksen tarkastelemalla tehotuloksia ja niiden luottamusvälejä emmekä jumiudu p-arvon määräämään mustavalkoiseen kyllä–ei-tuomioon. p-arvo on vain vedonlyöjän työkalu sattuman mahdollisuuden arviointiin.

Kirjoittajat
Timo Muhonen
syöpätautien ja sädehoidon dosentti
Mediexpert Oy
timo.muhonen@mediexpert.fi
Sidonnaisuudet

Timo Muhonen: Konsultointi-, asiantuntija ja luentopalkkiot (Mediexpert Oy) (useita lääkeyrityksiä, Potilasvakuutusyhdistys), osakkeet (Amgen, Orion).

Kirjallisuutta
1
Wasserstein RL, Schirm AL, Lazar NA. Moving to a world beyond “p < 0.05”. The American Statistician 2019;73 suppl 1:1–19. doi: 10.1080/00031305.2019.1583913
2
Harrington D, D’Agostino RB Sr, Gatsonis C ym. New guidelines for statistical reporting in the journal. N Engl J Med 2019;381:285–6.
3
Reito A. Ei vaikutusta eikä eroa – ei oikeaa tilastollista päättelyä. Suom Lääkäril 2020;75:1385.
4
https://www.laakarilehti.fi/kirjoitusohjeet/alkuperaistutkimus/

Etusivulla juuri nyt

Ajassa
Korona koettelee vanhuksia

Vanhukset ovat olleet eristyksissä kohta vuoden. Mitä heidän kunnostaan tiedetään?

Tiedepääkirjoitus
Sepelvaltimotaudin kajoavan hoidon asema on tarkentumassa

Toimenpidetekniikat ovat kehittyneet sekä kardiologiassa että kirurgiassa, sanoo Jari Laukkanen.

Pääkirjoitus
Lääkäri on kirjoittaja

Tärkeintä on, että viesti välittyy niille lukijoille, joille se on tarkoitettu, kirjoittavat Pertti Saloheimo ja Pertti Mustajoki.

Kolumni
Kuolemattomuuden kiirastuli

Harvempi enää kuoli suorilta jaloin, kirjoittaa Jani Kaaro.

Ajassa
Videorobotti vähentää koronapotilaita hoitavien altistumisriskiä

Elisan videorobotti on ollut lääkärien ja hoitajien apuna HUS:n Kirurgisessa sairaalassa.