Miksi tutkimuksia tarvitaan

Tutkimuksilla pyritään selvittämään asioiden totuutta tai todennäköisyyksiä, koska tavallinen elämässä tapahtuviin havaintoihin perustuva määrittely sisältää monia vääristäviä ilmiöitä. Ihmisellä on taipumus havaita asioita jotka sopivat henkilön odotuksiin ja aikaisempiin käsitteisiin (observer bias). Esimerkiksi MS-taudin eräässä tutkimuksessa ilmeni että ei-sokkoutetut lääkärit havainnoi tutkittavan lääkkeen olevan tehokkaampi kuin plasebo vaikka todellisuudessa lääke ei eronnut plasebosta. Samaa ei esiintynyt tutkimuksessa mukana olleilla lääkäreillä jotka olivat normaaliin tapaan sokkoutettu ryhmistä. Normaalissa kliinisessä hoitotyössä tai kuntoutuksessa harjoittajat voivat siis helposti kokea että asia mitä he tekevät toimii paremmin kuin se todellisuudessa toimii. (Bratman 2004; EBSCO Publishing 2015.)

 

Rosenthal efekti kuvastaa kuinka tutkittavan odotus ei vaikuta vain hänen omiin havaintoihinsa vaan sillä voi olla vaikutus myös toiseen henkilöön. Opettajien odotusten on todettu vaikuttavan oppilaiden koulumenestykseen kun opettajille annettiin väärä käsitys lasten älykkyysosamäärästä (Draper 2014.) Eräässä kokeessa  opiskelijoille annettiin kuvia ihmisistä ja heidän tehtävänsä oli kysellä ihmisiltä arvioivatko he kuvien henkilöiden olevan hyvin menestyneitä vai epäonnistuneita elämässä. Puolet kokeeseen osallistuneista haastattelija opiskelijoista informoitiin professorien tasolta että he tulisivat huomaamaan että suurin osa ihmisestä luokittelisi kuvien henkilöt epäonnistuneiksi. Toiselle puoliskolle vakuutettiin että ihmiset tulisi arvioimaan kuvien henkilöt menestyneiksi. Hyvin suureksi osuudeksi haastateltavat vastasivat sen mukaan mikä haastattelijoiden odotus oli, mikä oli yllättävää koska he esittivät kysymykset vakioidusta kirjoitetusta tekstistä lukemalla. Eli he onnistuivat ilmeisesti vaikuttamaan haastateltaviinsa pienillä äänenpainon eroilla. (EBSCO Publishing 2015.)

 

Tutkimuksien yhteydessä tiedetään että koehenkilöillä on tarve miellyttää hoitajaa mikä johtaa parantuneiden asioiden korostamiseen ja ongelmien vähättelyyn jos henkilö kokee että lääkäri haluaisi kuulla tutkittavan asian vaikuttaneen. Halutun kaltaisen vastauksen antaminen ei välttämättä sisällä valehtelua vaan voi pohjautua muutoksiin tulkinnassa omasta kokemuksesta. Objektiivisesti mitattuna oire ei välttämättä olekaan vähentynyt vaikka henkilö niin kokee ja raportoi. Tämä uudelleentulkinta efekti (reinterpretation effect) on myös yksi mahdollinen tekijä joka vääristää tavallisessa hoitotyössä saatujen kokemusten pohjalta luotuja vaikutelmia jonkin asian toimivuudesta. (Jackson 2005; Bratman 2004.)

 

Ehkä tunnetuin hoitotyön vaikuttavuuden arviointiin vaikuttava tekijä on lumevaikutus eli plasebo-efekti. Tämä ihmismielen vaikutus kehoon ei ole vain mielikuvitusta vaan ajatuksemme, kokemuksemme ja toiveemme voivat muuttaa fysiologiaamme. Esimerkiksi vaihdevuosien kuumien aaltojen on todettu lieventyvän 51% ja miesten eturauhasen laajentumisen oireet parantuivat merkittävästi ja ainakin osittain säilyivät kahden vuoden ajan plasebolla. (EBSCO Publishing 2015.) On myös todettu että tämä efekti voi syntyä pelkästään siitä että ihminen kokee häntä huomioitavan ja hänestä välitetään. Sen takia on esitetty että lumevaikutusta kuuluisi ehkä kutsua hoivavaikutukseksi (Puustinen – Louhiala 2002).

 

Muistimme vääristymät (memory distortion) voi myös vaikuttaa tulosten arviointiin. Ihmisellä on taipumus muistaa voimakkaammat poikkeukset, eli esim. suurimmat onnistumiset ja epäonnistumiset, ja unohtaa paljon noiden ääripäiden välillä olevaa. Jos kirurgi muistaa jonkun leikkauksen onnistuneen aivan loistavasti 15 kertaa, epäonnistuneen 5 kertaa ja suurimmaksi osaksi tulokset ovat olleet keskinkertaisia niin kirurgin mielessä leikkaus saattaa vaikuttaa hyvin toimivalta. (Loftus 2009.)

 

Kognitiivinen dissonanssi kuvastaa mielentaipumusta löytää uskomattoman hyvin todisteita asialle jota pidämme totena. Kun työmme ja sitä kautta elinkeinomme perustuu johonkin näkemykseen, on todennäköistä että mielemme valikoi voimakkaasti omia näkemyksiä tukevia asioita. Tämä voi johtaa vääristymään jonkin asian tehokkuudesta. (Cherry  2015.)

 

Sairauksilla ja vaivoilla on yleensä luontainen parantumisaikataulu, eli monet ongelmat menevät itsekseenkin ohitse. Joskus hoitotoimenpide voi ajoittua sopivasti suhteessa tähän luontaiseen paranemisen aikatauluun ja luo vaikutelman vaikuttavuudesta (natural course of disease: illusion of agency). Ja asia voinee vaikuttaa myös päinvastoin niin että joku toimiva hoito vaikuttaa toimimattomalta koska paranemisaikataulu ei kuitenkaan mahdollista äkillistä parantumista, mutta lyhentäisi kuitenkin pitkäkestoisen vaivan kestoa. (Bratman 2004.)

 

Oireet ja objektiiviset laboratorio mittaustuloksetkin saattavat aaltoilla, jonka takia tutkimukset tai hoidon alkuhetken oiretaso saattaa olla joko lähellä keskiarvoa tai sitä ylempänä tai alempana (regression toward the mean). Tästä aloitushetken määrityksestä voi syntyä harha ongelman muuttumisen arvioinnin suhteen. (Bratman, 2004.)

 

Tutkimuksiin osallistumisella tiedetään olevan vaikutus ihmisiin (study effect, Hawthorne effect). On todennäköisempää että henkilöt ovat normaalia motivoidumpia huolehtimaan hyvinvoinnistaan tutkimuksen aikana ja tämä voi myös vääristää tuloksia. Oletettavasti samanlainen ilmiö voi koskea esim. kuntoutus-, opetus-, tai hoitojaksoa. (Bratman, 2004; Jackson 2005)

 

Tutkimuksista tai hoitojaksolta pois tipahtaneet (study drop outs) voivat myös vääristää jonkin menetelmän tai hoidon vaikuttavuuden arviointia, sillä jäljelle jääneet ovat ehkä saaneet parempia tuloksia ja sen takia halunneet jatkaa. Yksittäinen terapeutti saattaa myös tulkita suureksi onnistumiseksi sen kun joku ei tule enää uudestaan vastaanotolle vaikka kyse voisikin olla tyytymättömyydestä tuloksiin. (EBSCO Publishing 2015.)

 

Yllä olevista tekijöistä johtuen hoitomenetelmän vaikuttavuuden arvioiminen on haasteellista ja sen takia on pyritty tekemään kaksois-sokkotutkimuksia, jossa pyrkimyksenä on että hoitaja eikä hoidettava tiedä kuuluuko hän interventio- vai kontrolliryhmään. (TurkuCRC 2015.)

 

Tutkimuksia tehdään yleensä asioista joiden ajatellaan potentiaalisesti vaikuttavan. Kolmen tuhannen RCT tutkimuksen katsauksessa kuitenkin vain noin kolmannes satunnaistetuista ja kontrolloiduista tutkimuksista on vahvistanut tutkitun intervention olevan vähintäänkin todennäköisesti hyödyllinen, mikä kertoo tutkimustiedon tarpeellisuudesta.  Kahdeksan prosenttia tutkituista hoidoista  on todettu olevan hyödyttömiä tai haitallisia ja seitsemässä tapauksessa on todettu olevan epätodennäköistä että tutkitusta asiasta olisi hyötyä. Puolet tutkituista asioista on jäänyt edelleenkin epäselväksi eli tutkimusnäyttöä ei ole suuntaan tai toiseen riittävästi, johtuen esim. mahdollisista puutteista tutkimusten laadussa. (BMJ Publishing Group Limited 2015.)

 

Kuvio 1.   3000 RCT tutkimuksesta syntynyt jakauma tutkimusnäytöstä. Ei kuvaa lääketieteessä käytettyjen hoitojen jakautumista tai vaikutuksia yksilötasolla. (BMJ Publishing Group Limited 2015.)

 

 TUTKIMUSTEN TULOSTEN LUOTETTAVUUDEN ARVIOINNISTA

Vaikka tieteellinen tutkimus on paras tapa pyrkiä löytämään totuutta on arvioitu että suurin osa tutkimuksista antaa virheellisiä tai liioiteltuja tuloksia johtuen puutteista tutkimuksien laadussa. Jopa 85% tutkimukseen käytetyistä resursseista saattaa mennä hukkaan. (Ioannidis 2005; Ioannidis 2014.)

Tutkimuksien todistusvoiman painoarvoista on esitetty hierarkkinen malli, jolla voi arvioida eri tutkimustyyppien antaman näytön suuruutta. Näytön vahvuus on seuraavassa järjestyksessä parhaasta huonoimpaan:

 

 

 

 

 

 

 

 

Monissa julkaistuissa tutkimuksissa on vakaviakin metodologisia virheitä. Kliinisessä työssä pitää huomioida myös vastaako tutkimus siihen asiaan mihin etsii vastausta. Vaikka RCT-tutkimuksien tulokset katsotaan tärkeimmiksi arvioitaessa hoitojen vaikuttavuutta, on muillakin tutkimuksilla oma arvonsa. Pitkittäisillä kohorttitutkimuksilla saadaan esimerkiksi selville oireiden ja sairauksien kulkuun liittyvää prognostista tietoa. Tapausselostukset voivat taas esim. hälyttää nopeammin jonkun toimenpiteen haittavaikutuksista. (Greenhalgh 1997: 243-246.)

 

 Usein hoitosuositukset ja -ratkaisut perustuvat parhaaseen olemassa olevaan näyttöön. Näytön vahvuus luokitellaan 5 alaryhmään (1 paras, 5 huonoin) tehtyjen tutkimusten laadun mukaan. Näytön vahvuuteen perustuen voidaan antaa käytännön hoitosuosituksia. Näytön viisiasteista tasoista on suomen hoitosuositusten suhteen myös mainittu että 1-taso koostuu satunnaistetuista ja kontrolloiduista tutkimuksista (RCT) joissa on suuri potilasmäärä, yhtenevät tulokset ja tutkimukset ovat korkealaatuisia. 2-tasossa RCT tutkimuksissa on käytetty pieniä potilasmääriä, tulokset eivät täysin yhtenevät ja tutkimusten laatu huonompi, tai on käytettävissä vain yksittäinen RCT-tutkimus. 3-tasolle kuuluu ei-satunnaistetut kohorttitutkimukset. 4-tason ei-satunnaistetussa tutkimuksessa on historiallinen kontrolliryhmä. 5-taso koostuu tapausselostuksista. (Uusaro – Ruokonen 2000.)

 

Näyttöön perustuvan lääketieteen keskuksen (CEBM centre of evidence based medicine) mukaisesti näyttö jaetaan viidelle tasolle ja tasoissa on myös eri luokkia (1a/1b/1c, 2a/2b/2c, 3a/3b, 4,5). Hoitosuositusten A-D tasot linkittyvät näihin näytönaste tasoihin niin että A-taso muodostuu vain 1-tason näytöstä. B-taso muodostuu yhtenäisistä 2 tai 3 tason tutkimuksista tai olettama 1-tason tutkimuksesta että tulevaisuudessa tulokset ovat samansuuntaisia (ekstapolointi). C-tason suositus pohjautuu 4-tason tutkimuksiin tai ekstrapolointiin 2- tai 3-tason tutkimuksista. D-taso perustuu 5-tason näyttöön tai minkä tahansa tason ristiriitaisiin tuloksiin. (DEBM 2009.)

 

Lääkäreiden käypähoito tietokannoissa hoitosuosituksia tukevan tieteellisen näytön vahvuus on kuvattu ja sen vahvuus on määritelty asteikolla A-D. Näytönastekatsauksista valtaosa perustuu Cochrane-kirjastossa julkaistuihin systemaattisiin katsauksiin. A-tason näyttö on vahva ja silloin uusi tutkimus tuskin muuttaa käsitystä vaikutuksen suuruudesta. B-tason näyttö on kohtalainen jolloin uusi tutkimus saattaa muuttaa käsitystä vaikutuksen tarkkuudesta ja suuruudesta. C-tason näyttö katsotaan heikoksi ja uusi tutkimus todennäköisesti muuttaa käsitystä vaikutuksesta ja todennäköisesti myös sen suuruudesta. D-tason näytön sanotaan olevan hyvin heikkoa jolloin arvio vaikutuksesta on hyvin epävarma. (Duodecim 2014.)

 

Parhaana näyttönä katsottujen satunnaistettujen ja kontrolloitujen (RCT) tutkimusten tasoissa on eroja, mikä vaikeuttaa johtopäätösten tekemistä yksittäisistä tutkimuksista. Suositusten ja systemaattisten katsauksien etu on että niihin sisällytettyjen tutkimusten laatua on todennäköisesti arvioitu ja tekijöillä pitäisi olla osaamista tämän arvioinnin suorittamiseen. Jos syvällisempää ymmärrystä tutkimuksen laadun arviointiin ei ole niin voi olla hyvä etsiä ainakin alkuun suosituksia (guidelines) ja systemaattisia katsauksia. Systemaattisessa katsauksessa tule-sairauksien kuntoutuksen näytöstä on huomioitu esimerkiksi seuraavia asioita: Tutkimuskysymys määritelty, kaksi artikkelien valitsijaa, kattava haku, julkaisutyyppi ei mukaanottokriteerinä, artikkeliviitteet (myös hylätyistä), mukaan otetut tutkimukset kuvattu, tutkimusten laatu arvioitu, tutkimusten laatu vaikuttanut tuloksiin, tutkimusten yhdistäminen hyvin metodein, julkaisuharha arvioitu ja sidonnaisuudet ilmoitettu. (Häkkinen - Korniloff – Aartolahti -

Tarnanen 2014: 83.)

 

Yksi mittari yksittäisen tutkimuksen laatuun voi olla julkaisu, mikä johtuu siitä että tällöin joku asiantuntija on oletettavasti arvioinut tutkimuksen laatua. Tietyn julkaisun kriteerien tasosta voi saada viitteen vaikuttavuuskertoimesta (impact factor). Vaikuttavuuskerroin on vertaisarvioituihin artikkeleihin kohdistettujen viittausten perusteella laskettu, tieteellisen julkaisun merkittävyyttä kuvaava tilastoluku ja kertoo kuinka monta viitettä keskimäärin kyseinen julkaisu sai kahden edellisen vuoden artikkeleihinsa. (wikipedia 2015a.)

 

Fysioterapian näyttö tietokanta PEDro on ilmainen internetissä oleva tietolähde, joka sisältää yli 30.000 tutkimusta, systemaattista katsausta ja suositusta jotka ovat relevantteja fysioterapian saralla. PEDrossa yksittäisille tutkimuksille annetaan myös pisteitä asteikolla 1-10 sen mukaan kuinka moni kriteeri tutkimuksessa täyttyy. Tällä pyritään helpottamaan yksittäisten tutkimusten luotettavuuden arviointia. (PEDro 2015a.)

 

PEDro tietokannan kriteerit tutkimusten numeraaliselle arvioinnille ovat: Satunnaistaminen, tutkittavan soveltuvuuden määritys tietämättä tulevaa tutkimusryhmää (concealed allocation), tutkimusryhmät homogeenisiä, osallistujien sokkouttaminen, terapeuttien sokkouttaminen, arvioijien sokkouttaminen, seurannasta (yli 85%), ITT-analyysi (Intention-to-treat analysis), tutkimusryhmien välinen vertailu ja hoitovaikutuksen suuruuden arviointi ja tulosten hajautumisen käsittely johon kuuluu esim. luottamusväli, keskihajonta ja keskivirhe (point measures and variability). (PEDro 2015b;  SCIRE 2010.)

 

Somaattisten menetelmien tutkimisesta ja haasteista

 

2005 tehty tutkimus pyrki selvittämään metodologisia haasteita jotka liittyvät manuaalisiin keho-mieli terapioihin kuten Feldenkrais menetelmä, Alexander-tekniikka, Trager, Eutony menetelmä, kehotietoisuusterapia (Body Awareness Therapy), hengitysterapia (Breath Therapy) ja  Rolfing menetelmä. Haku kliinisistä kokeista löysi lopulta 20 kriteerit täyttävää tutkimusta. Yksikään tutkimuksista ei sisältänyt sokkoutusta hoitomenetelmästä, mutta viidessä käytettiin verrokkihoitoa ja sokkoutettiin osallistujat kokeen tekijöiden odotuksilta. Yksikään tutkimus ei sisältänyt varteenotettavaa plasebo interventiota. Yksikään tutkimus ei raportoinut tutkittavien odotuksia. Tehdyssä selvityksessä esitettiin mahdollisuuksia minimoida tutkimusharhoja liittyen ennakkokäsityksiin terapeuttien ja hoidettavien taholta. Näiden huomioinnilla saataisiin kontrolloitua plasebovaikutuksen osuutta. Vapaaehtoisten tutkittavien rekrytoinnista syntyvää vääristymää myös käsitellään tutkimuksessa. Hyvin tehdyt kliiniset kokeet manuaalisista vaihtoehtoisista menetelmistä ovat harvassa, mutta niille olisi tarvetta. Vaikeudet sokkouttamisessa, plasebokontrollissa ja tutkimusjoukon värväämisessä ja niiden synnyttämät tutkimusvirheet voidaan systemaattisesti minimoida useilla menetelmillä. Tutkimuksen ehdotukset voivat auttaa suorittamaan parempia tutkimuksia alueelta. (Mehling - DiBlasi - Hecht 2005.)

 

Länsimaalaisesta tieteellisestä maailmankuvasta poikkeavien selitysmalleja sisältävien menetelmien tutkiminen aidosti voi edellyttää että poikkeavampaan selitystapaan perehdytään riittävän syvällisesti, ennen kuin sitä aletaan tulkita tieteelliseen kuvaan sopivaksi. Liikkumista, kehollisuutta ja meditatiivisia elementtejä sisältävien menetelmien ja länsimaisen tieteellisen tutkimuksen välisten maailmojen yhdistämistä on pyritty edesauttamaan luomalla kieltä ja sanastoa näiden maailmojen välille. Jotta neurotieteet voivat tehdä uudenlaisia löytöjä, niiden pitää pystyä säilymään avoimena oudompiakin selitysmalleja sisältäville menetelmille. (Schmalzl - Crane-Godreau -  Payne  2014.)

 

 ETUSIVULLE 

ALEXANDER-TEKNIIKKA 

Alexander-tekniikan periaatteista

Ihmisten kokemuksia Alexander-tekniikasta

Alexander-tekniikan tutkimusnäyttö

Alexander-tekniikka työterveydenhuollossa

Alexander-tekniikan vaikuttavuus alaselkäkivussa

OSTEOPATIA 

MUUT 

KURSSIT 

FYSIOTERAPIA

Kroonisen alaselkäkivun näyttöön perustuvasta kuntoutuksesta