Tutorial i presentació test d'hipòtesi

En aquest enllaç podeu descarregar el tutorial  i la presentació del test d'hipòtesi .



EL TREBALL DE RECERCA DE BATXILLERAT I EL MÈTODE CIENTÍFIC

 

Segons el Departament d’Ensenyament de la Generalitat de Catalunya “El treball de recerca és un conjunt d'activitats estructurades i orientades a la investigació que realitza tot l'alumnat de batxillerat amb l'orientació i seguiment del professorat, per tal de consolidar la competència en recerca. Es pot emmarcar dins un àmbit disciplinari, o pot ser interdisciplinari o transversal”. També, segons la mateixa font, els passos principals que normalment segueix un “treball de recerca” són:


Molt sovint en el decurs del treball de recerca arribarem a un moment on haurem de prendre decisions sobre les hipòtesis (explicacions de un fenomen) que hem proposat. Haurem de decidir en quina mesura les nostres conclusions estan justificades i expliquen enraonadament els esdeveniments que estudiem. Per ajudar a prendre aquestes decisions en favor o en contra de les hipòtesis formulades, la ciència es val de l’estadística, i entre altres eines, dels anomenats tests de hipòtesis. Com que aquesta és una eina molt potent per avançar en el coneixement científic i com a preparació per a l’elaboració del “treball de recerca”, us voldríem explicar de manera senzilla com treballa la ciència i que són els tests de hipòtesi.    


TUTORIAL DE L’APLICACIÓ DEL MÈTODE CIENTÍFIC EN EL PROCEDIMENT DE PRESA DE DECISIONS


EL MÈTODE CIENTÍFIC, LA CIÈNCIA I LA PRESA DE DECISIONS


Constantment estem prenent decisions de tota mena i no ho fem a l’atzar. Per fer-ho ens valem de la informació prèvia emmagatzemada al cervell, ja bé sigui per a experiències anteriors o per circuits cerebrals que hem heretat, o de la informació que cerquem específicament per a cada cas. Els resultats de les nostres decisions tenen conseqüències i per tant no és un tema menor tenir en compte els camins que seguim per prendre-les. No és el mateix fer cas de l’instint, d’algú en qui tenim confiança, d’un/a “influencer”, dels somnis, de les revelacions que pensem ens envia alguna divinitat (sigui per via directa o a través de profetes més o menys acreditats),  fer servir el raonament lògic,  emprar sèries ben mesurades d’esdeveniments per deduir el que passarà, o informar-nos de quina és la probabilitat de que una cosa sigui certa o falsa, com ajut per a la presa de decisions.

 

La ciència parteix d’un registre minuciós de fets observables a partir dels quals elabora models predictius que permeten, donada determinada situació inicial,   calcular la probabilitat que els esdeveniments es produeixin en un determinat sentit. A partir d’aquí ens toca a nosaltres decidir el que triem. Al coneixement que es genera mitjançant el mètode científic se’n diu ciència.


 

 ELS PASSOS DEL MÈTODE CIENTÍFIC


Perquè un fenomen pugui ser analitzat mitjançant el mètode científic ha de ser observable amb els sentits (o instruments de mesura) i replicable (repetible).  Això permet dissenyar experiments per contrastar explicacions (hipòtesis) i calcular quina probabilitat tenen de ser certes o falses. Els passos que sol tenir aquest procés són:

 

1.- Observació de fenòmens que es repeteixen i mesura d’aspectes significatius (dades d’una característica o “variable”) que descriuen aquest fets.

 

2.- Elaboració d’explicacions (hipòtesis) sobre els fets observats.

 

3.- Disseny d’experiments en els quals es controlen les condicions per estudiar el fenomen en qüestió. Això permet discernir en quin grau les nostres explicacions són encertades, és a dir serveixen per fer bones prediccions. La mesura del grau de certesa d’una hipòtesi s’expressa en forma de probabilitat. Aquest és el punt clau del mètode científic. Com que la ciència treballa amb dades d’experiments repetibles, si algú no està conforme amb el resultats derivats d’un experiment el pot repetir tantes vegades com vulgui per veure si arriba a les mateixes conclusions. 

 

 4.- Les hipòtesis que una vegada comprovades tenen una elevada capacitat predictiva passen a ser considerades una teoria.

 

Finalment, remarquem que la ciència no pren decisions. Les decisions les prenem nosaltres (individual o col·lectivament) en funció de la informació que ens dona la ciència i de tots els altres “inputs” que te el nostre cervell en cada moment.

 

COM DETERMINAR SI UNA HIPÒTESI ÉS CERTA O FALSA I AMB QUINA PROBABILITAT? 


 Ja hem comentat que la validació d’una hipòtesi que pretén explicar un fet observat necessita d’un mecanisme que ens permeti determinar amb quina probabilitat la hipòtesi explica aquest fet, això és,  que aquest no sigui conseqüència d’altres factors que no tenim en compte. Hi han diversos mètodes per contrastar hipòtesis depenent del tipus d’hipòtesi i del coneixement que tinguem de les variables mesurades (les dades que enregistrem). N’explicarem aquí un d’ells, l’anomenat test t-Student per familiaritzar-nos en com treballa la ciència i quin abast tenen les teories científiques. Aquest és un mètode de càlcul senzill, aplicable a hipòtesis referents a la diferència entre mitjanes (suma dels valors de la variable dividit per el nombre de valors) procedents de mesures fetes sobre dues mostres elegides a l’atzar (aleatòries). Utilitza dos paràmetres estadístics (valors que resumeixen les característiques d’una variable en una mostra determinada)  de les dades experimentals: la mitjana i la dispersió dels valors al voltant de la mitjana (variància).


 

Vegem-ne alguns exemples:



 

PRIMER CAS

 

Estudi sobre un producte per deshabituar els fumadors

 

En Xavi és fumador, però fa dies que s’està plantejant deixar de fumar. Per aquest motiu s’ha interessat en una notícia segons la qual un medicament fet a base de civada, i emprat per a la desintoxicació d’opiòmans, pot ser també útil per deshabituar els fumadors. En Xavi, que és una persona crítica, vol informar-se abans de decidir-se a prendre o no aquest medicament. Pot demanar opinió al seu metge o altres persones més informades, buscar-la a les xarxes socials  o a altres fonts. La Laia, una amiga amb  qui ha comentat la seva preocupació, li diu que ha trobat un treball experimental sobre l’efectivitat d’aquest medicament, i li proposa utilitzar-la per obtenir informació científica sobre la seva efectivitat.

 

En aquest experiment s’ha subministrat una pastilla diària a un grup de persones durant un mes. Per 10 d’elles la pastilla subministrada contenia el medicament en estudi i a les altres 10 no (placebo), sense que cap d’elles sàpiga quina pastilla ha pres.


 

La taula mostra el nombre de cigarretes que han fumat diàriament els individus d’ambdós grups després d’un mes del tractament.


Per valorar l’efectivitat del medicament la Laia i el Xavi comparen la mitjana (paràmetre estadístic) de cigarretes fumades diàriament pels dos grups de persones sotmeses a diferents tractaments experimentals:

 

   Paràmetre estadístic mitjana, de la variable consum diari de cigarretes en el grup dels individus que han pres la pastilla amb medicament,      

mX = (16+15+15+13+17+12+12+16+14+11)/10 = 141/10 = 14,1 cigarretes


Paràmetre estadístic mitjana, de la variable consum diari de cigarretes dels individus que han pres la pastilla sense medicament, 

mY = (19+20+15+19+13+12+15+19+20+20)/10 = 172/10 = 17,2 cigarretes.

 

A la vista d’aquests resultats el Xavi conclou que el medicament te efectes positius sobre el nombre de cigarretes que es consumeixen (14,1 és menor que  17,2).

 

La Laia, més crítica, li replica que no tenen certesa que la  diferència de mitjanes observada en el consum de tabac sigui atribuïble al medicament i que podria ser deguda a la variabilitat estadística de les dades (atzar) generada per altres factors que no es controlen en l’experiment. Si l’experiment inclogués a tots els fumadors del mon dividits en dos grups  la diferència de mitjanes seria concloent perquè hauríem estudiat tots els cassos existents, però no és la nostra situació.  Només tenim una mostra molt petita escollida entre el conjunt de fumadors i pot ser que el resultat vingui influenciat per molts factors deguts a les peculiaritats de cada persona.  Per tal de quantificar aquesta incertesa cal, diu, fer un test d’hipòtesi.


 

Aquest tipus de test estadístics permeten, proposada una explicació (hipòtesi) als resultats d’un experiment (dades d’una variable o valors que enregistrem al llarg de l’experiment), determinar la probabilitat p de que els resultats experimentals siguin conseqüència de l’atzar i no de l’explicació (hipòtesi) que nosaltres hem proposat. Hi han diferents tests d’hipòtesis depenent de com es plantegi la hipòtesi a  contrastar.

 

En Xavi i la Laia decideixen aplicar un test d’hipòtesi a les mitjanes obtingudes i així obtenir més informació sobre el medicament. Buscant en un llibre d’estadística troben que pel seu cas, contrastar la diferència entre dues mitjanes, el test que s’ha d’utilitzar és l'anomenat test t-Student.


 

 

Procediment per aplicar el test t-Student

 

La hipòtesi a contrastar mitjançant el test t-Student és la anomenada hipòtesi nul.la, és a dir que la diferència de mitjanes observada no és deguda  a l’efecte del medicament) i si a la variació aleatòria  de les dades (deguda a efectes que no controlem en els individus que participen en l’experiment, i que podem estimar tant a partir de la dispersió de les mostres (variància) com de la seva mida, n. ).

 

Els càlculs associats a aquest procediment es poden realitzar de forma senzilla amb un full de càlcul (EXCEL) seguint els passos:

 

1. Calcular  la mitjana (paràmetre estadístic) de cada mostra, mX, mY.

 

2. Construir una taula amb dades, desviacions (diferència entre dades i mitjana), desviacions quadràtiques i corresponents sumes de les dues mostres (tots ells paràmetres estadístics). 

3. Calcular el paràmetre s2 (mitjana ponderada de les variàncies de les dues mostres)  

4. Calcular el valor del paràmetre estadístic t:

5. Calcular el valor del paràmetre estadístic p:

 

Si hem utilitzat un full de càlcul EXCEL, el valor de p ens ve donat directament utilitzant la fórmula:

 

               = DISTR.T.2C(t;nX+nY–2),

 

on t es el valor del paràmetre estadístic t-Student, nx el nombre d’individus del grup que ha pres pastilles amb medicament i ny el nombre d’individus del grup que ha pres pastilles sense medicament.

 

          En el nostre cas:

   p= DISTR.T.2C(2,6;18) = 0.018 per 1= 1,8%

 

 

El valor p  dóna la màxima probabilitat de que la diferència observada entre les mitjanes sigui deguda a l’atzar (l’anomenada hipòtesi nul.la), i no a les causes que nosaltres li atribuïm. En conseqüència, com més petit sigui p, més gran serà la probabilitat de que les diferències entre mitjanes siguin degudes a l’efecte del medicament, i per tant,  permet quantificar la significança del resultat de l’experiment. Aquest valor oscil.la entre 0 i 1 si expressem la probabilitat en tant per 1, o de 0 a 100, si expressem la probabilitat en tant per cent. El més corrent és expressar-lo en tant per 1. Des d’un punt de vista pràctic la hipòtesi  de què el medicament és efectiu :

                         s’accepta,   si    p  ≤  𝞪

                         es rebutja, si    p  >  𝞪    

               

Al valor alfa(𝞪) se l’anomena  nivell de significança del test i és un valor escollit per l’experimentador considerant el fenomen que està estudiant. És la màxima probabilitat d’ocurrència d’un fals positiu (és a dir que les mitjanes difereixen en el valor que ens ha sortit com a causa de l’atzar i no a l’efecte del medicament en el nostre cas), que estem disposats a acceptar. Habitualment  es pren    𝞪 =0.05.


 Resultat del test:


D’acord amb el valor de p= 0.018 obtingut en el test, podem acceptar que  les mitjanes són diferents   amb un nivell de significança de 𝞪 =0.05, donat que  p < 𝞪.


Conclusió:


Desprès de l’experiment i la seva validació mitjançant el test t-Student  el Xavi i la Laia poden afirmar que:

 

Arribat aquest moment, en Xavi disposa d’una nova mesura, aquesta  científica (associada a una probabilitat de certesa o falsedat), sobre l’efectivitat del medicament. Amb tota la informació que ha recollit, opinions, mesures científiques, xarxes socials, etc., podrà decidir si pren o no el medicament fent cas d’aquelles informacions que consideri més avinents.



Reflexions sobre el valor de la significació en els tests de hipòtesi

 

La significança d’un test de hipòtesi és una informació a tenir en compte, però en cada cas hem de contrastar el seu valor amb els beneficis i perjudicis que es poden derivar de les nostres decisions. Pot ser que en cada cas ens interessi considerar un valor 𝞪 diferent com a raonable. En els àmbits de les ciències naturals és sol considerar un valor de 𝞪 = 0,05 per 1 (5%) com a nivell de significança raonable, però podem ser molt més exigents en altres cassos. 


 

Així, una 𝞪 = 0.05  serà 

            - molt raonable per eficiència d’un medicament,

            - poc raonable  per l’enlairament d’un avió on segur que ens exigiríem un valor de 𝞪 molt més petit.

 

 

En l’exemple, com que estem en l’àmbit de les ciències naturals, valors de p superiors a 0,05 ens portarien a rebutjar la nostra hipòtesi de que el medicament te efectes sobre el nombre de cigarretes diàries consumides. 

 


SEGON CAS - Estudi sobre dues varietats de tomaqueres -

 

En Galderic és un agricultor que cultiva dues varietats de tomàquets (A i B)  i vol esbrinar si les pot considerar iguals o diferents en base al temps de floració de les tomaqueres (Vol saber si els tomàquets de les dues tomaqueres maduraran al mateix temps o primer tindrà tomàquets d’una varietat i després de l’altre si les planta totes al mateix moment l’any següent). Per prendré alguna decisió al respecte, ha mesurat els dies que tarden a florir, després de trasplantades, una vintena de tomaqueres de cada varietat. Els resultats han estat els següents:



Explicació-hipòtesi: “La diferència observada en els temps de floració es atribuïble a les característiques genètiques de cada varietat”. .

 


Aplicar la prova t-Student 


Per determinar fins a quin punt aquesta explicació és acceptable, aquests resultats es sotmeten a una prova t-Student que es detalla a continuació.

 

Paràmetre estadístic mitjana de dies des de la plantació fins a la floració del primer pom en la varietat A, mX = 74.4 dies

      

Paràmetre estadístic mitjana de dies des de la plantació fins a la floració del primer pom en la varietat B,  mY = 77.0 dies

 

Aparentment la varietat A és més primerenca (74,4 dies de mitjana) que la varietat B (77,0 dies de mitjana).


Veiem que ens diu el test t-Student.



  p = DISTR.T.2C(2.6;38) = 0.013 per 1 (arrodoniment a la mil·lèsima), =  1,3%

 

Recordem que el valor p dóna la probabilitat de que la diferència observada en les mitjanes sigui deguda a l’atzar (l’anomenada hipòtesi nul.la), i no a les causes genètiques que nosaltres li atribuïm (és a dir, que la nostra hipòtesi no és certa). 



Resultat:


Les mitjanes de les dues mostres són diferents amb un nivell de  significança de ≤0,05. Aleshores, es pot afirmar que la diferència observada en els temps de floració es atribuïble a la naturalesa de cada varietat (factors genètics que les diferencien) i no a factors de casualitat (atzar) amb un nivell de significança de p≤0,05% (ja que el valor de  

 p =0.013, és més petit que el valor de 𝞪=0,05, que ens posem com a límit en experiments d’aquests tipus. 


   

Conclusió:


Arribat aquest moment, en Galderic pot prendre una decisió sobre considerar les dues varietats de tomàquets iguals o diferents pel que fa als dies que tarden en florir. Te una orientació probabilística sobre el risc que corre considerant les varietats com a diferents i trasplantant-les el mateix moment per aconseguir tenir tomàquets durant un temps més llarg que si en plantés únicament una. 



TERCER CAS - Estudi sobre dues tècniques quirúrgiques - 

 

El servei d’urologia d’un hospital ha assajat dues tècniques quirúrgiques, A i B, per un mateix tipus d’intervenció amb una vintena de pacients.  Es vol valorar si ambdues tècniques es poden considerar igualment efectives en relació al nombre de dies d'estada hospitalària en els postoperatori. Per prendré alguna decisió al respecte, s'han registrat els nombre dies d'ingrés hospitalari per a cada tècnica, i les xifres son les següents:

Explicació-hipòtesi: “La diferència observada en els dies d’hospitalització es atribuïble a les característiques de cada tècnica”.

 


Aplicar la prova t-Student 


Per determinar fins a quin punt aquesta explicació és acceptable, aquests resultats es sotmeten a una prova t-Student que es detalla a continuació.

 

Paràmetre estadístic mitjana del grup tractat amb la tècnica A,  mX = 17.6 dies


      Paràmetre estadístic mitjana del grup tractat amb la tècnica B, mY = 16.2 dies


 

p = DISTR.T.2C(1.2;18) = 0.246 per 1 (arrodoniment a la mil·lèsima)= 24,6%

 


Resultat:


Les mitjanes de les dues mostres no són diferents amb un nivell de  significança de p≤0,05, doncs el valor de p=0,246 és superior al valor de 𝞪=0,05 que se sol utilitzar en aquest tipus d’experiments. Aleshores, es pot afirmar que la diferència observada en els dies d’hospitalització no és atribuïble a les característiques de cada tècnica quirúrgica, amb una p≤0,05.


Conclusió:


 Arribat aquest moment, el servei d’urologia de l’hospital pot prendre una decisió sobre considerar les dues tècniques quirúrgiques igualment efectives. Com que els resultats del test no superen el nivell de significança usual en aquest tipus d’experiments segurament els metges de l’hospital conclourien que les dues tècniques quirúrgiques no tenen diferencies pel que fa als dies d’hospitalització. Per tant a l’hora de prendre les seves decisions de cara a usar A o B, tindrien en compte altres aspectes com ara els costos, els efectes secundaris per als pacients, el grau d’èxit en la solució del problema, etc. 


QUART CAS - Estudi sobre la pluja àcida en dues zones d’una ciutat - 


Un dels efectes de la contaminació ambiental és la formació de la anomenada “pluja àcida” en moltes parts del planeta. Un dels components d’aquesta pluja és l’àcid sulfúric que té efectes corrosius. En un estudi realitzat en una ciutat europea es va determinar durant deu setmanes la concentració (ppm ) d’àcid sulfúric en la pluja que va caure en dos indrets diferents de la ciutat: una zona comercial (A) i una zona industrial (B). L’estudi pretenia indagar fins a quin punt la contaminació per pluja àcida es podia considerar diferent entre ambdues zones. A continuació es mostren les dades obtingudes en cada zona.

Explicació-hipòtesi: “Les diferències en les concentracions d’àcid sulfúric son atribuïbles a la localització de cada zona i per tant a el tipus principal d’activitat en cada una d’elles (comercial o industrial)”. 

 


Aplicar la prova t-Student 


Per determinar fins a quin punt aquesta explicació és acceptable, aquests resultats es sotmeten a una prova t-Student que es detalla a continuació.

 

Paràmetre mitjana de les ppm recollides diàriament a la zona comercial, mX = 2.567 ppm


Paràmetre mitjana de les ppm recollides diàriament a la zona industrial, mY = 2.357 ppm

 


                              p = DISTR.T.2C(0.375;18) = 0.712 per 1 (arrodoniment a la mil·lèsima) = 71,2%. La probabilitat mínima de que la hipòtesi nul.la sigui certa és del 71,2%

 

 


 Resultat:


Les mitjanes de les dues mostres no són diferents amb un nivell de  significança de p≤0,05, doncs el valor de p=0,712 és superior al valor de 𝞪=0,05 que se sol utilitzar en aquest tipus d’experiments. Aleshores, es pot afirmar que la diferència observada en el contingut de sulfúric de la pluja no és atribuïble a les característiques de cada una de les dues zones de la ciutat comparades,  amb una p≤0,05 de que aquest resultat sigui conseqüència de l’atzar.




Conclusió:


 Arribat aquest moment, es pot prendre una decisió sobre si la contaminació per pluja àcida es pot considerar diferent entre les zones industrial i comercial de la ciutat i si cal prendre mesures com per exemple augmentar el filtrat de les emissions que produeixen les industries. Ja hem comentat que normalment per considerar a nivell pràctic que les dues mitjanes són diferents cal que el nivell de significança sigui de p≤0,05.  Aquí ens trobem amb un valor de p=0,712, molt per sobre del nivell de significança que hem establert. Per això la conclusió més enraonada és que el tipus d’activitat productiva  de cada zona (comercial o industrial), no genera diferències en el contingut de sulfúric en la pluja d’aquesta ciutat.


CINQUÈ CAS - Estudi sobre el greix corporal d’homes i dones - 


 

Una manera d’estimar l'estat físic d'una persona és mesurar-ne el percentatge de greix corporal. Es sap que  aquest percentatge varia amb l'edat i es vol indagar si es diferent entre homes i dones. Per tal d’examinar aquesta qüestió es va escollir un grup d'homes i dones, de la mateixa franja d’edat, característiques ètniques i estatus socioeconòmic, i es va mesurar el seu greix corporal. Les dades es mostren a la taula següent.


Explicació-hipòtesi: "Les diferències en els percentatges de greix corporal son atribuïbles al sexe (mascle o femella) de les persones”. .

 


Aplicar la prova t-Student 


Per determinar fins a quin punt aquesta explicació és acceptable, aquests resultats es sotmeten a una prova t-Student que es detalla a continuació.

 

Paràmetre estadístic mitjana del percentatge de greix corporal en el grup d’homes,  mX = 15.0%

      

Paràmetre estadístic mitjana del percentatge de greix corporal en el grup de dones, mY = 22.3%




                              p = DISTR.T.2C(2.808;21) = 0.011 per 1 (arrodoniment a la mil·lèsima) = 1,10%. La probabilitat màxima de que la hipòtesi nul.la sigui certa és de 1,10%  

 

 



Resultat:


Les mitjanes de les dues mostres són diferents amb un nivell de  significança de p≤0,05, doncs el valor de p=0,011 és inferior al valor de 𝞪=0,05 que se sol utilitzar en aquest tipus d’experiments.  Aleshores, es pot afirmar que la diferència observada en el percentatge de greix dels homes i les dones és una característica lligada al sexe amb una p≤0,05.


 

Conclusió: 


Aquests resultats ens permeten decidir si hem de fer per exemple dietes específiques per a dones i homes, o si hem de tenir especial cura dels efectes secundària que provoca l’acumulació de greix en la salut de les persones, establint per exemple protocols específics de prevenció per homes i dones.



PRESENTACIÓ TEST D'HIPÒTESI

Presentacio-test_hipòtesi 060922.pptx