Når man skal undersøge, om sammenhængen mellem to variable kan beskrives som en eksponentiel vækst, kan man gøre det ved at indtaste en serie sammenhørende værdier af de to variable i et regneark og herefter lave en eksponentiel regression. Fremgangsmåden afhænger af hvilket værktøjsprogram man benytter. Her demonstreres, hvordan man anvender GeoGebra.
Lad os se på et eksempel. Vi kaster 100 terninger, og efter hvert kast fjerner vi alle de terninger, der har vist en 6’er. Vi vil lave en matematisk model over eksperimentet. Resultatet efter de seks første kast ses i tabellen i figur 8.4.2.
Figur 8.4.1. For hvert kast fjernes 6'erne.
Figur 8.4.2. Der startes med 100 terninger. Efter 6 kast er der 34 terninger tilbage.
Figur 8.4.3 til 8.4.5 viser hvordan tallene indtastes i GeoGebra og regressionsværktøjet anvendes. Figur 8.4.6 viser, hvordan man med GeoGebra 5 i Datakilde-vinduet kan trykke på tandhjulet og bruge sidehovedet som titel. Denne funktionalitet hjælper med at holde styr på hvilke variabel, der afsættes langs akserne under dataanalysen.
Figur 8.4.3. Datasættet indtastes i et regnearket.
Figur 8.4.4. Data markeres.
Figur 8.4.5. Regressionsværktøjet vælges.
Figur 8.4.6. Brug sidehovedet som titel.
Hvis der vælges en lineær regressionsmodel, ses det af punktplottet på figur 8.4.7, at datapunkterne ikke følger modellen ret godt. Datapunkterne har en systematisk afvigelse fra regressionsmodellen, som fremstår meget tydelig i residualplottet i figur 8.4.8. Datapunkternes systematiske afvigelse fra den lineære model ses som en parabelformet fordeling omkring x-aksen. Den lineære model beskriver altså datasættet meget dårligt.
Figur 8.4.7. Lineær regressionsmodel.
Figur 8.4.8. Residualplot ved en lineær model.
Hvis der vælges en eksponentiel regressionsmodel, ses det af punktplottet i figur 8.4.9, at datapunkterne følger modellen meget godt. Residualplottet i figur 8.4.10 viser, at datapunkterne ligger tilfældigt fordelt omkring den eksponentielle model. Den eksponentielle model beskriver altså datasættet meget godt.
Figur 8.4.9. En eksponentiel regressionsmodel.
Figur 8.4.10. Residualplot ved en eksponentiel model.
Ved at åbne statistikvinduet med klik på Σx-knappen kan SSE-værdien aflæses til SSE = 3,4516 og residualspredningen beregnes som vist i kapitel 7.4 til 0,83. Der er altså en meget lille gennemsnitlig afvigelse mellem datapunkterne om modellen.
Figur 8.4.11. Residualspredningen.
Bemærk at man skal vælge regressionsmodellen Vækst, som vist i figur 8.4.12, hvis man skal bestemme a og b i modellen
f(x) = b ∙ a x
Regressionsmodellen Exponentiel giver også en eksponentiel model, og man får samme graf som ved Vækst, men forskriften står på en anden form, så man kan ikke aflæse fremskrivningsfaktoren a.
Regressionsmodellen Exponentiel kommer vi tilbage til senere.
Figur 8.4.12. Vælg typen Vækst når der skal laves en eksponentiel regression hvor a og b skal bestemmes.
Ud fra regressionsmodellen i figur 8.4.12 kan vi se at b = 98,70 og a = 0,8375. Dvs. at vi ifølge modellen startede med 98,7 terninger, og at der for hver kast er 83,75% af terningerne tilbage. At der for hver kast er 83,75% tilbage må betyde, at der for hver kast forsvinder 16,25%. Det passer meget godt med, at vi forventer, at 1/6 = 16,67% af terningerne viser en 6'er og derfor fjernes.