Komt op Toledo te staan.
vragen bij een reeks gegevens van x en y (met x=... en y=...)
1a) Is het gemiddelde van x significant lager dan het gemiddelde van y?
- Maak een gepaste grafiek en trek hieruit een besluit. Vermeld welk type grafiek je maakt en benoem en duid3 kenmerken van de grafiek aan.
- Onderzoek de stelling a.h.v. een geschikte hypothesetest. Teken de P-waarde.
1b) Is er een lineair verband tussen de gegevens?
- Onderzoek dit a.h.v. een geschikte hypothesetest. Schets de P-waarde.
vragen over hoofdstuk 9 via R-output (met gegevens over steekproef van verkiezingen doorheen de jaren)
2a) Welk regressiemodel is gerbuikt? Geef de parameters en schattingen (?).
2b) Ontbrekende waarden in R-output invullen.
2c) Welke modelveronderstellingen zijn er gemaakt?
2d) Bepaal het gestandardiseerd residu. Kan je hieruit besluiten dat er een verschil is tussen de verkiezingsuitslag in 1993 en al de andere jaren?
kansrekenen
kansrekenen
vragen prof. I. Gijbels
1) Theorie vraag met bewijzen: E(X) = E(schatter van X) en Var(schatter van X) = Var(X)/n
Kansberekening (hfdst 3)
2) Er komen gemiddeld 2 patiënten per shift van 4 uur binnen bij een ziekenhuis. Deze zijn Poisson-verdeeld.
2a) Wat is een Poisson-verdeling en wat is die hier specifiek (Landa dus gewoon invullen)?
2b) Wat is de kans dat er meer dan twee patiënten binnenkomen in deze shift?
2c) nog zo'n kansberekening
2d) Een dokter wordt extra opgeroepen op kerstavond als er tijdens de eerste twee uur van de shift 4 of meer patiënten binnenkomen. Wat is de kans dat hij wordt opgeroepen?
2e) Wat is de kans dat de dokter de voorbije 5 jaar, precies 4 keer is opgeroepen op kerstavond?
3) Donald zegt dat de gemiddelde Amerikaan 75 jaar oud wordt. Vladimir gelooft hem niet en hackt in de computers van het Amerikaanse ministerie. Daar vindt hij een document waaruit blijkt dat een Amerikaan gemiddeld 77 jaar oud wordt met een standaarddeviatie van 5 jaar. Vladimir kan goed met R werken en krijgt de volgende output: (dan kreeg je de output van een t-test).
3a) Welke hypothesetest paste Vladimir toe?
3b) Wat is de teststatistiek onder H0?
3c) vul de output verder aan: (de volgende waarden moest je aanvullen:)
- testwaarde
- p-waarde
- waarde van µ0 (75 dus)
- de waarde van het 99% BI
3d) Wat kan Vladimir besluiten? Had Donald gelijk?
3e) Wat als, na jarenlang onderzoek, blijkt dat sigma = 5? Wat verandert dit aan de p-waarde en aan je besluit?
4) Op een avond wordt er een alcoholcontrole gedaan bij 313 bestuurders door een agent en daar zijn volgende gegevens uitgekomen: (tabel van 3X3 met in de kolommen het aantal promille en de rijen de soort weg). Zijn deze gegevens onafhankelijk?
4a) Welke hypothesetest pas je toe?
4b) Wat is de teststatistiek onder H0? (die van geobserveerde waarde - verwachte waarde)
4c) Wat is je testwaarde en p-waarde?
4d) Wat kan je besluiten?
4e) Stel dat de agent zelf gedronken had en de gegevens verkeerd had opgeschreven. Dit zijn de juiste gegevens: (alles was hetzelfde behalve in de laatste rij waren er wat gegevens verschoven). Gaat de p-waarde nu vergroten, verkleinen of gelijk blijven, zonder alles opnieuw te moeten berekenen.
5) Er is een duidelijk verband tussen het aantal keer dat een kind in de hoek moet staan en het aantal kadotjes dat hij/zij krijgt van de Sint. (daaronder een tabel met x = het aantal keer in de hoek en y = het aantal kadotjes)
5a) Teken een scatterplot
5b) Wat denk je dat de correlatiecoëfficiënt gaat zijn o.b.v. de scatterplot? Positief of negatief en dicht bij 0 of dicht bij +-1?
5c) Bereken de correlatiecoëfficiënt. Wat betekent dit?
5d) Stel de vergelijking van de regressierechte op
5e) Lientje is heel braaf geweest voorbij jaar en is twee keer minder in de hoek moeten gaan staan. Hoeveel kadotjes verwacht je dat Lientje meer of minder gaat krijgen?
1a) Oefening op Σ( ) van bivariate normale verdeling
1b) Toon aan dat E(a+bX)=a+bE(X) en dat Var(a+bX)=b²Var(X)
1c) Oefening op kansregels
3) Oefening over hypothesetesten
3a) Stel H0 vs H1 op
3b) Geef de teststatistiek en bereken deze.
3c) Bereken de P-waarde
3d) Geef een grondig besluit
3e) Stel een 95%-betrouwbaarheidsinterval op en verklaar wat een betrouwbaarheidsinterval betekent.
4) Gelijkaardig aan 3)
5a) R-output van een ANOVA-tabel, ontbrekende getallen hierin invullen
5b) Bereken de P-waarde voor H0: α=0 vs. H1: α≠0
5c) Berekenen R² en wat is de betekenis hiervan?
1) Stellingen: duidt aan juist of fout. Indien juist, verklaar bondig waarom (vooral over normaliteit, bivariate normaliteit en eigenschappen daarrond)
2) Oefening rond spijbelgedrag en richting die je op school volgt. Eerste deel van de vraag: ga na of meer dan de helft vaak spijbelt bij ASO, tweede deel: vergelijk de proporties met spijbelfrequentie voor alle richtingen.
3) Oefening rond kansen waarbij je kansregels moest toepassen.
5) ANOVA-tabel en interpreteren output van R