Ikerketa estatistikoak pertsona talde batek dituen interesen inguruko iritzia (merkatura atera den produktu berri berri bat, bidaiatzeko leku gogokoena, praktikatzen duten kirola, erosi duten kotxe marka...) jakiteko egiten dira. Ikerketa hauetan, ondoko kontzeptuak lantzen dira:
Populazio edo lagin batean aztertzen dugun kualitate orori aldagai estatistikoa deitzen zaio. Bi motatako aldagai estatistikoak daude:
Ikeketa estatistiko batean, behin datuak jaso direla zenbatu egin behar dira.
Irakurritako liburu kopurua eta zenbat pertsonak egin duten aztertzen duen taula
Bi maiztasun mota existitzen dira:
hi datu bat (xi) gertatzen den aldi kopuruaren portzentajea, hau da, maiztasun erlatiboa
Adibidez:
Kasu honetan laginaren tamaina N = 250 da
Datuak irudikatzea estatistikako atal oso garrantzitsua da, informazioa ulergarria eta erakargarria egin behar delako. Behin informazio guztia ordenatua daukagula bi dira gehien erabiltzen diren irudikapen sistema
Dauzkagun datuetatik maiztasunak adierazi nahi direnean teknika hau erabiltzen da.
Kasu honetan zutabe bakoitzean irudikatzen dugu zenbat dauden (maiztasunak) eta zutabe bakoitza bata bestearengandik aldenduta jartzen dugu.
Portzentaiak kalkulatzen ditugu eta zirkulu bat portzentaia horietan banatzen dugu. Horretarako 360º zati ezberdinetan banatu behar dugu (errexena proportzionaltasuna edo hiruko erregela erabiltzea da zati bakoitzari arkuaren zer zati dagokion jakiteko).
Ikusi bezala jasotako informazioa berdina izan arren marrazkiak modu ezberdinean adierazten digu eta batzuetan teknika bat beste bat baino hobeagoa da.
Aldagaia jarraikia denean, hoberenea barra diagrama erabiltzea da, baina kasu honetan zutabeak ez dira bata bestarengandik aldentzen; bata bestearen ondoan pegatuta agertzen dira.
Gehien errepikatzen den balioa da. Hitzak berak esaten duen bezala, Modan egotea gehien errepikatzen den zerbait da.
Dauzkagun datuak batu (horrenbeste aldiz maiztasunak beste) eta datu kopuruaz zatitzean lortzen da.
Datuak txikienetik handienera ordenatu eta gero erdi-erdian dagoena da. Datu kopurua bikoitia bada, bi hauen batez-bestekoa hartuko dugu
Adibidez: Taulan eraikin batean bizi diren familiak eta dituzten auto kopurua ageri da.
0, 0, 1, 1, 1, 1, 1, 2, erdia 2, 2, 2, 3, 3, 3, 4, 4
Esperimentu bat auzazkoa dela diogu baldin eta gertatuko dena asmatzeko aukerarik ez badago, hau da, zoriaren menpekoa bada.
Ausazko esperimentu batean, izan daitezkeen emaitza guztiek lagin-espazioa osatzen dute, eta izan daitekeen emaitzetako bakoitza oinarrizko gertaera deitzen da.
Gertaera bat da lagin-espazioko azpimultzo bat (oinarrizko hainbat gertaerak osatua, beraz); oinarrizko gertaera horietako edozein betetzen bada, gertakaria bera ere betetzen dela esaten da.
Gertaera ziurra da beti gertatzen den gertakaria: lagin-espazioa bera.
Adibidea: Dado bat botatzean ez dakigu zer gertatuko den, beraz, dadoa botatzea sorizko gertaera bat dela esango dugu. Lagin espazioa = {1,2,3,4,5,6} dadoan sei aurpegi dituelako.
Gertaera bat suertatzeko probabilitatea, P idatziko duguna, berau gertatzeko dagoen aukera da. Probabilitatea beti 0 eta 1 arteko balioa da; beti ere 100ekin biderkatzean %a agertzen delarik. Gertaera bat suertatzeko probabilitatea handia bada balio hau 1 baliotik hurbil egongo da.
Gertaerari A deitzen badiogu, P(A), A emateko probabilitatea dela esango dugu.
Pierre Simon de Laplace (1749-1827) matematikari frantsesak A gertara suertatzeko probabilitatea honela definitu zuen. Honela bada, Laplaceren Legea hau da:
Adibidea: Aurreko dadoaren kasuan A = {batekoa ateratzea} dela esaten badugu P(A)=1/6 dela daukagu. Era berean beste sei aukerentzako