การวัดการกระจายของข้อมูล

เกมส์         
    
  การวดการกระจายของข้อมูล  แบ่งได้ เป็น 2 วิธี คือ
        1. การวัดการกระจายสัมบูรณ์ (Absolute Variation) คือ  การวัดการกระจายของข้อมูลเพียงชุดเดียวเพื่อดูว่าข้อมูลชุดนี้ แต่ละค่ามีความแตกต่างกันมากหรือน้อยเพียงไร นิยมใ้ช้ก้นอย่างน้อย 4  ชนิด คือ 
            1.1 พิสัย (range) 
            1.2  สวนเบี่ยงเบนควอร์ไทล ์ (quartile deviation)  
            1.3  สวนเบี่ยงเบนเฉลี่ย (mean deviation หรือ average deviation) 
            1.4  สวนเบี่ยงเบนมาตรฐาน  (standard deviation)  

พิสัย (range) 
        พิสัย หมายถึง การหาการกระจายของข้อมูลโดยนำข้อมูลที่มีค่าสูงที่สุด ลบกับข้อมูลที่มีค่าต่ำที่สุด เพื่อให้ได้ค่าที่เป็นช่วงของการกระจาย ซึ่งสามารถบอกถึงความกว้างของข้อมูลชุดนั้นๆ สำหรับสูตรที่ใช้ในการหาพิสัยคือ 

                                 พิสัย (R) = Xmax - Xmin 

Ex1. จงหาพิสัยจากข้อมูลชุดนี้ 25,19,32,29,19,21,22,31,19,20,15,22,23,20
วิธีทำ 
               สูตร พิสัย (R) = Xmax - Xmin               = 32 - 15 
                                                                           = 17
                                ข้อมูลชุดนี้มีพิสัย(R) เท่ากับ 17
                                 ดังนั้นความแตกต่างของข้อมูลสูงสุดกับข้อมูลต่ำสุดมีค่าเท่ากับ 17


สวนเบี่ยงเบนควอร์ไทล์ (quartile deviation)    

        ส่วนเบี่ยงเบนควอไทล์ คือ ค่าที่ใช้วัดการกระจายของข้อมูลโดยพิจารณาจากครึ่งหนึ่งของระยะจากควอไทล์ที่ 3 (Q3) ถึง ควอไทล์ที่ 1 (Q1) หรือ ครึ่งหนึ่งของความแตกต่างระหว่างควอไทล์ที่ 3 (Q3) และควอไทล์ที่ 1 (Q1) ของคะแนนข้อมูลชุดหนึ่งๆ เป็นการจัดการกระจายเพื่อวัดแนวโน้มเข้าสู่ส่วนกลางด้วยมัธยฐาน

โดยใช้สูตร Q.D =      

เมื่อ Q.D คือ ส่วนเบี่ยงเบนควอไทล์

        Qคือ ควอไทล์ที่ 3

        Qคือ ควอไทล์ที่ 1

ตัวอย่างที่ 14 จากข้อมูลที่ให้จงหาค่าส่วนเบี่ยงเบนควอไทล์

ช่วงคะแนน

ความถี่ (f)

ความถี่สะสม (Cf)

5 – 9

10 – 14

15 – 19

20 – 24

25 – 29

30 – 34

35 - 39

3

4

10

15

14

10

4

3

7

17 - Q3

32

46 - Q1

56

60

  N = 60  

วิธีทำ     1. หาตำแหน่ง Qและ Q3

            สูตร Qx = L+ I 

                Qคือ ค่าควอไทล์ที่ต้องการหา

                Lคือ ขีดจำกัดล่างที่แท้จริงของชั้นคะแนนที่ควอไทล์อยู่

                   i คือ อัตรภาค

                   N คือ จำนวนข้อมูลทั้งหมด

                    X คือ ตำแหน่งที่ของควอไทล์

                    F คือ ความถี่สะสมของชั้นก่อนถึงชั้นที่ควอไทล์อยู่

                       f คือ ความถี่ของชั้นที่ควอไทล์อยู่

            ค่าของคะแนนในตำแหน่ง Qx = 

            Qของคะแนนชุดนี้ตรงกับข้อมูลตัวนี้  = 15

            Qของคะแนนชุดนี้ตรงกับข้อมูลตัวนี้  = 45

2. หาค่า Q1 และ Q3

        Qคือ ข้อมูลตัวที่ 15 ตกอยู่ในชั้นคะแนน 15 – 19 (i = 5)

                Q= 14.5 + 5  = 18.5

        Q3 คือ ข้อมูลตัวที่ 45 ตกอยู่ในชั้นคะแนน 25 - 29

                Q= 24.5 + 5   = 29.14

3. นำค่า Q1 และ Qแทนค่า

        Q.D =      = 5.32

        ส่วนเบี่ยงเบนควอไทล์ คือ 5.32 อธิบายได้ว่าโดยเฉลี่ยคะแนนกระจายห่างจากคะแนนที่เป็นมัธยฐานอยู่ 5.32

ข้อสังเกต

  1. การวัดการกระจายโดยใช้ส่วนเบี่ยงเบนควอไทล์ยังคงใช้คะแนนเพียง 2 ค่า คือ คะแนนในตำแหน่ง Q1 และ Qทำให้การกระจายของข้อมูลที่วัดได้ไม่ละเอียดเท่าที่ควร
  2. ใช้วัดการกระจายของข้อมูลที่มีบางค่าสูงหรือต่ำกว่าข้อมูลอื่นๆ ในชุดเดียวกัน

สวนเบี่ยงเบนเฉลี่ย (mean deviation หรือ average deviation) 
            ส่วนเบี่ยงเบนเฉลี่ย คือ ผลเฉลี่ยของส่วนเบี่ยงเบนของคะแนนในข้อมูลชุดหนึ่งจากมัชฌิมเลขคณิตของข้อมูลชุดนั้น ซึ่งได้จากการรวมผลต่างระหว่างคะแนนแต่ละคะแนนกับค่ามัชฌิมเลขคณิตของข้อมูลชุดนั้นแล้วหารด้วยจำนวนข้อมูลทั้งหมด
  1. ส่วนเบี่ยงเบนเฉลี่ยของข้อมูลที่ไม่ได้จัดหมวดหมู่ (Ungrouped Data)

                                        สูตร M.D = 

                   M.D คือ ส่วนเบี่ยงเบนเฉลี่ย

                         คือ มัชฌิมเลขคณิต

                        Xคือ คะแนนของข้อมูลแต่ละตัว (i = 1,2,3...N)

                    Xi- คือ ความเบี่ยงเบนของคะแนนแต่ละตัวจากมัชฌิมเลขคณิต

                           | คือ เครื่องหมายแสดงค่าสัมบูรณ์ (Absolute Value) ของตัวเลขภายใน ซึ่งจะไม่คำนึงถึงเครื่องหมายตัวเลขภายใน (คิดแต่ขนาด) เช่น | 8| = 8, | 8 | = 8

ตัวอย่างที่ 15 จากข้อมูลต่อไปนี้จงหาความเบี่ยงเบนเฉลี่ย

  1. ข้อมูล 3, 6, 12, 14, 15, 16

ค่า  =  =  = 11

สร้างตารางช่วยคำนวณ

คะแนน ( X )

Xi-

3

6

12

14

15

16

-  8

-  5

1

3

4

5

8

5

1

3

4

5

 = 26

        สูตร M.D =          = 4.3

ดังนั้น  ส่วนเบี่ยงเบน คือ 4.3

    1. ส่วนเบี่ยงเบนเฉลี่ยของข้อมูลที่จัดหมวดหมู่ (Grouped Data) หาได้จากสูตร

      M.D = 

      M.D = ส่วนเบี่ยงเบนเฉลี่ย

      X = จุดกึ่งกลางชั้น

       = มัชฌิมเลขคณิต

      f = ความถี่ของแต่ละชั้น

      N = จำนวนข้อมูลทั้งหมด

      ตัวอย่างที่ 16  จากข้อมูลในตาราง จงคำนวณหาส่วนเบี่ยงเบนเฉลี่ย

    ช่วงคะแนน

    f

    Xi

    fX

    f

    5-9

    10-14

    15-19

    20-24

    25-26

    30-34

    35-39

    3

    4

    6

    8

    2

    4

    3

    7

    12

    17

    22

    27

    32

    37

    21

    48

    102

    176

    54

    128

    111

    -14.3

    -9.3

    -4.3

    0.7

    5.7

    10.7

    15.7

    42.9

    37.2

    25.8

    5.6

    11.4

    42.8

    47.1

     

    N = 30

    = 640

    =212.8

    วิธีทำ

        1. หาค่าจุดกึ่งกลาง
        2. มัชฌิมเลขคณิต  = 

                                                            = 

                                 = 21.3

  1. หาค่า 
  2. คำนวณหาค่าส่วนเบี่ยงเบนเฉลี่ยของข้อมูล

    M.D. =       =     = 

    ส่วนเบี่ยงเบนเฉลี่ยของข้อมูลชุดนี้คือ 7.09

    ข้อสังเกต

    1.  การวัดการกระจายโดยใช้ความเบี่ยงเบนเฉลี่ยใช้ข้อมูลทุกตัวมาคำนวณ ทำให้การวัดการกระจายละเอียดกว่า ค่าพิสัยและส่วนเบี่ยงเบนควอไทล์

    2.  เครื่องหมายสัมบูรณ์ (Absolute Value) จะมีค่าเป็นบวกหรือคิดเฉพาะขนาดเท่านั้น

    3.  ข้อมูลที่กระจายมาก ส่วนเบี่ยงเบนจะมีค่ามากและถ้ามีค่าน้อยการกระจายของข้อมูลก็น้อยด้วย


ส่วนเบี่ยงเบนมาตรฐาน (Standard Deviation : S.D.,S,s)

        ส่วนเบี่ยงเบนมาตรฐานเป็นค่าวัดการกระจายที่สำคัญทางสถิติ เพราะเป็นค่าที่ใช้บอกถึงการกระจายของข้อมูลได้ดีกว่าค่าพิสัย และค่าส่วนเบี่ยงเบนเฉลี่ย
        การหาส่วนเบี่ยงเบนมาตรฐานสามารถหาได้ 2 วิธี
        1.การหาส่วนเบี่ยงเบนมาตรฐาน(S.D.) ในกรณีข้อมูลไม่ได้มีการแจกแจงความถี่
          สามารถหาได้จากสูตร 

       สุตรที่ 1      หรือ

      สูตรที่ 2    

       เมื่อ   S.D. คือ ส่วนเบี่ยงเบนมาตรฐาน
         
                   x คือ ข้อมูล ( ตัวที่ 1,2,3...,n)
                    คือ ค่าเฉลี่ยเลขคณิต
                   n  คือ จำนวนข้อมูลทั้งหมด

หมายเหตุ ในกรณีที่ เป็นทศนิยมทำให้เกิดความยุ่งยากในการคำนวณ จึงควรเลือกใช้สูตรที่ 2 

Ex2.จากข้อมูลต่อไปนี้จงหาส่วนเบี่ยงเบนมาตรฐาน 1, 2, 4, 6, 8, 9
วิธีทำ 

       ใช้สูตรที่ 2    
                             หาค่า  = 
                                        = 1 + 4 + 16 + 36 + 64 + 91
                                        = 212
                             หาค่า  = 1 + 2 + 4 + 6 + 8 + 9
                                        = 30
                                     = 302
                                     = 900
                                     n   = 6
                             แทนค่าในสูตร 
                                   
                                   
                                   S.D. = 3.52

                2.การหาส่วนเบี่ยงเบนมาตรฐาน(S.D.) ในกรณีข้อมูลมีการแจกแจงความถี่
                    สามารถหาได้จากสูตร
                          1. 
                 หรือ 2. 

                               S.D. คือ ส่วนเบี่ยงเบนมาตรฐาน
                                f คือ ความถี่
                                x คือ จุดกึ่งกลางชั้น 
                                 คือ ค่าเฉลี่ยเลขคณิต
                                n  คือ จำนวนข้อมูล 


Ex3.จากตารางข้อมูลต่อไปนี้จงหาส่วนเบี่ยงเบนมาตรฐาน

คะแนน ความถี่(f )
5-9 3
10-14 6
15-19
7
20-24
8
25-29
10
30-34
12
35-39
14


        วิธีทำ ใช้สูตรที่ 2 

               สร้างตารางแจกแจงความถี่

คะแนน f x fx
5-9 3 7 49 21 147
10-14 6 12 144 72
864
15-19
7
17
289
119
2023
20-24
8
22
484
176
3872
25-29
10
27
729
270
7290
30-34
12
32
1024
384
12288
35-39
14
37
1369
148
19166
.
n  = 60
.
.
= 1190
 = 45650

                1. หาค่าเฉลี่ยเลขคณิต จากสูตร  = 
                                                                          

                                                                          = 19.83

               2.หาส่วนเบี่ยงเบนมาตรฐาน จากสูตร         
                                                                                          = 
                                                                                          = 
                                                                                          = 8.79
                      ดังนั้น  ส่่วนเบี่ยงเบนมาตรฐาน คือ 8.79
 
 
 
 
Comments