6.4 การประยุกต์ใช้ Simple Linear Regression Analysis

 ผู้เขียนอยากจะยกตัวอย่างให้เห็นภาพวิธีการนำไปประยุกต์ใช้งาน ซึ่งจริงๆเวลาใช้งาน เรามักจะใช้ Software ช่วยในการคำนวณ ขั้นตอนก็จะรวบรัดมากกว่าที่ได้กล่าวในหัวข้อที่ผ่านมา นั่นเพราะว่าในการนำทฤษฎีอะไรก็ตามไปใช้งานจริงๆ เราก็ไม่จำเป็นต้องแสดงวิธีคิด หรือขั้นตอนอย่างละเอียด แต่นั่นต้องพึงระลึกอยู่เสมอว่า เราต้องมีความเข้าใจในทฤษฎี ซึ่งจะทำให้เราเข้าใจเหตุและผลของสิ่งที่ได้ 

ตัวอย่าง  นักวิจัยการตลาดคนหนึ่งกำลังสำรวจข้อมูล ราคาเช่าต่อเดือนของอาคารชุดประเภทคอนโดมิเนี่ยม ในเขตใกล้เคียงกับถนนศรีนครินทร์ ในช่วงที่อยู่ในเขตกรุงเทพมหานคร โดยการสำรวจได้เก็บตัวอย่าง โดยใช้อัตราค่าเช่าห้องต่อเดือน และขนาดของห้อง เป็นเกณฑ์ โดยได้ข้อมูลมาดังตารางต่อไปนี้  (ตัวเลขสมมติ)

พื้นที่ (m2) ค่าเช่าต่อเดือน (บาท)
22.5 2100
24 2800
26 3250
26.5 3600
30 3800
32 4300
34.5 4600
36.5 5000
38 5800
40 5900
42 7000

 

           เมื่อเราได้ข้อมูลมาดังในตาราง เราจะเริ่มการพิสูจน์ข้อมูลโดยใช้กราฟ Scatter plot

               จากกราฟที่ได้พอที่จะบอกได้ว่า พื้นที่กับค่าเช่าต่อเดือนมีความสัมพันธ์กัน จริงๆแล้วในโลกแห่งความเป็นจริง ก็ต้องเป็นเช่นนั้น เพราะหากกราฟไม่ได้บอกว่า พื้นที่กับค่าเช่า ไม่มีความสัมพันธ์กันเลยนั่น จะเป็นเรื่องผิดปกติ แสดงว่าการได้ข้อมูลมาอาจจะผิด ผู้เขียนกำลังต้องการจะสื่อว่าคนที่กำลังจะวิเคราะห์ข้อมูลจำเป็นต้องมี Sense แห่งความเป็นจริง และต้องตรวจสอบหากเห็นความผิดปกติ ซึ่งอาจจะมาจากการบันทึกหรือใส่ข้อมูลผิดพลาด หรือไม่ก็เก็บข้อมูลไม่เป็นไปตามหลักการที่ถูกต้อง เช่น ไปเก็บข้อมูลของหอพักนักศึกษา มารวมกับข้อมูลจากคอนโดมิเนี่ยม หรือไปเก็บจากตัวอย่างแถวๆ ถนนสุขุมวิทบริเวณอโศก  มาเทียบกับแถวศรีนครินทร์ ย่านสวนหลวง เพราะปัจจัยดังกล่าวมีผลต่อตัวแปรตาม (ค่าเช่าห้องต่อเดือน) อย่างมาก แม้พื้นที่จะไม่ต่างกันนักก็ตาม

         ใช้ Software ทำการประมวลผล ในกรณีนี้ผู้เขียนขอใช้ Microsoft Excel เทียบกับ Minitab แล้วทำการสรุปผล เริ่มจาก Microsoft Excel      

 

  Coefficients Standard Error t Stat P-value
Intercept -2487.472284 455.7671781 -5.45777 0.000402
X Variable 1 214.5232816 13.96587796 15.36053 9.18E-08

 

Regression Statistics
Multiple R 0.981457
R Square 0.963257
Adjusted R Square 0.959175
Standard Error 296.59
Observations 11

 

                      เมื่อดูข้อมูลจาก 2 ตารางที่ได้จากโปรแกรม Microsoft Excel เราจะได้สมการ Regression ดังนี้

ค่าเช่าต่อเดือน = -2487.47 + 214.52 x พื้นที่ห้อง

                     ทั้งนี้เพราะจากตารางที่ 1 ค่า P-Value ของค่าคงที่ และ สัมประสิทธิ์ของตัวแปรต้น(พื้นที่) มีค่าน้อยกว่า 0.05 ทั้งคู่ (กรณีนี้ใช้ค่าความเชื่อมั่นที่ 95%)  ทำให้ไม่สามารถละทิ้งได้  เมื่อดูจากตารางที่ 2 ก็จะเห็นว่า ค่า R2 และ R2 Adjust ก็ผ่านเกณฑ์ทั้งคู่ จึงเชื่อได้ว่า ตัวแปรต้นและตัวแปรตาม ในการทดลองครั้งนี้มีความสัมพันธ์ต่อกัน แน่นอน แต่จะเป็นแบบเชิงเส้นหรือไม่ ต้องวิเคราะห์ต่อไปจาก ANOVA Table

 

   ANOVA          
  df SS MS F Significance F
Regression 1 20755127.49 20755127 235.9459 9.17675E-08
Residual 9 791690.6874 87965.63    
Total 10 21546818.18      

          

             จากตาราง ANOVA ที่ได้ เราจะเห็นว่า Regression มีค่ามากกว่า Residual (Error) ถึง 235.9 เท่า นั่นแสดงว่าสาระส่วนใหญ่ที่ได้หากนำสมการนี้ไปใช้ ก็จะเป็น Regression มากกว่า Error หรือดูจากค่า P-Value ที่ถือได้ว่าเป็น 0  แสดงว่า สมการที่ได้มีความสัมพันธ์กันแบบเชิงเส้น (ปฎิเสธสมมติฐานที่ว่า สมการไม่ได้มีความสัมพันธ์กันแบบเชิงเส้น) 


       เมื่อเรา Verify ข้อมูล โดยใช้กราฟ 3 ข้อมูล ก็ยืนยันว่าข้อมูลที่เก็บมานั้นผ่านเกณฑ์หรือเงื่อนไขที่สำคัญ   

             ถ้าใช้ โปรแกรม Minitab จะได้ผลการวิเคราะห์ดังนี้

                      Regression Analysis: Rent versus Area

         The regression equation is

         Rent = - 2487 + 215 Area

 

             Predictor       Coef       SE Coef      T       P

             Constant       -2487.5      455.8     -5.46     0.000

               Area           214.52      13.97     15.36    0.000

 

            S = 296.590   R-Sq = 96.3%      R-Sq(adj) = 95.9%

 

         Analysis of Variance

            Source         DF        SS           MS          F       P

           Regression      1       20755127     20755127    235.95   0.000

           Residual Error  9       791691       87966

           Total           10      21546818

 

    มาถึงตรงนี้การวิเคราะห์ Regression ก็เสร็จสิ้น แล้วเราจะนำอะไรไปใช้ และใช้ได้อย่างไร เราจะนำสมการ Regression ที่ได้ไปใช้ประโยชน์ ยกตัวอย่าง พนักงานรายนี้จะใช้ข้อมูลดังกล่าวนำเสนอผู้บริหาร โดยนำสมการไปใช้คำนวณหาค่าเช่าที่จะกำหนด  เพื่อให้ผู้บริหารตัดสินใจว่า ถ้าจะสร้างห้องขนาดเท่าที่ผู้บริหารกำหนดไว้นั้น ควรจะเก็บค่าเข่าเดือนละเท่าใด โดยเขาทำเป็นตารางดังตัวอย่างต่อไปนี้

 

พื้นที่ห้อง (ตารางเมตร) ค่าเช่าต่อเดือน (บาท)
36 5,235.37
45 7,166.08
56 9,525.83

                    โดยใช้สมการ  

                        ค่าเช่าต่อเดือน = -2487.47 + 214.52 x พื้นที่ห้อง

จะเห็นว่า เขาสามารถที่จะประมาณได้ว่า ห้องที่มีขนาดพื้นที่แตกต่างกัน ควรจะจะกำหนดราคาเช่าต่อเดือนเท่าใด ทั้งๆที่ ข้อมูลในตารางนี้เขาไม่ได้เก็บข้อมูลมาก่อน  แต่เมื่อเขามีสมการความสัมพันธ์ระหว่าง พื้นที่ห้องกับค่าเช่ารายเดือน เขาก็สามารถที่จะนำไปใช้คาดการณ์ได้

Comments