Regression

เป็นการศึกษาความสัมพันธ์ระหว่างตัวแปรตั้งแต่ 2 ตัวขึ้นไป ซึ่งได้แก่ตัว ประมาณการ (Predictor, X) และตัวตอบสนอง (Response, y) โดยเป็นความสัมพันธ์แบบเชิงเส้น (Linear) ทั้งนี้ในขั้นตอนการทำ Regression ต้องมีการเก็บจำนวน Sample space จำนวนมากพอ นั้นคือ มี x และ y ที่มีความสัมพันธ์กันหลายๆ ครั้ง เพื่อนำมาหาสมการความสัมพันธ์

Simple Linear Regression

จะเห็นได้ว่า ในกราฟ มีจุดหลายจุด นั้นคือ จุดที่บ่งบอกว่า เมื่อ x มีค่าจำนวนหนึ่ง จะส่งผลให้ y มีค่าจำนวนหนึ่ง ดังนั้น จำนวนจุดจึงมีผลสำคัญต่อการทำ Regression สมการ และกราฟข้างต้นเป็น Regression ที่คุ้นหน้าคุ้นตาเรากันดี และเชื่อว่าหลายท่านก็ใช้งานสมการนี้อยู่ทุกวัน ไม่ว่าจะเป็นการเทียบบัญญัติไตรยาง เช่น

ไข่ 10 ฟอง ราคา 38 บาท ไข่ 50 ฟอง ราคา 3.8 x 50 = 190 บาท เป็นต้น

นอกจากการซื้อของทั่วไปแล้ว สมการความเร็วรถก็เป็น Simple Linear Regression อีกด้วย นั้นคือ ระยะทาง = ความเร็ว x เวลา

ในการทำงานจริง ประสบการณ์จะสะสมให้เราเข้าใจมากขึ้นว่างานแบบไหนจะเหมาะกับการใช้ Linear Regression ซึ่งเมื่อระบบมีความซับซ้อนมากขึ้น Linear Regression อาจจะไม่ตอบโจทย์ ก็สามารถพิจารณาใช้การ Regression แบบอื่นๆ ได้ ทั้งนี้ Linear Regression ถือเป็นพื้นฐานที่สำคัญของการทำ Algorithm ประเภท Regression ทุกตัว หากเราทำความเข้าใจจุดนี้ให้แน่นพอแล้ว ก็จะเป็นพื้นฐานที่ดีให้เข้าใจ Regression ส่วนอื่นๆ ต่อไปด้วย

การ Regression เป็นการหาความสัมพันธ์ ในปัจจุบัน เป็นโมเดลที่ถูกใช้งานในทุกวงการ ไม่ว่าจะเป็นการพยากรณ์อากาศ หรือ การทำนายปริมาณ Demand เพื่อวางแผนระบบ supply chain เป็นต้น อย่างไรก็ตาม ค่าบ่งบอกต่างๆ ไม่ว่าจะเป็น R-square หรือ P-value จะมีที่มาที่ไป อื่นๆ ให้ได้เรียนรู้ต่อ