solutioncenter minitab

ผู้เขียน : solutioncenter minitab

อัพเดท: 02 ธ.ค. 2019 13.45 น. บทความนี้มีผู้ชม: 33 ครั้ง

สมมติว่ามีการเก็บข้อมูลของรอบเวลา (cycle time) รายได้ (revenue) มิติขนาดของชิ้นงาน (dimension) หรือตัวชี้วัด (metric) บางค่าที่มีความสำคัญกับคุณ แล้วคุณต้องการรู้ว่าตัวแปรใดที่มีความสัมพันธ์กับค่าเหล่านี้ แล้วควรทำอย่างไรต่อไป


ระหว่าง Regression และ ANOVA เราจะเลือกใช้เครื่องมือไหนเมื่อไหร่

สมมติว่ามีการเก็บข้อมูลของรอบเวลา (cycle time)  รายได้ (revenue)  มิติขนาดของชิ้นงาน (dimension) หรือตัวชี้วัด (metric) บางค่าที่มีความสำคัญกับคุณ  แล้วคุณต้องการรู้ว่าตัวแปรใดที่มีความสัมพันธ์กับค่าเหล่านี้ แล้วควรทำอย่างไรต่อไป

เมื่อตอนที่ผมเรียนจบมาด้วยปริญญาที่เกี่ยวกับทางสถิติ ซึ่งในตอนเรียนนั้นได้มีการลงเรียนหลากหลายในวิชาสถิติ เช่น ตัวแบบการถดถอยเชิงเส้น (Linear regression)  ANOVA หรือ ตัวแบบถดถอยลอจิสติกส์ (Logistic regression)

แต่ไม่มีวิชาไหนเลยที่รวมเอาหัวข้อเหล่านี้มาอธิบายในเรื่องเดียวกัน และระบุว่าเครื่องมือไหนที่เราควรเลือกใช้ เมื่ออยู่ในสถานการณ์อะไร  เมื่อผมมีข้อมูลทั้ง Y และ X's และต้องการที่จะอธิบายความสัมพันธ์ระหว่างสองตัวแปรนี้ จะต้องทำอย่างไร

ซึ่งผมต้องการใครสักคนที่จะมาอธิบายว่า ในการวิเคราะห์ด้วย  regression  หรือ ANOVA นั้นเหมาะสมกับข้อมูลแบบใด ดังนั้นเรามาเริ่มต้นกันที่ การเลือกเครื่องมือที่เหมาะสมกับค่า Y ที่เป็นข้อมูลแบบต่อเนื่อง (ค่าวัด)

 

เมื่อค่า Y และ X(s) เป็นข้อมูลต่อเนื่อง (ค่าวัด)

ตัวอย่างเช่น

Y: น้ำหนักของผู้ใหญ่เพศชาย

X’s: อายุ  ความสูง  จำนวนนาทีที่ออกกำลังกายในหนึ่งสัปดาห์

เครื่องมือใดที่เลือกใช้   ถ้าคำตอบคือ Regression

ใน Minitab จะสามารถใช้ได้ด้วยการเลือก Stat > Regression > Regression > Fit Regression Model

 

กรณีที่ ค่า Y เป็นค่าต่อเนื่อง (ค่าวัด)และ X(s) เป็นข้อมูลประเภทหรือหมวดหมู่ (Categorical)

ตัวอย่างเช่น

Y: คะแนนจากเกม Mario Kart Wii

X’s: การใช้ตัวควบคุมของ  Wii (แบบ พวงมาลัยบังคับ (racing wheel) หรือ แบบมาตรฐาน)  ท่าที่ใช้ขณะเล่น (ยืน หรือ นั่ง) ตัวละครที่ใช้ในการเล่นเกม (Mario, Luigi, Yoshi, Bowser, Peach)

เครื่องมือใดที่เลือกใช้   ถ้าคำตอบคือ ANOVA

ใน Minitab จะสามารถใช้ได้ด้วยการเลือก Stat > ANOVA > General Linear Model > Fit General Linear Model

 

กรณีที่ ค่า Y เป็นค่าต่อเนื่อง (ค่าวัด)และ X(s) เป็นข้อมูลประเภทหรือหมวดหมู่ (Categorical) และ ค่าต่อเนื่อง (ค่าวัด)

ตัวอย่างเช่น

Y: จำนวนชั่วโมงที่นอนในแต่ละคืน

X’s: อายุ กิจกรรมที่ทำก่อนเข้านอน (ไม่ได้ทำอะไรเลย อ่านหนังสือ ดูโทรทัศน์ เล่นอินเตอร์เนท) มีเด็กเล็กอยู่ด้วยหรือไม่... “ฝันร้าย” “หิวน้ำ” “มีปีศาจอยู่ใต้เตียง” (เป็นกรณีจากเด็กๆที่มักจะโวยวายกับผู้ใหญ่ในระหว่างคืน)

เครื่องมือใดที่เลือกใช้   ถ้าคำตอบคือ ANOVA หรือ Regression

ใน Minitab จะสามารถใช้ได้ด้วยการเลือก Stat > ANOVA > General Linear Model > Fit General Linear Model  หรือ  Stat > Regression > Regression > Fit Regression Model

ส่วนตัวแล้วผมจะเลือกใช้ GLM เพราะว่าสามารถทำการเปรียบเทียบเชิงซ้อนได้ (multiple comparisons) ซึ่งมีประโยชน์มากกับกรณีที่เจอกับข้อมูล X ที่เป็นแบบประเภทหรือหมวดหมู่ ตั้งแต่ 2 ระดับขึ้นไปและมีนัยสำคัญ  ตัวอย่างเช่น กิจกรรมที่ทำก่อนเข้านอนมีนัยสำคัญ  การเปรียบเทียบจะบอกได้ว่าระหว่าง 4 กิจกรรม – ไม่ได้ทำอะไรเลย  อ่านหนังสือ ดูโทรทัศน์ และ เล่นอินเตอร์เนท – มีนัยสำคัญ และแตกต่างกันอย่างไร

คนที่ดูโทรทัศน์ มีจำนวนชั่วโมงในการนอนคล้ายคลึงกับคนที่เล่นอินเตอร์เนท แต่น้อยกว่าคนที่ไม่ได้ทำอะไร และ คนที่อ่านหนังสือ หรือ คนที่เล่นอินเตอร์เนทจะมีผลแตกต่างอย่างมีนัยสำคัญ จากอีกสามกิจกรรมที่เหลือ ซึ่งการวิเคราะห์แบบเปรียบเทียบจะทำให้รู้ถึงความแตกต่างนี้ได้

 

ข้อมูล Y ที่เป็นแบบประเภทหรือหมวดหมู่ (Categorical)

กรณีที่ Y เป็นข้อมูลนับ แบบประเภทหรือหมวดหมู่ คุณควรใช้เครื่องมือในการวิเคราะห์คือ ตัวแบบถดถอยแบบลอจิสติกส์ (logistic regression) สำหรับข้อมูล X’s ที่อาจเป็นได้ทั้งข้อมูลวัดและข้อมูลนับ ซึ่งตัวแบบถดถอยแบบลอจิสติกส์

 

มีทั้งหมด 3 แบบให้เลือกใช้ได้ คือ

 Binary:  ค่า Y มี 2 ระดับ เช่น ใช่/ไม่ใช่ หรือ ผ่าน/ไม่ผ่าน (yes/no, pass/fail)

Ordinal:  ค่า Y มีมากกว่า 2 ระดับ และมีลักษณะเป็นการเรียงลำดับขั้น เช่น ต่ำ กลาง สูง (low/medium/high)

Nominal:  ค่า Y มีมากกว่า 2 ระดับและไม่มีลักษณะการเรียงลำดับ  เช่น ประเภทรถ sedan/SUV/minivan/บรรทุก

ดังนั้นในครั้งต่อไปที่คุณมีข้อมูล X’s และ Y อยู่ แล้วคุณต้องการศึกษาถึงความสัมพันธ์ของข้อมูลทั้งสองตัวแปรนี้ ให้เลือกเครื่องมือโดยมีเกณฑ์ตามที่สรุปให้ดังนี้

สำหรับขั้นตอนในการใช้เครื่องมือ General Regression, General Linear Model, หรือ Logistic Regression ใน Minitab นั้นสามารถหาได้เพิ่มเติมจากการเลือก Help จากตัวเลือกด้านล่างซ้ายของกล่องข้อความ ซึ่งจะแสดงตัวอย่างการใช้งานที่อยู่ในหน้าจอด้านบนของหน้าต่าง Help  หรือ สามารถติดต่อฝ่ายสนับสนุนลูกค้าของ Minitab ด้วยทาง 814-231-2682 หรือ www.minitab.com/contact-us. ซึ่งมีทีมงานที่จะคอยตอบคำถามทางเทคนิคให้กับทุกคนโดยไม่มีค่าใช้จ่ายเพิ่มเติม


บทความต้นฉบับ : https://blog.minitab.com/blog/michelle-paret/regression-versus-anova-which-tool-to-use-when

เนื้อหาบทความโดยบริษัท Minitab Inc. ประเทศสหรัฐอเมริกา
แปลและเรียบเรียงโดยสุวดี นําพาเจริญ และ ชลทิชา จํารัสพร, บริษัท โซลูชั่น เซ็นเตอร์ จํากัด webadmin@solutioncenterminitab.com


บทความนี้เกิดจากการเขียนและส่งขึ้นมาสู่ระบบแบบอัตโนมัติ สมาคมฯไม่รับผิดชอบต่อบทความหรือข้อความใดๆ ทั้งสิ้น เพราะไม่สามารถระบุได้ว่าเป็นความจริงหรือไม่ ผู้อ่านจึงควรใช้วิจารณญาณในการกลั่นกรอง และหากท่านพบเห็นข้อความใดที่ขัดต่อกฎหมายและศีลธรรม หรือทำให้เกิดความเสียหาย หรือละเมิดสิทธิใดๆ กรุณาแจ้งมาที่ ht.ro.apt@ecivres-bew เพื่อทีมงานจะได้ดำเนินการลบออกจากระบบในทันที