Solution Center Minitab

ผู้เขียน : Solution Center Minitab

อัพเดท: 16 ก.ย. 2020 13.49 น. บทความนี้มีผู้ชม: 347 ครั้ง

Bill Kahn ทำการสร้างโมเดลทางสถิติสำหรับกลุ่มธนาคารเพื่อผู้บริโภคของธนาคารแห่งอเมริกา ทีมของเขาสร้างหลายร้อยโมเดลโดยใช้เทคนิคของสถิติและ Machine Learning ที่หลากหลาย โมเดลเหล่านี้ช่วยสร้างความมั่นใจในเสถียรทางการเงินของบุคคล ผู้ประกอบการ และคณะบุคคลทั่วประเทศ ในช่วงไม่กี่ทศวรรษที่ผ่านมา Bill ได้นำเอาสถิติมาใช้กับกลุ่มบริษัทผู้ใช้บริการทางการเงินที่อยู่ในอันดับ Fortune 500 ,บริษัทให้คำปรึกษา และบริษัทผู้ผลิต เขาจบปริญญาตรีสาขาฟิสิกส์และปริญญาโทสาขาสถิติจากเบิร์กลีย์และปริญญาเอกสาขาสถิติจากมหาวิทยาลัยเยล


มันยากที่จะคาดการณ์โดยเฉพาะเกี่ยวกับอนาคต (แม้แต่ด้วย Machine Learning)

Bill Kahn ทำการสร้างโมเดลทางสถิติสำหรับกลุ่มธนาคารเพื่อผู้บริโภคของธนาคารแห่งอเมริกา ทีมของเขาสร้างหลายร้อยโมเดลโดยใช้เทคนิคของสถิติและ Machine Learning ที่หลากหลาย  โมเดลเหล่านี้ช่วยสร้างความมั่นใจในเสถียรทางการเงินของบุคคล ผู้ประกอบการ และคณะบุคคลทั่วประเทศ ในช่วงไม่กี่ทศวรรษที่ผ่านมา Bill ได้นำเอาสถิติมาใช้กับกลุ่มบริษัทผู้ใช้บริการทางการเงินที่อยู่ในอันดับ Fortune 500 ,บริษัทให้คำปรึกษา และบริษัทผู้ผลิต เขาจบปริญญาตรีสาขาฟิสิกส์และปริญญาโทสาขาสถิติจากเบิร์กลีย์และปริญญาเอกสาขาสถิติจากมหาวิทยาลัยเยล

Minitab เชิญ Bill ให้ร่วมแบ่งปันประสบการณ์ของเขาเกี่ยวกับ Machine Learning (ML) ในหัวข้อ “พื้นฐานการปฎิบัติ” ในโลกธุรกิจ

 

ขั้นตอนวิธีของ Machine Learning (ML Algorithms)

หัวใจหลัก ขั้นตอนวิธีของ Machine Learning (ML Algorithm) ทั้งหมดจะมีสิ่งที่เหมือนกันคือสองส่วนของกระบวนการ ส่วนแรกลำดับของฟังก์ชั่นที่ซับซ้อนมากนั้นเหมาะสมกับบางส่วนของข้อมูล (เรียกว่า training data set) จากนั้นแต่ละโมเดลในลำดับจะถูกประเมินว่าประสิทธิภาพการทำงานของข้อมูลที่จัดขึ้นเพื่อทดสอบโมเดลนั้นดีเพียงใด (เรียกว่า holdout set) เลือกโมเดลที่ดีสุดจากชุดข้อมูลจัดขึ้น (holdout set) มีการเปลี่ยนแปลงมากมายในขั้นตอนเหล่านี้รวมถึง ลำดับการสำรวจ, พบโมเดลที่ดีสุดอย่างไร, โมเดลดีสุดให้คำจำกัดความว่าอย่างไร, และอะไรคือชุดข้อมูล(holdout set) ที่ถูกลือก และปรากฎว่า ด้วยข้อควรระวังเล็กน้อย, ลำดับธรรมดาๆนี้มักจะสร้างผลลัพธ์ที่ดีในการทำนาย

 

ข้อควรระวังสองข้อ

ข้อแรก, เราต้องใช้ฟังก์ชั่นการสูญเสีย(loss function) ที่เหมาะสมและประเมินโมเดล หากฟังก์ชั่นการสูญเสียไม่ได้ระบุอัลกอรึทึมของ Machine Learning อย่างถูกต้องทั้งหมดมันสามารถสร้างผลลัพธ์ที่ไร้สาระได้เช่นกัน - เช่นการจำแนกทุกคนในกลุ่มที่มีอิทธิพล เราจำเป็นต้องใช้ประสบการณ์ของเราเพื่อเลือกฟังก์ชั่นการสูญเสียที่เกี่ยวข้องกับธุรกิจ วิทยาศาสตร์หรือวิศวกรรม

ข้อสอง, เนื่องจากขั้นตอนวิธีทุกอันมีพารามิเตอร์หลายตัว (พารามิเตอร์ที่ไม่สามารถสร้างขึ้นได้บนพื้นฐานของแนวคิดล้วนๆ) เราต้องสำรวจช่วงกว้างที่เพียงพอสำหรับการใช้งานเพื่อให้แน่ใจว่าเราไม่ได้กำลังใข้ชุดค่าที่น่ากลัว ซึ่งจะนำไปสู่การคาดการณ์ที่แย่ไม่สามารถยอมรับได้

 

ทำนายอนาคต

อย่างไรก็ตามขณะที่วิธีการของ Machine Learning นั้นดีในการทำนายภายในตัวอย่าง แต่นั่นไม่ใช่สิ่งที่เราต้องการ เราต้องการการคาดการณ์ที่ดีใช้กับนอกกลุ่มตัวอย่าง การก้าวกระโดดนี้จากประสบการณ์ในอดีตไปสู่พฤติกรรมในอนาคต เรื่องใหญ่เรื่องหนึ่งและต้องพิจารณาเพิ่มเติมโดยได้ต้องได้ข้อสนับสนุนจากหลักการทางสถิติ ข้อพิจารณาเหล่านี้รวมถึง: การเลือกปัญหาที่ถูกต้อง การเลือกตัวแปรอิสระที่มีความหมาย การเรียกข้อมูลที่ขัดแย้ง การทำความเข้าใจลำดับชั้นและการพึ่งพาระหว่างการสังเกตและการสร้างลำดับที่ถูกต้องของโมเดล ไม่มีข้อกำหนดเหล่านี้เป็นเอกลักษณ์เฉพาะของ Machine Learning ทั้งหมดล้วนต้องการการวิเคราะห์ทางสถิติเพื่อความน่าเชื่อถือ

และในที่สุดสิ่งที่ดีที่สุดที่โมเดลสามารถทำได้คือดึงสารสนเทศที่อยู่ในข้อมูลออกมา เพื่อให้มีคุณค่าจะต้องมีสารสนเทศในข้อมูลในที่แรก เพื่อให้แน่ใจว่าข้อมูลของเรามีสารสนเทศที่มีค่าอยู่ในนั้น การออกแบบการทดลองมีความสำคัญในโมเดล ML (Machine Learning) มันเป็นสิ่งสำคัญสำหรับโมเดลทำนายอื่นๆ เมื่อมีการออกแบบที่มีโครงสร้างที่ดีตอนนี้คุณสามารถสร้างโมเดฃ ML และให้คะแนนทุกครั้งที่แทนค่าลงไปของทุกๆเงื่อนไขของกลุ่มตัวแปรที่ควบคุมได้ เราเรียนรู้วิธีที่ดีที่สุดในการตั้งค่าป้อนเข้าที่สามารถควบคุมได้ทั้งหมด (เช่น ราคาที่แสดงหรือช่องทางการตลาดหรืออุณหภูมิหรือความเร็ว) เพื่อให้ได้ผลลัพธ์ที่ดีที่สุดสำหรับทุกค่าที่ป้อนเข้า

วิธีการนี้ให้ประโยชน์สูงสุดจากสิ่งที่เรารู้ แต่มีข้อเสียอย่างมีนัยสำคัญสำหรับระบบใดๆที่เป็นช่วงคิดค้นสิ่งใหม่อย่างแท้จริง เงื่อนไขที่ดีที่สุดของปัจจัยควบคุมย้ายเปลี่ยนด้วยตัวมันเองได้เมื่อปัจจัยสิ่งแวดล้อมภายนอกเปลี่ยน (เช่น การพัฒนาคุณภาพของวัตถุดิบ, การเจรจาผลประโยชน์ของผู้บริโภค, หรือการตอบโต้ของคู่แข่ง) ถ้าเราทำการกำหนดค่าเงื่อนไขที่ดีที่สุดอย่างจำเพาะเจาะจงเพียงครั้งเดียวตลอดเมื่อนั้นคุณจะสับสนว่าอะไรคือสิ่งที่สังเกตเห็นกับอะไรคือสิ่งที่เราทำ วิธีการนี้จะทำการสร้างโมเดลใหม่และปรับปรุงที่เป็นไปไม่ได้ให้ การออกแบบการทดลองที่ทันสมัยกว่า ตัวอย่างเช่น การสุ่มแบบ Thomson แก้ปัญหานี้โดยท้าทายความเชื่อปัจจุบันของเราอย่างต่อเนื่อง การออกแบบเหล่านี้ช่วยให้เราสามารถสร้างสมดุลระหว่างผลลัพธ์ทางตัวเงินตอนนี้และเรียนรู้สิ่งที่เราต้องการเพื่อให้สามารถสร้างรายได้ในอนาคตเช่นกัน

ML คือชุดเครื่องมือที่เป็นส่วนเสริมที่มีประสิทธิภาพมากสำหรับมืออาชีพ ด้วยข้อระมัดระวังขั้นพื้นฐานบางข้อ ทำให้เราสามารถหลีกเลี่ยงความโง่เขลาและความน่าสะพรึงกลัวและเมื่อรวมกับทักษะทางสถิติแบบเต็มชุด ML ช่วยให้เราเป็นนัดสถิติที่ดีกว่าเดิม


บทความต้นฉบับ : https://www.solutioncenterminitab.com/blog/tough-making-predictions-about-future-machine-learning/


บทความนี้เกิดจากการเขียนและส่งขึ้นมาสู่ระบบแบบอัตโนมัติ สมาคมฯไม่รับผิดชอบต่อบทความหรือข้อความใดๆ ทั้งสิ้น เพราะไม่สามารถระบุได้ว่าเป็นความจริงหรือไม่ ผู้อ่านจึงควรใช้วิจารณญาณในการกลั่นกรอง และหากท่านพบเห็นข้อความใดที่ขัดต่อกฎหมายและศีลธรรม หรือทำให้เกิดความเสียหาย หรือละเมิดสิทธิใดๆ กรุณาแจ้งมาที่ ht.ro.apt@ecivres-bew เพื่อทีมงานจะได้ดำเนินการลบออกจากระบบในทันที