การพยากรณ์ดัชนี S&P500 โดยใช้การเรียนรู้เชิงลึก (ตอนที่ 2)

ความเดิมตอนที่แล้ว

ในบทความที่แล้วเราได้พูดถึงความสำคัญของ Lief Index แล้วว่าทำไมเราต้องสร้าง Lief Index ขึ้นมา ความสำคัญของปัญญาประดิษฐ์ หรือ AI ว่าทำไมถึงต้องให้ AI ทำนายผลลัพธ์ของ Lief Index และ ปัจจัยทางเศรษฐกิจที่สำคัญต่อ Lief Index ว่ามีปัจจัยอะไรบ้าง ในบทความนี้อยากจะพูดถึง การนำข้อมูลที่ทางทีม Investment Research ได้พูดไปในบทความก่อน มาทำการทดลองกับโมเดล (AI) ที่ทาง Lief ได้คิดค้นขึ้นมาสำหรับการทำ Lief Index โดยเฉพาะ

โมเดลที่มีความซับซ้อนย่อมทำให้ผลลัพธ์ที่ได้มีความแม่นยำ

โมเดลของเอไอหรือ Deep Learning model ถ้าเราเปรียบภาพของสิ่งนี้ง่ายๆมันก็คือสมองของเรานั่นเอง แต่เราสามารถดีไซน์สมองอันนี้ให้ยิ่งมีความซับซ้อนได้ ยิ่งมีความซับซ้อนมากเท่าไหร่ ก็จะสามารถรับข้อมูลที่ยากและมีความซับซ้อนได้มากเท่านั้น ซึ่งโครงสร้างที่เรานำมาใช้อ้างอิงจากงานวิจัยชื่อว่า SCINet หรือ Sample Convolution and Interaction Network ซึ่งเป็นโมเดลทางด้าน Time Series ซึ่งมีความโดดเด่นกว่าโมเดลอื่นๆทั้งในแง่ของโครงสร้างและประสิทธิภาพ

ภาพแสดงโครงสร้างของ SCINet

โดยหลักการทำงานของ SCINet จะค่อยๆแบ่งข้อมูลออกมาทีละครึ่งแล้วจะมีชั้นที่คอยกรองวิเคราะห์ข้อมูลเหล่านั้น การแบ่งข้อมูลย่อยๆทำให้โมเดลสามารถหาความสัมพันธ์ของข้อมูลได้ดีกว่า หลังจากนั้นโมเดลย่อยเหล่านี้จะถูกมาเรียงต่อกันเป็นชั้นอีกทีเพื่อเพิ่มความซับซ้อนของโมเดลทำให้สามารถวิเคราะห์ได้ละเอียดขึ้น ทั้งนี้ขึ้นอยู่กับการปรับจูนของข้อมูลแต่ละชุดด้วยที่จะทำให้โมเดลนั้นเรียนรู้ได้เหมาะกับข้อมูลเหล่านั้นมากขึ้น

ภาพแสดงประสิทธิภาพของ SCINet เทียบกับโมเดลอื่นๆ

จะเห็นได้ว่า loss ที่เกิดขึ้นจากโมเดล Time Series อื่นๆจะมีค่ามากกว่า SCINet ในทุกๆการทดสอบแสดงให้เห็นว่าการจัดโครงสร้างแบบใหม่นี้ช่วยทำให้โมเดลสามารถเข้าใจและวิเคราะห์ข้อมูลได้ดีมากขึ้น

การทดลองที่ดีต้องสร้างหลายๆกรณี

จากข้อมูลที่ทางทีม Investment Research ได้ไปรวบรวมมากจากหลายแหล่ง ทางทีมจะขอจำแนกการทดลองเป็น 4 แบบ เราได้แบ่งการทดลองเป็น 4 แบบเพราะว่า 

ซึ่งการทดลองทั้ง 4 แบบ นั้นมีความแตกต่างกันขึ้นกับแต่ละปัจจัยที่ทางทีมได้ใส่เข้าไปโดยการทดลองนี้สร้างขึ้นเพื่อที่จะทดสอบประสิทธิภาพของปัจจัย(Input features) ที่มีต่อดัชนี S&P500     

  • การทดลองที่ 1 เป็นการศึกษาปัจจัยที่เราคิดว่าเกี่ยวข้องกับสภาพเศรษฐกิจและตลาดที่ส่งผลกระทบต่อ S&P500 มากที่สุด ซึ่งเราเรียกว่า prior human

  • การทดลองที่ 2 เป็นการเพิ่มเติมปัจจัย FED Sentiment หรือก็คือ ความรู้สึกของธนาคารกลางสหรัฐที่มีต่อภาพรวมเศรษฐกิจซึ่งทางทีมจะต้องแปลงข้อมูลการประชุมจาก FED หรือ FOMC Minute Meeting ที่เป็น Text ให้อยู่ในรูปแบบของตัวเลขในรูปแบบของ time series 

  • การทดลองที่ 3 ทางทีมจะต่อยอดจากการทดลองที่  2 โดยเพิ่มปัจจัย Google Trend เข้าไปหมายความว่า เราจะเก็บข้อมูลจำนวนครั้งในการค้นหาข้อมูลใน google ที่ผู้คนค้นหาคำว่า S&P500 ในแต่ละช่วงเวลาแล้วทำการทดลองร่วมกับการทดลองที่ 2 ส่วนการทดลองสุดท้าย

  • การทดลองที่ 4 นั้น ทางทีมจะโฟกัสไปที่ตลาดทุนอื่นๆที่อาจมีความเกี่ยวข้องกับตลาด S&P500 

สำหรับบทความถัดไปเราจะพูดถึงการทดลองที่ 1 ว่ามีรายละเอียดอย่างไรบ้างและผลลัพธ์การทดลองเป็นอย่างไร

Lief index lab

Scroll to Top