Worldwide Wealth by SCBAM : เทคโนโลยีประมวลผลภาษา (Natural Language Processing) กับโลกการลงทุน

19 พฤษภาคม 2565

         นับตั้งแต่ปี 2012 ที่เทคโนโลยีการเรียนรู้ด้วยเครื่องเชิงลึก (Deep Learning) ซึ่งเป็นเทคนิคการสร้างปัญญาประดิษฐ์ที่ใช้การคำนวณที่ซับซ้อนผ่านการเรียนบนข้อมูลขนาดใหญ่ (Big Data) จนถึงวันนี้เป็นเวลากว่า 10 ปี ก็ยิ่งได้เห็นอุตสาหกรรมต่าง ๆ ตื่นตัวสูงที่จะนำการเรียนรู้ด้วยเครื่อง (Machine Learning) มาใช้ เพื่อเสริมประสิทธิภาพการทำงาน ทั้งในด้านความรวดเร็วและแม่นยำในการทำงานรวมถึงการช่วยลดต้นทุน โดยเฉพาะธุรกิจทางการเงิน ที่คาดหวังความแม่นยำในการทำนายค่าต่าง ๆ เพื่อให้ได้ผลตอบแทนการลงทุนสูงสุด ปัจจุบันจึงมีความพยายามใช้เทคโนโลยีดังกล่าวมาวิเคราะห์ข้อมูลสำคัญในการคัดเลือกหลักทรัพย์และการจัดสัดส่วนการลงทุน

         นอกเหนือจากข้อมูลทางการเงินของบริษัท ข้อมูลทางด้านราคา และข้อมูลจากนักวิเคราะห์ ยังมีข้อมูลอีกจำนวนมากที่ยังไม่ได้ถูกนำใช้งานและมีแนวโน้มที่จะสร้างความได้เปรียบให้แก่ผู้ที่เข้าถึงข้อมูลเหล่านี้ได้ เช่น ข้อมูลจาก Social Media, ข้อมูลปริมาณการค้นหาคำใน Google ข้อมูลข่าวตามหน้าหนังสือพิมพ์ ข้อมูลการใช้ไฟฟ้า ข้อมูลจากธุรกรรมบัตรเครดิต หรือแม้แต่ข้อมูลจากภาพถ่าย กล้องวงจรปิด กล้องดาวเทียม ข้อมูลดังกล่าวส่วนใหญ่เป็นข้อมูลที่ซับซ้อน ยังไม่อยู่ในรูปแบบที่เป็นระเบียบเพียงพอให้นำไปประมวลผลเพื่อนำมาใช้งานต่อได้โดยง่าย จึงจำเป็นต้องแปลงข้อมูลให้อยู่ในรูปแบบที่ประมวลผลได้ง่ายก่อน

         ยิ่งในปัจจุบันที่ความคิดเห็นของผู้คนเชื่อมโยงกันทั่วโลก ทำให้ความคิดเห็นของผู้คนมีอิทธิพลอย่างมากต่อตลาด โดยเฉพาะความเห็นของบุคคลที่มีชื่อเสียงระดับโลก เช่น การออกมาส่งข้อความใน Twitter ของ Elon Musk สามารถส่งผลต่อตลาดหุ้น และตลาดคริปโตเคอเรนซี (Cryptocurrency) อย่างเห็นได้ชัดเจน จึงเป็นแรงบันดาลใจให้นักการเงิน หาทางจับสัญญาณอารมณ์ของผู้คนจากแหล่งข้อมูลขนาดใหญ่เช่น Social Media ต่าง ๆ โดยใช้เทคนิคทางด้านการประมวลผลภาษา (Natural Language Processing) ร่วมกับเทคนิคด้านการเรียนรู้ด้วยเครื่อง (Machine Learning) มาประมวลผลข้อมูล เพื่อวัดเป็นค่าเชิงอารมณ์ (Sentiment) ที่จะช่วยให้ทำนายทิศทางของตลาดได้รวดเร็วทันต่อสถานการณ์ยิ่งขึ้น และเพื่อให้ได้การประเมินที่แม่นยำมากขึ้น เราอาจให้น้ำหนักค่า Sentiment ของข้อความที่มาจากผู้มีชื่อเสียงที่เปิดบัญชีมายาวนาน หรือมียอด Follower ตามสูง ๆ หรือข้อความนั้นมีการเข้าร่วมจากผู้คนเป็นจำนวนมาก (Engagement) เช่น มียอดกดไลค์ กดแชร์ในปริมาณมาก


         นอกจากนี้ ยังมีงานวิจัยที่ใช้เทคนิคการเรียนรู้ด้วยเครื่อง เพื่อค้นหาหุ้นที่เกี่ยวข้องกับธีมการลงทุนพิเศษ (Thematic) เช่น ธีมหุ้นสุขภาพ หุ้นด้านการบิน เราสามารถกำหนดให้เครื่องค้นหาข้อมูลดูว่าหุ้นตัวใดควรจะถูกจัดให้อยู่ในธีมการลงทุนใดบ้าง โดยการวิเคราะห์คำบรรยายของหุ้นจากรายงานประจำปีของหุ้นแต่ละตัว เพื่อดูว่าคำบรรยายนั้นใกล้เคียงกับธีมการลงทุนใดมากที่สุด  ซึ่งการประเมินความใกล้เคียงของภาษา จะต้องใช้โมเดลที่พัฒนามาอย่างซับซ้อน ใช้เวลาสร้างยาวนานบนข้อมูลขนาดใหญ่มหาศาล แต่ในฐานะของนักพัฒนาเอกชนเราสามารถย่นเวลาการพัฒนานี้ได้โดยใช้โมเดลที่มีผู้ฝึกเตรียมไว้ให้แล้ว (Pre-Trained MLP Model) ตัวอย่างโมเดลสำหรับภาษาไทยที่นิยมใช้ในปัจจุบัน คือ WangchanBERTa พัฒนาโดยสถาบันวิทยสิริเมธี (VISTEC) ซึ่งเป็นโมเดลทางภาษาที่ใหญ่ โดยเทรนจากข้อมูลภาษาไทยขนาดมากกว่า 78 GB และก้าวหน้าที่สุดในเวลานี้ เนื่องจากมีความแม่นยำในการจำแนกข้อความ (Classification) และการจำแนกชนิดคำ (Part of Speech Tagging) สูงกว่าทุกโมเดลในปัจจุบัน ภายในโมเดลนี้สามารถวิเคราะห์อารมณ์ของภาษา (Sentiment Analysis) จัดกลุ่มเนื้อหา (Topic Modeling) ค้นหาคำจากความหมาย (Semantic Search) สร้างชุดข้อมูลสำหรับเทรนโมเดลเพิ่มเติม (Data Augmentation) หรือเปลี่ยนเอกสารข้อความให้กลายเป็นข้อมูลที่พร้อมคำนวณได้ (doc2vec) นอกจากนี้หากต้องการโมเดลที่พัฒนามาเฉพาะด้าน ก็อาจใช้โมเดล FinBERT ซึ่งพัฒนามาพิเศษให้เหมาะกับเอกสารข้อความด้านการเงิน

         หากมองย้อนกลับไปในทศวรรษที่ 80 - 90 การใช้ข้อมูลพื้นฐานจากงบการเงินเช่น P/B P/E ก็สามารถสร้างความได้เปรียบให้แก่นักลงทุนได้แล้ว แต่ปัจจุบันที่การแข่งขันด้านข้อมูลสูง นักลงทุนทุกคนสามารถเข้าถึงข้อมูลได้โดยง่าย ทำให้สร้างประโยชน์จากการใช้ข้อมูลกลุ่มนี้ได้น้อยลง ดังนั้นแนวโน้มความสำคัญของ Big Data และ Machine Learning จึงจำเป็นจะต้องใช้ข้อมูลที่ทันสมัยนำหน้าผู้อื่นอย่างน้อยหนึ่งก้าวอยู่เสมอ นักลงทุนที่สามารถปรับตัวให้สอดรับกับความเปลี่ยนแปลงของตลาดได้อย่างรวดเร็วทันเวลา ก็จะเกิดความได้เปรียบในการลงทุน และสร้างผลตอบแทนที่เอาชนะตลาดได้

         

 

โดย  คุณณรงค์ศักดิ์  ปลอดมีชัย​
        ประธานเจ้าหน้าที่บริหาร
        บริษัทหลักทรัพย์จัดการกองทุน ไทยพาณิชย์ จำกัด​