สำนักงานราชบัณฑิตยสภา ได้เผยแพร่ผ่าน FACEBOOK ข้อความ big data ในวงเว็บ (ข้อมูลมหัต) พร้อมทั้งอธิบายความหมายว่า
big data (ข้อมูลมหัต)
เซตข้อมูลขนาดใหญ่ที่มีความซับซ้อนมาก ประกอบด้วยลักษณะอย่างน้อย 3 ประการ คือ
1. มีปริมาตร (volume) มาก
2. มีการเปลี่ยนแปลงอยู่ตลอดเวลาอย่างต่อเนื่อง (velocity)
3. มีความหลากหลายในโครงสร้างข้อมูล (variety)
นอกจากนี้ อาจมีองค์ประกอบอื่นเพิ่มเติม เช่น มีความแปรผันสูงและมีความซับซ้อนมาก เนื่องจากอยู่ในรูปแบบต่าง ๆ ทั้งที่มีโครงสร้างที่แน่นอน เช่น เมทริกซ์ข้อมูล หรือไม่มีโครงสร้าง เช่น ข้อความ อีเมล วีดิทัศน์ หรือรวบรวมมาจากหลายแหล่ง
อีกทั้งยังมีความอื่นๆ อีกได้แก่
machine learning (การเรียนรู้ของเครื่อง)
สาขาหนึ่งของปัญญาประดิษฐ์ที่พัฒนามาจากการศึกษาการรู้จำแบบ เกี่ยวข้องกับการศึกษาและการสร้างอัลกอริทึมที่สามารถเรียนรู้ข้อมูลและทำนายข้อมูลได้ อัลกอริทึมนั้นจะทำงานโดยอาศัยโมเดลที่สร้างมาจากชุดข้อมูลตัวอย่างเพื่อการทำนายหรือตัดสินใจโดยไม่ต้องเขียนโปรแกรมไว้อย่างชัดแจ้ง
การเรียนรู้ของเครื่องต้องอาศัยวิธีการทางสถิติศาสตร์เป็นอย่างมาก โดยเชื่อมโยงกับองค์ความรู้อื่นที่ต้องการนำไปประยุกต์ เช่น การแพทย์ ชีวสารสนเทศศาสตร์ เคมีสารสนเทศศาสตร์
predictive analytics (การพิเคราะห์เชิงทำนาย)
เทคนิคเชิงสถิติต่าง ๆ เช่น การสร้างตัวแบบเพื่อการทำนาย การเรียนรู้ของเครื่อง และการทำเหมืองข้อมูลที่ใช้ในการวิเคราะห์ข้อมูลหรือข้อเท็จจริงหรือสกัดสารสนเทศจากข้อมูลทั้งในปัจจุบันและอดีต เพื่อทำนายเหตุการณ์ต่าง ๆ เช่น แนวโน้ม แบบรูปของพฤติกรรม โดยใช้ความสัมพันธ์ระหว่างตัวแปรอิสระและตัวแปรตาม มักใช้ในงานด้านวิทยาการประกันภัย การตลาด และการเงิน เทคนิคที่เป็นที่รู้จักกันอย่างแพร่หลาย เช่น การกำหนดคะแนนความวางใจ ซึ่งใช้ข้อมูลในอดีตเกี่ยวกับการกู้ยืมเงินและประวัติการชำระหนี้ของลูกค้า เพื่อจัดอันดับความวางใจของลูกค้าในการชำระหนี้
data mining (การทำเหมืองข้อมูล)
กระบวนการในการค้นหาแบบรูปและความสัมพันธ์ที่มีในเซตข้อมูลมหัต (big data) ซึ่งอาจมาจากระบบฐานข้อมูลหลากหลายโดยใช้วิธีการต่าง ๆ ของสถิติศาสตร์ และการเรียนรู้ของเครื่อง เพื่อให้ได้องค์ความรู้ใหม่ที่สามารถนำไปใช้ประกอบการตัดสินใจในด้านต่าง ๆ เช่น การเงิน ธุรกิจ การแพทย์ ยุทธศาสตร์ทหาร
ที่มา : สำนักงานราชบัณฑิตยสภา