ข้อมูลขนาดใหญ่ (Big Data)

บทนำ

มนุษย์เราทุกวันนี้นอกจากจะสร้างขยะจำนวนมหาศาลแล้ว เรายังสร้างข้อมูลจำนวนมหาศาลทุกวันอีกด้วย ซึ่งข้อมูลจำนวนมหาศาลดังกล่าวเราไม่สามารถจะใช้ระบบการประมวลผลแบบเดิมเข้าไปดำเนินการได้ เนื่องจากข้อมูลที่เกิดขี้นในปัจจุบัน นอกจากมีจำนวนมหาศาลแล้ว ยังมีความซับซ้อนมากขึ้น ชึ่งเรารู้จักข้อมูลดังกล่าวในชื่อว่า Big Data ดังนั้น จึงจำเป็นต้องพัฒนาเครื่องมือขึ้นมาใหม่เพื่อนำมาประมวลผลข้อมูลดังกล่าว เพื่อให้เกิดประโยชน์สูงสุด

ความหมายของ Big Data

Big data เป็นข้อมูลขนาดใหญ่และมีความซับซ้อนมาก และไม่สามารถที่จะประมวลผลโดยใช้วิธีการประมวลผลแบบเดิมได้ โดยมีคุณสมบัติที่สำคัญดังนี้

คุณสมบัติด้านปริมาณ (Volume) หมายถึงคุณสมบัติของขนาดข้อมูลต้องมีขนาดใหญ่มากพอ เนื่องจากขนาดของข้อมูลมีบทบาทสำคัญอย่างยิ่งในการกำหนดมูลค่าจากข้อมูล นอกจากนี้ไม่ว่าข้อมูลใดจะถือเป็นข้อมูลขนาดใหญ่จริงหรือไม่นั้นขึ้นอยู่กับปริมาณของข้อมูล ดังนั้น ‘ปริมาณ’ จึงเป็นคุณสมบัติหนึ่งที่ต้องพิจารณาขณะจัดการกับ Big Data

คุณสมบัติด้านความหลากหลาย (Variety) หมายถึงคุณสมบัติของข้อมูลที่มีแหล่งที่มาของข้อมูล และลักษณะของข้อมูลที่มีความหลากหลาย เนื่องจากทุกวันนี้ข้อมูลอาจจะอยู่ในรูปแบบของอีเมล์, ภาพถ่าย, วิดีโอ, เสียง และอุปกรณ์เซ็นเซอร์ต่างๆ เป็นต้น

คุณสมบัติด้านความเร็ว (Velocity) หมายถึงการที่ข้อมูลได้ถูกสร้างขี้นอย่างรวดเร็วและต่อเนื่อง และสามารถตอบสนองความต้องการของผู้ใช้เพื่อใช้ในการตัดสินใจได้อย่างทันเวลา เนื่องจากความเร็วเป็นศักยภาพที่สำคัญของข้อมูล ดังนั้น ความเร็วที่ข้อมูลไหลมาจากแหล่งต่าง ๆ เช่น ข้อมูลจากโซเชียลมีเดีย, เซ็นเซอร์, อุปกรณ์พกพาต่างๆ จึงมีความสำคัญอย่างมากในการที่จะนำข้อมูลดังกล่าวไปใช้ในการตัดสินใจได้อย่างทันเวลา

คุณสมบัติด้านความสามารถแปรผันได้ (Variability) หมายถึง คุณสมบัติของข้อมูลที่สามารถเปลี่ยนแปลงความหมาย รูปแบบ และการจัดเก็บไปตามลักษณะของการใช้งาน อีกทั้งข้อมูลยังมีหลากหลายมิติ ที่จะสามารถวิเคราะห์และแปลความหมายอีกด้วย

คุณสมบัติด้านความความถูกต้อง (Veracity) หมายถึง ความถูกต้องทำให้มั่นใจในคุณภาพของข้อมูล ดังนั้นผลลัพธ์ที่ได้จากข้อมูลจะถูกต้องและเชื่อถือได้ คุณภาพข้อมูลที่ไม่ดีจะสร้างรายงานที่ไม่ดี และไม่สอดคล้องกับความต้องการของผู้ใช้ ดังนั้นจึงจำเป็นอย่างยิ่งที่จะต้องมีข้อมูลที่สะอาดและเชื่อถือได้สำหรับการวิเคราะห์ การประมวลผล และการรายงาน

คุณสมบัติด้านความคุ้มค่า (Value) หมายถึง ความคุ้มค่าเป็นสิ่งสำคัญที่สุด สำหรับการลงทุนติดตั้งระบบวิเคราะห์ข้อมูลขนาดใหญ่ ถึงแม้องค์กรจะมีข้อมูลขนาดใหญ่ที่มีคุณสมบัติด้านอื่นๆ ครบทุกด้าน แต่ถ้าไม่สามารถทำให้ข้อมูลขนาดใหญดังกล่าวให้คุ้มค่ากับองค์กรอย่างแท้จริงได้ก็ไม่มีประโยชน์ในการลงทุน เนื่องจากในการติดตั้งระบบโครงสร้างพื้นฐานด้านไอทีเพื่อจัดเก็บข้อมูลขนาดใหญ่นั้นมีค่าใช้จ่ายสูงมากและ ธุรกิจต่าง ๆ จะต้องได้รับผลตอบแทนจากการลงทุนอย่างคุ้มค่าที่สุด

บทบาทของ Big Data ที่มีต่อการดำเนินชีวิตของเรา

การซื้อของออนไลน์ ผู้ค้าปลีกออนไลน์พยายามกำหนดเป้าหมายผู้บริโภคโดยดูที่ประวัติการเรียกดู ประวัติการซื้อหรือประวัติการค้นหา Amazon ดูรายการที่คุณซื้อล่าสุด และเปรียบเทียบกับข้อมูลขนาดใหญ่ จากนั้นจะแนะนำรายการอื่น ๆ ที่คุณน่าจะซื้อ ซึ่งส่วนมากจะตรงใจผู้ซื้อ เทคนิคเหล่านี้มีการใช้งานโดย Amazon เป็นอย่างมากและมีการใช้งานกับผู้ค้าปลีกรายอื่น ๆ

การสตรีมเพลง การสตรีมเพลงเป็นแบบส่วนบุคคลมากขึ้น ทำให้ผู้ฟังสามารถสร้างสถานีวิทยุ และเพลย์ลิสต์ของตนเองได้ บริการสตรีมเพลงจะรวบรวมข้อมูลนี้ตามประเภทของเพลงที่ผู้ฟังชื่นชอบ โดยรวบรวมจากข้อมูลขนาดใหญ่เพื่อดูแลรายการเพลงและสถานีวิทยุสำหรับผู้ฟังที่ชื่นชอบตามรสนิยมของผู้ฟังแต่ละคน และนำเสนอเพลย์ลิสต์รายสัปดาห์ที่ปรับเปลี่ยนตามรสนิยมของผู้ฟังแต่ละราย

สตรีมมิ่งทีวี Netflix ใช้ข้อมูลขนาดใหญ่เพื่อกำหนดประเภทของรายการโทรทัศน์และภาพยนตร์ที่จะนำเสนอ โดยทำตามข้อมูลขนาดใหญ่ที่ผู้ใช้ดูในแต่ละเดือน Netflix ได้กลายเป็นแพลตฟอร์มสตรีมมิ่งทีวีที่น่าดึงดูดที่สุดเพราะสามารถนำเสนอได้ตรงตามความต้องการของผู้ชมในแต่ละราย Netflix พิจารณาว่านักแสดง ประเภทผู้กำกับ ผู้ผลิต และแนวคิดใดที่ไดรับความนิยมในโลกของการสตรีมออนไลน์ พวกเขาใ้ช้ข้อมูลนี้เพื่อสร้างรายการโทรทัศน์และภาพยนตร์ที่พวกเขารู้ว่าจะเป็นที่นิยมของผู้ชมส่วนใหญ่

ด้านอาชญากรรม ข้อมูลขนาดใหญ่สามารถช่วยได้เมื่อต้องรับมือกับอาชญากรรม ช่วยให้ตำรวจ ตัดสินใจได้ว่าจะเกิดเหตุอาชญากรรมครั้งต่อไปเมื่อใด โดยใช้การคาดการณ์การรักษาความปลอดภัย เพื่อวิเคราะห์พื้นที่ที่มีอัตราการเกิดอาชญากรรมสูงที่สุด โดยใช้ระบบด้านไอทีเพิ่มเติมเพื่อให้สามารถค้นหาตำแหน่งที่จะส่งเจ้าหน้าที่ตำรวจไปดูแลได้ สิ่งนี้ทำให้สาธารณะปลอดภัย และช่วยให้ประหยัดงบประมาณใน ความพยายามที่สูญเปล่า ซึ่งจะช่วยให้เจ้าหน้าที่ตำรวจทราบว่ามีการก่ออาชญากรรมมากที่สุดที่ใด และสามารถป้องกันอาชญากรรมดังกล่าวไม่ให้เกิดขึ้นได้

ด้านสุขภาพ ข้อมูลขนาดใหญ่ทำให้เกิดความก้าวหน้าครั้งสำคัญในอุตสาหกรรมการดูแลสุขภาพ ระบบการจัดการสุขภาพอิเล็กทรอนิกส์ช่วยให้โรงพยาบาล สำนักงานของแพทย์ และผู้ปฏิบัติงานด้านการดูแลสุขภาพอื่นๆ สามารถแลกเปลี่ยนและแบ่งปันข้อมูลเพื่อการวิจัย การรักษาแนวทางใหม่ และการดูแลผู้ป่วยที่ดีขึ้น ข้อมูลนี้จะถูกใช้ ทันทีเมื่อมีคนเข้ารับการรักษาในโรงพยาบาล ในขณะเดียวกันก็มีผู้ที่ใช้อุปกรณ์ติดตามอัตราการเต้นของหัวใจ รูปแบบการนอนหลับ ระยะทางเดิน และมาตรการสุขภาพที่สำคัญอื่น ๆ เป็นต้น

สรุป

ข้อมูลขนาดใหญ่ที่มีขนาดมหาศาลนี้ สามารถนำมาใช้เพื่อปรับปรุงชีวิตประจำวันของเราให้ดีขึ้น ตั้งแต่การช็อปปิ้งออนไลน์ไปจนถึงการสตรีมทีวีไปจนถึงการป้องกันอาชญากรรม นอกจากนี้ ข้อมูลขนาดใหญ่ ได้มีบทบาทสำคัญอย่างยิ่งในการช่วยให้ทุกองค์กรทั้งภาครัฐ และเอกชน สามารถรวบรวมข้อมูลที่มหาศาลดังกล่าว แล้วนำมาวิเคราะห์และประมวลผล เพื่อให้เกิดประโยชน์สูงสุดในการบริหารจัดการอีกด้วย

การอ้างอิง

S. Sagiroglu and D. Sinanc, “Big Data: A review,” in Collaboration Technologies and Systems (CTS), 2013 International Conference on, 2013, pp. 42–47

M. Hansen, T. Miron-Shatz, A. Lau, and C. Paton, “Big Data in Science and Healthcare: A Review of Recent Literature and Perspe

Katal, A Wazid, M.; Goudar, R.H., (Aug,2013),” Big data: Issues, challenges, tools and Good practicesctives,” Yearb Med Inform, vol. 9, pp. 21–26, 2014.