กระบวนการวิเคราะห์ข้อมูลทางสถิติมีความสำคัญต่อกระบวนการวิจัยในหลายขั้นตอน ประกอบด้วย 1) การวัดพฤติกรรมหรือสิ่งที่สนใจให้ออกมาเป็นตัวเลข ผ่านขั้นตอนการนิยามเชิงปฏิบัติการและการวัดค่าเชิงปริมาณ (Operationalization and quantification) เช่น การวัดผลสัมฤทธิ์ทางการเรียนของนักศึกษาด้วยข้อสอบผ่านผังข้อสอบ (Test blueprint) ที่สอดคล้องกับหลักสูตรเป็นค่าคะแนน เป็นต้น 2) การใช้ข้อมูลตัวเลขเพื่อตอบจุดประสงค์การวิจัยหรือเพื่อการทดสอบสมมติฐาน และ 3) การสรุปและแปลผลข้อมูลและนำไปตัดสินใจ ความถูกต้องของการวิจัยนั้น (Research validity) จึงอยู่บนพื้นฐานของคุณภาพของข้อมูลที่ผู้วิจัยเก็บมาและกระบวนการวิเคราะห์ข้อมูลทางสถิติที่ถูกต้อง การวิจัยจึงมีความสัมพันธ์กับสถิติเป็นอย่างมากตั้งแต่ การเลือกกลุ่มตัวอย่าง การวิเคราะห์ข้อมูล การสรุปผลการวิจัยและอ้างอิงข้อสรุปไปยังประชากรที่ต้องการศึกษา
แนวคิดพื้นฐานทางสถิติ (Basic concepts for statistics)
เพื่อเป็นการสร้างความเข้าใจเกี่ยวกับการวิเคราะห์ข้อมูลและสถิติที่ใช้ในการวิจัยทางการศึกษา ผู้เขียนขอนำเสนอแนวคิดพื้นฐานทางสถิติที่เป็นรากฐานสำคัญดังนี้
สถิติ (Statistics) มีความหมายในหลายความหมายได้แก่ ความหมายที่หนึ่งหมายถึงตัวเลขที่ใช้อธิบายหรือบรรยายลักษณะของข้อมูลจากตัวอย่างที่ศึกษา เช่น รายได้เฉลี่ยต่อครอบครัวของนักเรียน อัตราการรู้หนังสือของประชาชนในประเทศ ผลสัมฤทธิ์ทางการเรียนของนักเรียน เป็นต้น นอกจากนั้น สถิติยังหมายถึงศาสตร์แขนงหนึ่งที่ประกอบด้วยกระบวนการ 4 ขั้นตอน ซึ่งประกอบด้วย การเก็บรวบรวมข้อมูล การนำเสนอข้อมูล การวิเคราะห์ข้อมูล และการแปลความหมายและสรุปผลข้อมูล ซึ่งเป็นกระบวนการที่สำคัญของกระบวนการวิจัย
สถิติสามารถแบ่งเป็น 2 ประเภท คือ สถิติเชิงบรรยาย (Descriptive Statistics) และสถิติเชิงอ้างอิง (Inferential statistics) โดยมีรายละเอียดของสถิติแต่ละประเภทดังนี้ ประเภทที่หนึ่งสถิติเชิงบรรยายเป็นสถิติที่ประกอบด้วยการเก็บรวบรวมข้อมูล การวิเคราะห์ข้อมูลโดยมีจุดประสงค์สำคัญเพื่อใช้บรรยายลักษณะของประชากร หรือตัวอย่างที่ศึกษา เช่น การหาความถี่และร้อยละของนักเรียนที่ทดสอบ หรือการหาค่าเฉลี่ยคะแนนความรับผิดชอบในการเรียนของนักเรียนเป็นต้น ซึ่งช่วยทำให้เข้าใจลักษณะของสิ่งที่เราศึกษาและใช้เป็นข้อมูลพื้นฐานในการตัดสินใจ สถิติประเภทนี้ ประกอบด้วย 1) การนำเสนอข้อมูลในรูปตาราง กราฟ แผนภูมิ หรือรูปภาพ 2) การแจกแจงความถี่ 3) การวัดแนวโน้มเข้าสู่ส่วนกลาง 4) การวัดการกระจายของข้อมูล เป็นต้น ประเภทที่สองสถิติเชิงอ้างอิง เป็นสถิติที่ใช้ในการประมาณค่า และสรุปอ้างอิงโดยใช้ข้อมูลจากกลุ่มตัวอย่างที่เป็นบางส่วนของประชากรไปยังประชากรที่ต้องการศึกษาทั้งหมด สถิติเชิงอ้างอิง ประกอบด้วยกระบวนการ 2 แบบ ได้แก่ การประมาณค่าพารามิเตอร์ (Parameter estimation) และการทดสอบสมมติฐานทางสถิติ (Hypothesis testing) ทั้งนี้ความถูกต้องของผลการวิเคราะห์อยู่บนพื้นฐานของข้อมูลที่สุ่มมานั้น เป็นกลุ่มตัวอย่างที่เป็นตัวแทนที่ดีของประชากร (Good representative sample) ซึ่งได้มาจากกระบวนการคัดเลือกตัวอย่างที่เหมาะสม
https://miro.medium.com/v2/resize:fit:640/format:webp/1*h6ahyTEx6yDYETs6GU5Few.png
ภาพที่ 1 ความสัมพันธ์ระหว่างสถิติเชิงบรรยายและสถิติเชิงอ้างอิง
จากแผนภาพความสัมพันธ์ระหว่างสถิติเชิงบรรยายและสถิติเชิงอ้างอิงสามารถสรุปได้ว่า สถิตเชิงบรรยายนั้นเป็นสถิติที่ใช้ในการวิเคราะห์และสรุปข้อมูล และบรรยายลักษณะของทั้งประชากรและกลุ่มตัวอย่าง ทั้งนี้หากมีการคำนวณหรือวิเคราะห์ค่าตัวเลขจากประชากร ค่าตัวเลขที่คำนวณที่ได้จากประชากรทั้งหมดจะเรียกว่าค่าพารามิเตอร์ (Parameter) ซึ่งจะเขียนอยู่ในรูปตัวอักษรกรีก เช่น m (มิว) หมายถึงค่าเฉลี่ยของประชากร s (ซิกม่า) หมายถึงส่วนเบี่ยงเบนมาตรฐานของประชากร หรือ r (โร) หมายถึงค่าความสัมพันธ์เชิงเส้นตรงระหว่างตัวแปรในประชากร เป็นต้น และหากมีการคำนวณจากกลุ่มตัวอย่าง ค่าตัวเลขนั้นจะเรียกว่าค่าสถิติ (Statistics) และเขียนอยู่ในรูปตัวอักษรภาษาอังกฤษ เช่น หมายถึงค่าเฉลี่ยของกลุ่มตัวอย่าง SD หมายถึงส่วนเบี่ยงเบนมาตรฐาน หรือ r หมายถึงความสัมพันธ์เชิงเส้นตรงระหว่างตัวแปรของกลุ่มตัวอย่าง เป็นต้น
จากแนวคิดพื้นฐานทางสถิติที่ได้บรรยายข้างต้นนั้นสามารถเชื่อมโยงกับกระบวนการการวิจัยและพัฒนานวัตกรรมการเรียนรู้ ที่สำคัญคือการใช้สถิติเชิงบรรยายในการสรุปและทำความเข้าใจเกี่ยวกับลักษณะข้อข้อมูลจากกลุ่มตัวอย่าง เช่น การวิเคราะห์ความถี่ ร้อยละ ค่าเฉลี่ย และส่วนเบี่ยงเบนมาตรฐาน นอกจากนั้นการวิจัยโดยทั่วไปจะใช้สถิติเชิงอ้างอิงในการสรุปและตอบวัตถุประสงค์การวิจัย เนื่องจากการวิจัยส่วนใหญ่มักทำการศึกษากับกลุ่มตัวอย่าง แต่เป้าหมายของการศึกษานั้นเพื่ออธิบายหรือสรุปผลข้อมูลของทั้งประชากร เพราะฉะนั้นการใช้สถิติเชิงอ้างอิงจึงมีความสำคัญในการอธิบายข้อสรุปไปยังประชากรที่ทำการศึกษา เช่น การใช้สถิติทดสอบทีแบบไม่อิสระ (Dependent t-test) ในการยืนยันว่านวัตกรรมการเรียนรู้ที่ผู้วิจัยพัฒนาขึ้นมานั้นสามารถช่วยทำให้ผลสัมฤทธิ์ทางการเรียนเพิ่มสูงขึ้นหลังจากใช้นวัตกรรม ซึ่งค่าเฉลี่ยผลสัมฤทธิ์ทางการเรียนที่สูงขึ้นหลังจากที่ใช้นวัตกรรมบ่งชี้ว่านวัตกรรมการเรียนการสอนที่ผู้วิจัยพัฒนาขึ้นมานั้น สามารถช่วยเพิ่มผลสัมฤทธิ์ทางการเรียนของนักเรียนได้ เป็นต้น
จากการใช้สถิติเชิงอ้างอิงจึงเป็นกระบวนการที่มีความสำคัญในการสรุปผลการวิจัย โดยข้อมูลการใช้นวัตกรรมการเรียนรู้จากกลุ่มตัวอย่างไปยังประชากรที่ต้องการศึกษาด้วยการใช้สถิติทดสอบทีแบบไม่อิสระ เป็นต้น เพื่อสร้างความเข้าใจเกี่ยวกับการวิเคราะห์ข้อมูลและสถิติที่ใช้ในการวิจัยและพัฒนานวัตกรรมการเรียนรู้ ผู้เขียนจึงนำเสนอเนื้อหาทางสถิติที่สอดคล้องกับกระบวนการวิจัยตามประเภทของสถิติ คือ
1) สถิติเชิงบรรยาย (Descriptive statistics) ซึ่งประกอบด้วย ตารางแจกแจงความถี่ การวัดแนวโน้มเข้าสู่ส่วนกลาง (ค่าเฉลี่ย ค่ามัธยฐานและค่าฐานนิยม) และการวัดการกระจาย (พิสัย ความแปรปรวนและส่วนเบี่ยงเบนมาตรฐาน)
2) สถิติเชิงอ้างอิงที่ใช้ในการวิจัยที่เกี่ยวกับนวัตกรรมการเรียนรู้ ประกอบด้วย แนวคิดเกี่ยวกับการทดสอบสมมติฐานทางสถิติ สถิติทดสอบทีแบบไม่อิสระ (Dependent t-test) สถิติทดสอบทีแบบอิสระ (Independent t-test) และสัมประสิทธิ์สหสัมพันธ์ (Correlation) โดยมีจุดมุ่งเน้นที่ช่วยสร้างความเข้าใจเกี่ยวกับกระบวนการวิเคราะห์ข้อมูลทางสถิติ และเป็นพื้นฐานความเข้าใจสำหรับการค้นคว้าด้วยตนเองต่อไป
สถิติเชิงบรรยาย (Descriptive statistics)
ในกระบวนการวิจัย เมื่อทำการเก็บรวบรวมข้อมูลขั้นตอนที่สำคัญคือการจัดการกับข้อมูลที่เก็บรวบรวมมาได้ให้สามารถดูง่ายและสามารถสื่อสารกับผู้อื่นได้เข้าใจ สถิติเชิงบรรยายนั้นจะมีส่วนช่วยในการจัดการข้อมูล และนำเสนอข้อมูลด้วยค่าสถิติ การเลือกใช้สถิติเชิงบรรยายแต่ละชนิดนั้นขึ้นอยู่กับประเภทของข้อมูลและระดับการวัดของตัวแปร (Level of measurement) ของตัวแปรที่ต้องการวิเคราะห์ การบรรยายข้อมูลมักนิยมนำเสนอได้ 3 รูปแบบ คือ แผนภูมิ ตารางและการบรรยายด้วยค่าสถิติ ซึ่งจุดประสงค์สำคัญของการใช้สถิติเชิงบรรยายคือเพื่อสรุปและทำความเข้าใจเกี่ยวกับปรากฏการณ์ที่ผู้วิจัยสนใจจากข้อมูลที่เก็บรวบรวมมา โดยใช้เพื่อให้ความหมายและนำไปใช้เพื่อการตัดสินใจ
สถิติเชิงอ้างอิง (Inferential statistics)
สถิติเชิงอ้างอิงเป็นสถิติที่มีจุดประสงค์ในการบรรยายหรือสรุปผลคุณลักษณะของประชากร โดยใช้ข้อมูลของกลุ่มตัวอย่างที่เก็บรวบรวมมา หรือผู้วิจัยใช้ข้อมูลเพียงบางส่วนของประชากรในการสรุปผลเพราะฉะนั้นการสรุปผลมีความถูกต้อง แม่นยำเพียงใดจะอยู่บนพื้นฐานของการคัดเลือกตัวอย่าง (Sampling) ว่ากลุ่มตัวอย่างนั้นเป็นตัวแทนที่ดีของประชากรหรือไม่ ซึ่งการเป็นตัวแทนที่ดีของประชากรนั้นต้องอาศัยกระบวนการทางสถิติที่สำคัญ ประกอบด้วย การคำนวณขนาดกลุ่มตัวอย่าง (Sample size calculation) เพื่อให้ได้ขนาดของกลุ่มตัวอย่างที่เหมาะสม และเทคนิคการสุ่มตัวอย่าง (Random sampling) ที่เป็นการกำหนดวิธีการเลือกหรือสุ่มตัวอย่างที่สามารถสะท้อนกลุ่มประชากรทั้งหมดได้ (สุชาดา บวรกิติวงศ์, 2548) ในการวิเคราะห์สถิติเชิงอ้างอิงนี้ จะใช้ทฤษฎีความน่าจะเป็น (Probability theory) ในการประมาณค่าพารามิเตอร์หรือค่าสถิติของประชากรที่สนใจ ซึ่งสามารถประมาณค่าพารามิเตอร์ได้ทั้งการประมาณค่าทางสถิติ (Statistical estimation) และการทดสอบสมมติฐานทางสถิติ (Statistical hypothesis testing) โดยมีขั้นตอนในการทดสอบสมมติฐานทางสถิติสำหรับการวิจัยมีดังนี้
ขั้นตอนการทดสอบสมมติฐานทางสถิติสำหรับการวิจัย
เพื่อเป็นการทดสอบว่าค่าพารามิเตอร์ที่ศึกษามีค่าเป็นไปตามสมมติฐานที่ตั้งไว้หรือไม่ จะมีขั้นตอนในการทดสอบสมมติฐานทางสถิติ 5 ขั้นตอนดังนี้ (อรุณ จิรวัฒน์กุล, 2556)
1. กำหนดสมมติฐานหลักและสมมติฐานทางเลือก ในขั้นตอนดังกล่าวนั้น ผู้วิจัยต้องมีความรู้เกี่ยวกับวัตถุประสงค์ของการวิจัย สมมติฐานการวิจัย การเลือกใช้สถิติที่เหมาะสมกับการวิจัยเพื่อจะได้ตั้งสมมติฐานทางสถิติที่สอดคล้องกับจุดประสงค์ของการวิจัย โดยมีหลักการตั้งสมมติฐานหลักและสมมติฐานทางเลือกตามรายละเอียดของหัวข้อหลักการทดสอบสมมติฐานข้างต้น
2. เลือกใช้สถิติที่ใช้ในการทดสอบสมมติฐานทางสถิติ ทั้งนี้ในกระบวนการทดสอบสมมติฐานทางสถิตินั้นผู้วิจัยจะต้องคำนึงถึง ทั้งความสอดคล้องกับสมมติฐานทางสถิติ ทั้งนี้สถิติทดสอบนั้นมีหลายประเภท เช่น การทดสอบซี (Z test) การทดสอบทีประเภทต่าง ๆ (t-tests) การทดสอบเอฟ (F-test) หรือการทดสอบไคกำลังสอง (c2) เป็นต้น
3. กำหนดระดับนัยสำคัญทางสถิติ (a) และพื้นที่วิกฤติ ทั้งนี้ระดับนัยสำคัญทางสถิติหมายถึงเกณฑ์ในการยอมรับความคลาดเคลื่อนประเภทที่ 1 ที่ผู้วิจัยยอมให้เกิดขึ้นได้ ซึ่งโดยทั่วไปมักจะกำหนดระดับนัยสำคัญที่ 0.05 หรือ 0.01 และการกำหนดพื้นที่วิกฤติ ในการกำหนดพื้นที่วิกฤตินั้นจะต้องทราบถึงทิศทางในการทดสอบ ค่าองศาอิสระที่คำนวณจากกลุ่มตัวอย่าง และต้องเปิดตารางสถิติทดสอบเพื่อกำหนดจุดวิกฤติ เช่น ตารางคะแนนซี (Z score table) ตารางการแจกแจงที (t-distribution table) ตารางแจกแจงเอฟ (F-distribution table) หรือ ตารางการแจกไคกำลังสอง (c2-distribution table) โดยพื้นที่วิกฤตินั้นจะมีความสอดคล้องกับทิศทางของสมมติฐานทางเลือก จุดวิกฤตินี้จะแบ่งพื้นที่ในการตัดสินใจทางสถิติเป็น 2 ส่วนคือ นอกพื้นที่วิกฤติและพื้นที่วิกฤติซึ่งใช้ในการสรุปผลทางสถิติ
4. คำนวณค่าสถิติทดสอบและ/หรือคำนวณหาค่าพี (P-value) จากสถิติที่เลือกในขั้นตอนที่ 2 ผู้วิจัยนำข้อมูลที่เก็บจากกลุ่มตัวอย่างมาคำนวณค่าสถิติที่ใช้ทดสอบหรือสามารถเรียกได้ว่าสถิติทดสอบที่คำนวณได้ เช่น ค่าทีคำนวณ ค่าเอฟคำนวณ เป็นต้น ทั้งนี้ค่าสถิติทดสอบบ่งชี้ว่าข้อมูลที่เก็บมานั้นมีความแตกต่างจากสมมติฐานหลักมากน้อยเพียงใด ยิ่งสถิติทดสอบเป็นค่าบวกหรือลบมาก ๆ บ่งชี้ว่าข้อมูลที่ผู้วิจัยเก็บรวบรวมมานั้นแตกต่างจากสมมติฐานหลักมาก ในขณะที่พื้นที่วิกฤติจะเป็นเกณฑ์ที่ใช้ในการตัดสินใจว่าความแตกต่างที่เกิดขึ้นระหว่างข้อมูลที่เก็บรวมรวมมากับสมมติฐานหลัก มีมากจนไม่สามารถจะสรุปผลตามสมมติฐานหลักได้ซึ่งเรียกว่า มีนัยสำคัญทางสถิติ (Statistical significant)
ในการทดสอบสมมติฐานทางสถิติแบบดั้งเดิมนั้น จะเป็นการคำนวณค่าสถิติที่สามารถคำนวณได้จากกลุ่มตัวอย่างกับพื้นที่วิกฤติ แต่ปัจจุบันเนื่องจากมีการพัฒนาด้านโปรแกรมวิเคราะห์ทางสถิติที่ช่วยหาค่าพี
(P-value) หรือค่านัยสำคัญที่คำนวณได้ ซึ่งบ่งชี้ว่าจากข้อมูลที่เก็บมานั้นมีความน่าจะเป็นที่จะเกิดความคลาดเคลื่อนประเภทที่ 1 เท่าใด โดยค่าพีนั้นมีชื่อเรียกว่า ระดับนัยสำคัญที่คำนวณได้ (Observed significant level) (ราชบัณฑิตยสภา, 2561)
5. ตัดสินใจทางสถิติและสรุปผล การสรุปผลการทดสอบสมมติฐานทางสถิติสามารถทำได้ 2 รูปแบบ รูปแบบที่หนึ่งคือการเปรียบเทียบค่าสถิติทดสอบที่คำนวณได้ ในการทดสอบสมมติฐานทางสถิติองค์ประกอบที่สำคัญคือ ค่าสถิติทดสอบที่คำนวณได้ และพื้นที่วิกฤติ ถ้าหากค่าสถิติทดสอบที่คำนวณได้นั้นตกนอกพื้นที่วิกฤติจะสรุปผลตามสมมติฐานหลัก แต่ถ้าค่าสถิติทดสอบที่คำนวณได้นั้นตกในพื้นที่วิกฤติจะสรุปผลตามสมมติฐานทางเลือก เช่น ถ้าพื้นที่วิกฤติมีค่าเท่ากับ t > 1.833 และค่าสถิติทดสอบทีที่คำนวณได้มีค่าเท่ากับ 3.51 ผู้วิจัยจะสรุปผลตามสมมติฐานหลัก แต่ถ้าสถิติทดสอบทีที่คำนวณได้มีค่าเท่ากับ 0.82 จะสรุปผลตามสมมติฐานหลัก เป็นต้น
โดยสรุปการประยุกต์ใช้สถิติเพื่อใช้ในการวิเคราะห์ข้อมูลสำหรับการวิจัยมีความสำคัญเพื่อให้สามารถตอบปัญหาวิจัยได้อย่างถูกต้องและสอดคล้องกับจุดประสงค์ของการวิจัย องค์ประกอบสำคัญของแนวคิดด้านสถิติประกอบด้วย ประชากรและกลุ่มตัวอย่าง ค่าสถิติและค่าพารามิเตอร์ สถิติเชิงพรรณนาเป็นสถิติที่ใช้ในการสรุปและเข้าใจลักษณะของข้อมูล เช่น ตารางแจกแจงความถี่ การวัดแนวโน้มเข้าสู่ส่วนกลางและการวัดการกระจาย สถิติเชิงอ้างอิงเป็นสถิติที่ใช้ในการประมาณค่าพารามิเตอร์ของประชากรโดยใช้ข้อมูลจากตัวอย่างเพื่อตอบปัญหาวิจัย โดยสถิติเชิงอ้างอิงที่ใช้ในการวิจัยด้านนวัตกรรมทางการศึกษา เช่น สถิติทดสอบทีแบบไม่อิสระ สถิติทดสอบทีแบบอิสระ และค่าสัมประสิทธิ์สหสัมพันธ์ ซึ่งใช้กระบวนการทดสอบสมมติฐานทางสถิติในการสรุปผล
รายการอ้างอิง
ผ่องพรรณ ตรัยมงคลกูลและสุภาพ ฉัตราภรณ์. (2555). การออกแบบการวิจัย (พิมพ์ครั้งที่ 7). สำนักพิมพ์มหาวิทยาลัยเกษตรศาสตร์.
ราชบัณฑิตยสภา. (2561). พจนานุกรมศัพท์สถิติศาสตร์ ฉบับราชบัณฑิตยสภา (พิมพ์ครั้งที่ 2). สำนักงาน
ราชบัณฑิตยสภา.
สุชาดา บวรกิติวงศ์. (2548). สถิติประยุกต์ทางพฤติกรรมศาสตร์. สำนักพิมพ์แห่งจุฬาลงกรณ์มหาวิทยาลัย.
อรุณ จิรวัฒน์กุล. (2556). สถิติทางวิทยาศาสตร์สุขภาพเพื่อการวิจัย (พิมพ์ครั้งที่ 3). วิทยพัฒน์.