วัตถุประสงค์การเรียนรู้
เมื่อศึกษาบทนี้แล้ว ผู้เรียนควรสามารถอธิบาย จัดการ วิเคราะห์ และนำเสนอข้อมูลเชิงปริมาณได้อย่างถูกต้อง
เข้าใจข้อมูลเชิงปริมาณ
อธิบายความหมายและประเภทของข้อมูลเชิงปริมาณ เช่น ข้อมูลไม่ต่อเนื่องและข้อมูลต่อเนื่อง
ใช้ Excel/SPSS
ใช้ Excel และ SPSS เพื่อจัดการข้อมูล คำนวณสถิติ และสรุปผลการวิเคราะห์
ทำ Data Cleaning
ตรวจสอบ Missing Values, Duplicate Data, Outliers และรูปแบบข้อมูลที่ไม่สอดคล้องกัน
วิเคราะห์ข้อมูล
เลือกใช้สถิติเชิงพรรณนาและเชิงอนุมาน เช่น t-test, ANOVA, Correlation และ Regression
สร้างกราฟ
เลือกกราฟที่เหมาะสม เช่น Bar Chart, Line Chart, Histogram, Pie Chart และ Boxplot
ข้อมูลเชิงปริมาณคืออะไร?
ข้อมูลเชิงปริมาณ คือ ข้อมูลที่แสดงค่าในรูปตัวเลข สามารถนำไปคำนวณ วิเคราะห์ และประมวลผลทางสถิติ เพื่ออธิบายลักษณะ แนวโน้ม ความสัมพันธ์ ความแตกต่าง หรือใช้ประกอบการตัดสินใจเชิงวิชาการได้อย่างเป็นระบบ
ภาพที่ 6.1 แนวคิดของข้อมูลเชิงปริมาณในการวิจัย
ข้อมูลไม่ต่อเนื่อง (Discrete Data)
เป็นข้อมูลที่ได้จากการนับจำนวน มีค่าเป็นจำนวนเต็ม และเพิ่มขึ้นเป็นขั้น ๆ เช่น จำนวนพนักงาน จำนวนสินค้าที่ขายได้ หรือจำนวนครั้งที่เข้าเรียน
- เหมาะกับ Frequency, Mean, Median, Mode
- นิยมแสดงผลด้วย Bar Chart
- ใช้วิเคราะห์จำนวนหรือความถี่ของเหตุการณ์
ข้อมูลต่อเนื่อง (Continuous Data)
เป็นข้อมูลที่ได้จากการวัดค่า สามารถมีค่าทศนิยม และมีค่าระหว่างตัวเลขสองค่าใด ๆ ได้ เช่น น้ำหนัก ส่วนสูง เวลา อุณหภูมิ และรายได้
- เหมาะกับ Mean, SD, Histogram, Boxplot
- ใช้ตรวจการกระจายและ Outliers
- ใช้ต่อยอดสู่ Correlation และ Regression ได้
| ลำดับ | อายุ | รายได้/เดือน | คะแนนสอบ | น้ำหนัก | ส่วนสูง | เวลาเข้าเรียน | อุณหภูมิ | ยอดขาย | ผู้ใช้บริการ |
|---|---|---|---|---|---|---|---|---|---|
| 1 | 18 | 8,500 | 78 | 55.2 | 165 | 45 | 32.5 | 120 | 35 |
| 2 | 19 | 9,200 | 85 | 60.0 | 170 | 40 | 31.8 | 150 | 42 |
| 3 | 20 | 10,500 | 92 | 62.5 | 168 | 50 | 33.1 | 180 | 48 |
| 4 | 21 | 12,000 | 67 | 58.0 | 160 | 55 | 30.9 | 95 | 28 |
| 5 | 22 | 15,000 | 88 | 70.3 | 175 | 35 | 34.0 | 210 | 55 |
เครื่องมือที่ใช้ในการจัดการข้อมูลเชิงปริมาณ
บทนี้เน้น 2 เครื่องมือหลัก คือ Microsoft Excel สำหรับจัดการและวิเคราะห์เบื้องต้น และ SPSS สำหรับวิเคราะห์เชิงสถิติในงานวิจัย
Microsoft Excel
เหมาะสำหรับ Data Entry, Data Preparation, Basic Statistical Calculation, PivotTable และการสร้างกราฟพื้นฐานก่อนส่งต่อไปวิเคราะห์ขั้นสูง
ตัวอย่างสูตร Excel สำหรับวิเคราะห์คะแนนสอบนักศึกษา
SPSS
เหมาะสำหรับงานวิจัยที่ต้องการสถิติเชิงพรรณนาและการทดสอบสมมติฐาน เช่น t-test, ANOVA, Correlation, Regression และ Factor Analysis
เส้นทางเมนูสำคัญใน SPSS สำหรับงานวิจัยเชิงปริมาณ
ตัวอย่างข้อมูลคะแนนสอบสำหรับฝึก Excel
กำหนดให้คอลัมน์คะแนนสอบอยู่ในช่วง D2:D11 เพื่อคำนวณค่าเฉลี่ย มัธยฐาน ส่วนเบี่ยงเบนมาตรฐาน และจัดกลุ่มผ่าน/ไม่ผ่าน
| ลำดับ | รหัส | เพศ | คะแนนสอบ | ผลการสอบ |
|---|---|---|---|---|
| 1 | 65001 | ชาย | 78 | ไม่ผ่าน |
| 2 | 65002 | หญิง | 85 | ผ่าน |
| 3 | 65003 | หญิง | 92 | ผ่าน |
| 4 | 65004 | ชาย | 67 | ไม่ผ่าน |
| 5 | 65005 | ชาย | 74 | ไม่ผ่าน |
| 6 | 65006 | หญิง | 88 | ผ่าน |
| 7 | 65007 | ชาย | 90 | ผ่าน |
| 8 | 65008 | หญิง | 81 | ผ่าน |
| 9 | 65009 | ชาย | 69 | ไม่ผ่าน |
| 10 | 65010 | หญิง | 95 | ผ่าน |
ภาพที่ 6.4 ตัวอย่างแนวคิด PivotTable เพื่อเปรียบเทียบคะแนนเฉลี่ยจำแนกตามเพศ
การเตรียมและทำความสะอาดข้อมูล
Data Cleaning เป็นขั้นตอนสำคัญก่อนการวิเคราะห์ เพราะข้อมูลที่ผิดพลาดจะทำให้ผลการวิเคราะห์คลาดเคลื่อนและขาดความน่าเชื่อถือ
Missing Values
ข้อมูลสูญหาย เช่น ผู้ตอบแบบสอบถามไม่ตอบบางข้อ หรือไฟล์นำเข้าไม่สมบูรณ์
Filter / FrequenciesDuplicate Data
ข้อมูลซ้ำจากการกรอกหลายครั้ง ทำให้จำนวนตัวอย่างเกินจริง
Remove DuplicatesOutliers
ค่าผิดปกติ เช่น คะแนนเกิน 100 หรือรายได้สูงผิดปกติ
BoxplotInconsistent Format
รูปแบบข้อมูลไม่สอดคล้อง เช่น วันที่คนละรูปแบบ หรือเพศระบุ ช/ชาย/M
Recodeภาพที่ 6.5 กระบวนการทำความสะอาดข้อมูลก่อนวิเคราะห์
Checklist ก่อนเริ่มวิเคราะห์ข้อมูล
ตัวเลขควรเป็น Numeric ไม่ใช่ Text
ดูว่าค่าใดว่างหรือผิดปกติ
ลบข้อมูลซ้ำที่ไม่ได้ตั้งใจ
ใช้ Boxplot หรือ Conditional Formatting
ใช้ชื่อสั้น เข้าใจง่าย ไม่มีช่องว่าง
เก็บไฟล์ Raw Data แยกจากไฟล์ Clean Data
การวิเคราะห์ข้อมูลเชิงปริมาณ
การวิเคราะห์ข้อมูลเชิงปริมาณแบ่งได้เป็น 2 กลุ่มใหญ่ คือ สถิติเชิงพรรณนาเพื่ออธิบายข้อมูล และสถิติเชิงอนุมานเพื่อทดสอบสมมติฐานหรือสรุปผลไปยังประชากร
6.4.1 สถิติเชิงพรรณนา (Descriptive Statistics)
ใช้เพื่ออธิบายลักษณะทั่วไปของข้อมูล เช่น ค่ากลางและการกระจาย ก่อนนำไปวิเคราะห์เชิงอนุมาน
การกระจายของข้อมูล
ส่วนเบี่ยงเบนมาตรฐาน (Standard Deviation) ใช้อธิบายว่าข้อมูลกระจายออกจากค่าเฉลี่ยมากน้อยเพียงใด
SD สูง: ข้อมูลกระจายมาก เช่น นักศึกษาบางคนได้คะแนนสูงมาก บางคนต่ำมาก
ตัวอย่างการเขียนผลการวิเคราะห์เชิงพรรณนา
จากการวิเคราะห์คะแนนสอบของนักศึกษาจำนวน 10 คน พบว่าคะแนนสอบมีค่าเฉลี่ยเท่ากับ 78.5 คะแนน ส่วนเบี่ยงเบนมาตรฐานเท่ากับ 10.2 คะแนน แสดงให้เห็นว่านักศึกษามีผลสัมฤทธิ์ทางการเรียนอยู่ในระดับปานกลางถึงดี และมีการกระจายของคะแนนในระดับปานกลาง
ภาพที่ 6.6 แนวทางเลือกสถิติเชิงอนุมานให้ตรงกับโจทย์วิจัย
6.4.2 สถิติเชิงอนุมาน (Inferential Statistics)
ใช้สรุปผลจากกลุ่มตัวอย่างไปยังประชากร โดยอาศัยการตั้งสมมติฐาน ระดับนัยสำคัญ และค่า p-value
| เป้าหมาย | ตัวแปรตาม | ตัวแปรอิสระ/กลุ่ม | สถิติที่เหมาะสม |
|---|---|---|---|
| เปรียบเทียบ 2 ครั้ง คนเดิม | เชิงปริมาณ | ก่อน–หลัง | Paired t-test |
| เปรียบเทียบ 2 กลุ่มอิสระ | เชิงปริมาณ | ชาย/หญิง หรือ ทดลอง/ควบคุม | Independent t-test |
| เปรียบเทียบ ≥ 3 กลุ่ม | เชิงปริมาณ | 3 ห้องเรียนขึ้นไป | One-way ANOVA |
| ดูผล 2 ปัจจัย | เชิงปริมาณ | วิธีสอน + เพศ | Two-way ANOVA |
| ดูความสัมพันธ์ | เชิงปริมาณ | เชิงปริมาณ | Correlation |
| พยากรณ์ | เชิงปริมาณ | 1 ตัว/หลายตัว | Regression |
คะแนนก่อน–หลังเรียน
ใช้เมื่อวัดคนเดิม 2 ครั้ง เช่น คะแนนก่อนเรียนและหลังเรียนหลังใช้สื่อออนไลน์
เปรียบเทียบ 2 กลุ่มอิสระ
ใช้เปรียบเทียบค่าเฉลี่ยระหว่างกลุ่มที่ไม่ซ้ำกัน เช่น รายได้ชายและหญิง
เปรียบเทียบ 3 กลุ่มขึ้นไป
ใช้เปรียบเทียบคะแนนเฉลี่ยของนักศึกษา 3 ห้องเรียนขึ้นไป หากพบแตกต่างควรทำ Post Hoc
วิเคราะห์หลายปัจจัย
ใช้ตรวจผลของ 2 ปัจจัย เช่น วิธีสอนและเพศ รวมถึงปฏิสัมพันธ์ร่วมกัน
หาความสัมพันธ์
ใช้วิเคราะห์ว่าตัวแปรเชิงปริมาณสองตัวสัมพันธ์กันหรือไม่ เช่น ชั่วโมงอ่านหนังสือกับคะแนนสอบ
การพยากรณ์
ใช้พยากรณ์ตัวแปรตามจากตัวแปรอิสระ เช่น พยากรณ์ยอดขายจากงบโฆษณา
การแสดงผลข้อมูลด้วยกราฟ
กราฟที่เหมาะสมช่วยให้ผู้อ่านเข้าใจแนวโน้ม ความแตกต่าง การกระจาย และค่าผิดปกติของข้อมูลได้รวดเร็วขึ้น
Bar Chart
เหมาะสำหรับเปรียบเทียบข้อมูลระหว่างกลุ่ม เช่น คะแนนเฉลี่ยชาย/หญิง หรือยอดขายแต่ละสินค้า
Line Chart
เหมาะสำหรับแสดงแนวโน้มตามเวลา เช่น ยอดขายรายเดือน หรือจำนวนผู้ใช้บริการรายสัปดาห์
Histogram
เหมาะสำหรับดูการกระจายของข้อมูลต่อเนื่อง เช่น คะแนนสอบ รายได้ หรือส่วนสูง
Pie Chart
เหมาะสำหรับแสดงสัดส่วนของข้อมูล เช่น สัดส่วนค่าใช้จ่าย หรือสัดส่วนเพศในกลุ่มตัวอย่าง
Boxplot
เหมาะสำหรับดูค่ากลาง การกระจาย และ Outliers เช่น รายได้ที่ผิดปกติ
Scatter Plot
เหมาะสำหรับดูความสัมพันธ์ระหว่างตัวแปรเชิงปริมาณ 2 ตัว เช่น เวลาอ่านหนังสือกับคะแนนสอบ
ภาพที่ 6.7 ตัวอย่างรูปแบบกราฟสำหรับข้อมูลเชิงปริมาณ
กระบวนการวิเคราะห์ข้อมูลเชิงปริมาณ
การวิเคราะห์ที่ดีควรเริ่มจากการเก็บข้อมูลที่ถูกต้อง ไปจนถึงการตีความผลและสรุปผลเชิงวิชาการ
เก็บรวบรวมข้อมูล
สร้างเครื่องมือ เก็บข้อมูล และตรวจสอบความครบถ้วนของชุดข้อมูล
ทำความสะอาดข้อมูล
จัดการ Missing, Duplicate, Outliers และรูปแบบข้อมูลให้ถูกต้อง
วิเคราะห์ข้อมูล
เลือกใช้สถิติที่เหมาะสมกับโจทย์วิจัยและชนิดข้อมูล
แสดงผลข้อมูล
นำเสนอด้วยตาราง กราฟ และแผนภูมิที่เหมาะสม
ตีความและสรุปผล
เขียนผลการวิเคราะห์ให้เชื่อมโยงกับคำถามวิจัยและสมมติฐาน
กิจกรรมปฏิบัติประจำบท
ฝึกปฏิบัติแบบครบวงจร ตั้งแต่จัดข้อมูลด้วย Excel วิเคราะห์ด้วย SPSS และนำเสนอผลด้วยกราฟ
Lab 1: Excel Descriptive Statistics
- สร้างตารางคะแนนสอบ 10 คน
- คำนวณ Mean, Median, SD
- สร้าง Histogram
Lab 2: SPSS Paired t-test
- ป้อนคะแนนก่อนเรียนและหลังเรียน
- วิเคราะห์ค่าเฉลี่ยและ SD
- ทดสอบว่าคะแนนหลังเรียนสูงขึ้นหรือไม่
Lab 3: Visualization Selection
- เลือกกราฟให้เหมาะกับข้อมูล
- อธิบายเหตุผลการเลือกกราฟ
- สรุปข้อค้นพบจากกราฟ
แบบฝึกหัดท้ายบทที่ 6
แบบฝึกหัดที่ 1: ความเข้าใจพื้นฐาน
- ข้อมูลอายุของนักศึกษาเป็นข้อมูลประเภทใด เพราะเหตุใด
- อธิบายความแตกต่างระหว่างข้อมูลไม่ต่อเนื่องและข้อมูลต่อเนื่อง พร้อมยกตัวอย่าง
- เพราะเหตุใดการทำ Data Cleaning จึงมีความสำคัญก่อนวิเคราะห์ข้อมูล
แบบฝึกหัดที่ 2: การใช้ Excel
- กำหนดข้อมูลคะแนนสอบของนักศึกษา 10 คน แล้วคำนวณค่าเฉลี่ย มัธยฐาน และส่วนเบี่ยงเบนมาตรฐาน
- สร้าง Histogram เพื่อแสดงการกระจายของคะแนน
- สร้างคอลัมน์ผลการสอบด้วย IF โดยกำหนดคะแนนผ่านตั้งแต่ 80 คะแนนขึ้นไป
แบบฝึกหัดที่ 3: การใช้ SPSS
- กำหนดข้อมูลคะแนนก่อนเรียนและหลังเรียนของนักศึกษา 20 คน
- วิเคราะห์ค่าเฉลี่ยและส่วนเบี่ยงเบนมาตรฐาน
- ทดสอบว่าคะแนนหลังเรียนสูงกว่าก่อนเรียนหรือไม่ด้วย Paired Samples t-test
แบบฝึกหัดที่ 4: การเลือก Visualization
- ยอดขายรายเดือนควรใช้กราฟใด เพราะเหตุใด
- สัดส่วนค่าใช้จ่ายควรใช้กราฟใด เพราะเหตุใด
- การกระจายของรายได้พนักงานควรใช้กราฟใด เพราะเหตุใด
สรุปบทที่ 6
ข้อมูลเชิงปริมาณเป็นรากฐานของการวิเคราะห์ข้อมูลและงานวิจัยเชิงสถิติ ผู้เรียนควรเข้าใจประเภทข้อมูล การเตรียมข้อมูล การเลือกสถิติที่เหมาะสม การใช้ Excel/SPSS และการนำเสนอผลด้วยกราฟ เพื่อให้ผลการวิจัยมีความถูกต้อง น่าเชื่อถือ และสื่อสารได้อย่างชัดเจน