4125101 • Computer for Graduate Studies

บทที่ 6 การวิเคราะห์ข้อมูลเชิงปริมาณ
Quantitative Data Analysis

เรียนรู้การจัดการข้อมูลเชิงปริมาณด้วย Excel และ SPSS ตั้งแต่การทำความสะอาดข้อมูล การคำนวณสถิติเชิงพรรณนา การเลือกสถิติเชิงอนุมาน ไปจนถึงการสร้างกราฟเพื่อสื่อสารผลการวิจัยอย่างมืออาชีพ

Lec06

Excel • SPSS • Data Cleaning • Data Visualization

5Learning Objectives
2เครื่องมือหลัก
8+ตัวอย่างสถิติ
Labฝึกวิเคราะห์จริง
Excel SPSS Cleaning Statistics
Learning Objectives

วัตถุประสงค์การเรียนรู้

เมื่อศึกษาบทนี้แล้ว ผู้เรียนควรสามารถอธิบาย จัดการ วิเคราะห์ และนำเสนอข้อมูลเชิงปริมาณได้อย่างถูกต้อง

เข้าใจข้อมูลเชิงปริมาณ

อธิบายความหมายและประเภทของข้อมูลเชิงปริมาณ เช่น ข้อมูลไม่ต่อเนื่องและข้อมูลต่อเนื่อง

ใช้ Excel/SPSS

ใช้ Excel และ SPSS เพื่อจัดการข้อมูล คำนวณสถิติ และสรุปผลการวิเคราะห์

ทำ Data Cleaning

ตรวจสอบ Missing Values, Duplicate Data, Outliers และรูปแบบข้อมูลที่ไม่สอดคล้องกัน

วิเคราะห์ข้อมูล

เลือกใช้สถิติเชิงพรรณนาและเชิงอนุมาน เช่น t-test, ANOVA, Correlation และ Regression

สร้างกราฟ

เลือกกราฟที่เหมาะสม เช่น Bar Chart, Line Chart, Histogram, Pie Chart และ Boxplot

6.1 Quantitative Data

ข้อมูลเชิงปริมาณคืออะไร?

ข้อมูลเชิงปริมาณ คือ ข้อมูลที่แสดงค่าในรูปตัวเลข สามารถนำไปคำนวณ วิเคราะห์ และประมวลผลทางสถิติ เพื่ออธิบายลักษณะ แนวโน้ม ความสัมพันธ์ ความแตกต่าง หรือใช้ประกอบการตัดสินใจเชิงวิชาการได้อย่างเป็นระบบ

ตัวอย่างข้อมูลเชิงปริมาณ: อายุ รายได้ คะแนนสอบ น้ำหนัก ส่วนสูง เวลา อุณหภูมิ ปริมาณยอดขาย และจำนวนผู้ใช้บริการ
123 Numeric คำนวณและวิเคราะห์ทางสถิติได้ Discrete ข้อมูลจากการนับ Continuous ข้อมูลจากการวัด อธิบายแนวโน้ม • เปรียบเทียบ • หาความสัมพันธ์ • พยากรณ์

ภาพที่ 6.1 แนวคิดของข้อมูลเชิงปริมาณในการวิจัย

ข้อมูลไม่ต่อเนื่อง (Discrete Data)

เป็นข้อมูลที่ได้จากการนับจำนวน มีค่าเป็นจำนวนเต็ม และเพิ่มขึ้นเป็นขั้น ๆ เช่น จำนวนพนักงาน จำนวนสินค้าที่ขายได้ หรือจำนวนครั้งที่เข้าเรียน

  • เหมาะกับ Frequency, Mean, Median, Mode
  • นิยมแสดงผลด้วย Bar Chart
  • ใช้วิเคราะห์จำนวนหรือความถี่ของเหตุการณ์

ข้อมูลต่อเนื่อง (Continuous Data)

เป็นข้อมูลที่ได้จากการวัดค่า สามารถมีค่าทศนิยม และมีค่าระหว่างตัวเลขสองค่าใด ๆ ได้ เช่น น้ำหนัก ส่วนสูง เวลา อุณหภูมิ และรายได้

  • เหมาะกับ Mean, SD, Histogram, Boxplot
  • ใช้ตรวจการกระจายและ Outliers
  • ใช้ต่อยอดสู่ Correlation และ Regression ได้
ลำดับอายุรายได้/เดือนคะแนนสอบน้ำหนักส่วนสูงเวลาเข้าเรียนอุณหภูมิยอดขายผู้ใช้บริการ
1188,5007855.21654532.512035
2199,2008560.01704031.815042
32010,5009262.51685033.118048
42112,0006758.01605530.99528
52215,0008870.31753534.021055
6.2 Tools

เครื่องมือที่ใช้ในการจัดการข้อมูลเชิงปริมาณ

บทนี้เน้น 2 เครื่องมือหลัก คือ Microsoft Excel สำหรับจัดการและวิเคราะห์เบื้องต้น และ SPSS สำหรับวิเคราะห์เชิงสถิติในงานวิจัย

Microsoft Excel

เหมาะสำหรับ Data Entry, Data Preparation, Basic Statistical Calculation, PivotTable และการสร้างกราฟพื้นฐานก่อนส่งต่อไปวิเคราะห์ขั้นสูง

SUM / AVERAGE / MEDIAN
FILTER / SORT
COUNT / COUNTIF
PivotTable
=AVERAGE(D2:D11) =MEDIAN(D2:D11) =STDEV.S(D2:D11) =COUNTIF(D2:D11, ">=80") =IF(D2>=80,"ผ่าน","ไม่ผ่าน")

ตัวอย่างสูตร Excel สำหรับวิเคราะห์คะแนนสอบนักศึกษา

SPSS

เหมาะสำหรับงานวิจัยที่ต้องการสถิติเชิงพรรณนาและการทดสอบสมมติฐาน เช่น t-test, ANOVA, Correlation, Regression และ Factor Analysis

Descriptive Statistics
t-test / ANOVA
Correlation
Regression
Analyze → Descriptive Statistics → Descriptives Analyze → Compare Means → Paired-Samples T Test Analyze → Compare Means → Independent-Samples T Test Analyze → Compare Means → One-Way ANOVA Analyze → Correlate → Bivariate Analyze → Regression → Linear

เส้นทางเมนูสำคัญใน SPSS สำหรับงานวิจัยเชิงปริมาณ

ตัวอย่างข้อมูลคะแนนสอบสำหรับฝึก Excel

กำหนดให้คอลัมน์คะแนนสอบอยู่ในช่วง D2:D11 เพื่อคำนวณค่าเฉลี่ย มัธยฐาน ส่วนเบี่ยงเบนมาตรฐาน และจัดกลุ่มผ่าน/ไม่ผ่าน

ลำดับรหัสเพศคะแนนสอบผลการสอบ
165001ชาย78ไม่ผ่าน
265002หญิง85ผ่าน
365003หญิง92ผ่าน
465004ชาย67ไม่ผ่าน
565005ชาย74ไม่ผ่าน
665006หญิง88ผ่าน
765007ชาย90ผ่าน
865008หญิง81ผ่าน
965009ชาย69ไม่ผ่าน
1065010หญิง95ผ่าน
PivotTable Workflow Rows เพศ Values Average คะแนน ผลลัพธ์ ชาย = 75.6 • หญิง = 88.2

ภาพที่ 6.4 ตัวอย่างแนวคิด PivotTable เพื่อเปรียบเทียบคะแนนเฉลี่ยจำแนกตามเพศ

6.3 Data Cleaning

การเตรียมและทำความสะอาดข้อมูล

Data Cleaning เป็นขั้นตอนสำคัญก่อนการวิเคราะห์ เพราะข้อมูลที่ผิดพลาดจะทำให้ผลการวิเคราะห์คลาดเคลื่อนและขาดความน่าเชื่อถือ

Missing Values

ข้อมูลสูญหาย เช่น ผู้ตอบแบบสอบถามไม่ตอบบางข้อ หรือไฟล์นำเข้าไม่สมบูรณ์

Filter / Frequencies

Duplicate Data

ข้อมูลซ้ำจากการกรอกหลายครั้ง ทำให้จำนวนตัวอย่างเกินจริง

Remove Duplicates

Outliers

ค่าผิดปกติ เช่น คะแนนเกิน 100 หรือรายได้สูงผิดปกติ

Boxplot

Inconsistent Format

รูปแบบข้อมูลไม่สอดคล้อง เช่น วันที่คนละรูปแบบ หรือเพศระบุ ช/ชาย/M

Recode
Data Cleaning Pipeline Raw Data Check Missing/Outlier Clean ผลลัพธ์: ข้อมูลถูกต้อง พร้อมวิเคราะห์ ลดความเสี่ยงการแปลผลผิดพลาด

ภาพที่ 6.5 กระบวนการทำความสะอาดข้อมูลก่อนวิเคราะห์

Checklist ก่อนเริ่มวิเคราะห์ข้อมูล

1. ตรวจชนิดข้อมูล
ตัวเลขควรเป็น Numeric ไม่ใช่ Text
2. ตรวจ Missing
ดูว่าค่าใดว่างหรือผิดปกติ
3. ตรวจค่าซ้ำ
ลบข้อมูลซ้ำที่ไม่ได้ตั้งใจ
4. ตรวจ Outliers
ใช้ Boxplot หรือ Conditional Formatting
5. ตั้งชื่อตัวแปร
ใช้ชื่อสั้น เข้าใจง่าย ไม่มีช่องว่าง
6. สำรองไฟล์
เก็บไฟล์ Raw Data แยกจากไฟล์ Clean Data
6.4 Data Analysis

การวิเคราะห์ข้อมูลเชิงปริมาณ

การวิเคราะห์ข้อมูลเชิงปริมาณแบ่งได้เป็น 2 กลุ่มใหญ่ คือ สถิติเชิงพรรณนาเพื่ออธิบายข้อมูล และสถิติเชิงอนุมานเพื่อทดสอบสมมติฐานหรือสรุปผลไปยังประชากร

6.4.1 สถิติเชิงพรรณนา (Descriptive Statistics)

ใช้เพื่ออธิบายลักษณะทั่วไปของข้อมูล เช่น ค่ากลางและการกระจาย ก่อนนำไปวิเคราะห์เชิงอนุมาน

Mean = ผลรวมข้อมูล ÷ จำนวนข้อมูล
ตัวอย่าง: (60+70+80+90)/4 = 75
Median = ค่ากึ่งกลางเมื่อเรียงข้อมูล
ถ้าจำนวนข้อมูลเป็นคู่ ใช้ค่าเฉลี่ยของสองค่ากลาง
Mode = ค่าที่พบมากที่สุด
ตัวอย่าง 70, 80, 80, 90 → Mode = 80

การกระจายของข้อมูล

ส่วนเบี่ยงเบนมาตรฐาน (Standard Deviation) ใช้อธิบายว่าข้อมูลกระจายออกจากค่าเฉลี่ยมากน้อยเพียงใด

SD ต่ำ: ข้อมูลเกาะกลุ่มใกล้ค่าเฉลี่ย เช่น คะแนนนักศึกษาคล้ายกัน
SD สูง: ข้อมูลกระจายมาก เช่น นักศึกษาบางคนได้คะแนนสูงมาก บางคนต่ำมาก
Excel: =AVERAGE(D2:D11) =MEDIAN(D2:D11) =MODE.SNGL(D2:D11) =STDEV.S(D2:D11) SPSS: Analyze → Descriptive Statistics → Descriptives Analyze → Descriptive Statistics → Frequencies

ตัวอย่างการเขียนผลการวิเคราะห์เชิงพรรณนา

จากการวิเคราะห์คะแนนสอบของนักศึกษาจำนวน 10 คน พบว่าคะแนนสอบมีค่าเฉลี่ยเท่ากับ 78.5 คะแนน ส่วนเบี่ยงเบนมาตรฐานเท่ากับ 10.2 คะแนน แสดงให้เห็นว่านักศึกษามีผลสัมฤทธิ์ทางการเรียนอยู่ในระดับปานกลางถึงดี และมีการกระจายของคะแนนในระดับปานกลาง

Decision Guide เป้าหมายการวิเคราะห์? เปรียบเทียบ t-test / ANOVA สัมพันธ์ Correlation พยากรณ์ Regression หลักจำเร็ว 2 ครั้งคนเดิม = Paired t-test 2 กลุ่มอิสระ = Independent t-test 3 กลุ่มขึ้นไป = One-way ANOVA

ภาพที่ 6.6 แนวทางเลือกสถิติเชิงอนุมานให้ตรงกับโจทย์วิจัย

6.4.2 สถิติเชิงอนุมาน (Inferential Statistics)

ใช้สรุปผลจากกลุ่มตัวอย่างไปยังประชากร โดยอาศัยการตั้งสมมติฐาน ระดับนัยสำคัญ และค่า p-value

เกณฑ์ตัดสินทั่วไป: ถ้า p-value หรือ Sig. < .05 → ปฏิเสธ H₀ แปลว่าผลมีนัยสำคัญทางสถิติ
เป้าหมายตัวแปรตามตัวแปรอิสระ/กลุ่มสถิติที่เหมาะสม
เปรียบเทียบ 2 ครั้ง คนเดิมเชิงปริมาณก่อน–หลังPaired t-test
เปรียบเทียบ 2 กลุ่มอิสระเชิงปริมาณชาย/หญิง หรือ ทดลอง/ควบคุมIndependent t-test
เปรียบเทียบ ≥ 3 กลุ่มเชิงปริมาณ3 ห้องเรียนขึ้นไปOne-way ANOVA
ดูผล 2 ปัจจัยเชิงปริมาณวิธีสอน + เพศTwo-way ANOVA
ดูความสัมพันธ์เชิงปริมาณเชิงปริมาณCorrelation
พยากรณ์เชิงปริมาณ1 ตัว/หลายตัวRegression
Paired t-test

คะแนนก่อน–หลังเรียน

ใช้เมื่อวัดคนเดิม 2 ครั้ง เช่น คะแนนก่อนเรียนและหลังเรียนหลังใช้สื่อออนไลน์

H0: μหลัง − μก่อน ≤ 0 H1: μหลัง − μก่อน > 0 SPSS: Analyze → Compare Means → Paired-Samples T Test
Independent t-test

เปรียบเทียบ 2 กลุ่มอิสระ

ใช้เปรียบเทียบค่าเฉลี่ยระหว่างกลุ่มที่ไม่ซ้ำกัน เช่น รายได้ชายและหญิง

H0: μชาย = μหญิง H1: μชาย ≠ μหญิง ดู Sig. (2-tailed) ใน SPSS
One-way ANOVA

เปรียบเทียบ 3 กลุ่มขึ้นไป

ใช้เปรียบเทียบคะแนนเฉลี่ยของนักศึกษา 3 ห้องเรียนขึ้นไป หากพบแตกต่างควรทำ Post Hoc

H0: μ1 = μ2 = μ3 H1: อย่างน้อย 1 กลุ่มแตกต่าง Post Hoc: Tukey HSD
Two-way ANOVA

วิเคราะห์หลายปัจจัย

ใช้ตรวจผลของ 2 ปัจจัย เช่น วิธีสอนและเพศ รวมถึงปฏิสัมพันธ์ร่วมกัน

Main effect A: วิธีสอน Main effect B: เพศ Interaction: วิธีสอน × เพศ
Correlation

หาความสัมพันธ์

ใช้วิเคราะห์ว่าตัวแปรเชิงปริมาณสองตัวสัมพันธ์กันหรือไม่ เช่น ชั่วโมงอ่านหนังสือกับคะแนนสอบ

r อยู่ระหว่าง -1 ถึง +1 r > 0 ความสัมพันธ์เชิงบวก r < 0 ความสัมพันธ์เชิงลบ
Regression

การพยากรณ์

ใช้พยากรณ์ตัวแปรตามจากตัวแปรอิสระ เช่น พยากรณ์ยอดขายจากงบโฆษณา

Simple Regression: X → Y Multiple Regression: X1+X2+X3 → Y ดูค่า R² และ p-value
6.5 Data Visualization

การแสดงผลข้อมูลด้วยกราฟ

กราฟที่เหมาะสมช่วยให้ผู้อ่านเข้าใจแนวโน้ม ความแตกต่าง การกระจาย และค่าผิดปกติของข้อมูลได้รวดเร็วขึ้น

Bar Chart

เหมาะสำหรับเปรียบเทียบข้อมูลระหว่างกลุ่ม เช่น คะแนนเฉลี่ยชาย/หญิง หรือยอดขายแต่ละสินค้า

Line Chart

เหมาะสำหรับแสดงแนวโน้มตามเวลา เช่น ยอดขายรายเดือน หรือจำนวนผู้ใช้บริการรายสัปดาห์

Histogram

เหมาะสำหรับดูการกระจายของข้อมูลต่อเนื่อง เช่น คะแนนสอบ รายได้ หรือส่วนสูง

Pie Chart

เหมาะสำหรับแสดงสัดส่วนของข้อมูล เช่น สัดส่วนค่าใช้จ่าย หรือสัดส่วนเพศในกลุ่มตัวอย่าง

Boxplot

เหมาะสำหรับดูค่ากลาง การกระจาย และ Outliers เช่น รายได้ที่ผิดปกติ

Scatter Plot

เหมาะสำหรับดูความสัมพันธ์ระหว่างตัวแปรเชิงปริมาณ 2 ตัว เช่น เวลาอ่านหนังสือกับคะแนนสอบ

Bar Chart Line Chart Histogram Scatter Plot

ภาพที่ 6.7 ตัวอย่างรูปแบบกราฟสำหรับข้อมูลเชิงปริมาณ

6.6 Quantitative Analysis Process

กระบวนการวิเคราะห์ข้อมูลเชิงปริมาณ

การวิเคราะห์ที่ดีควรเริ่มจากการเก็บข้อมูลที่ถูกต้อง ไปจนถึงการตีความผลและสรุปผลเชิงวิชาการ

1

เก็บรวบรวมข้อมูล

สร้างเครื่องมือ เก็บข้อมูล และตรวจสอบความครบถ้วนของชุดข้อมูล

2

ทำความสะอาดข้อมูล

จัดการ Missing, Duplicate, Outliers และรูปแบบข้อมูลให้ถูกต้อง

3

วิเคราะห์ข้อมูล

เลือกใช้สถิติที่เหมาะสมกับโจทย์วิจัยและชนิดข้อมูล

4

แสดงผลข้อมูล

นำเสนอด้วยตาราง กราฟ และแผนภูมิที่เหมาะสม

5

ตีความและสรุปผล

เขียนผลการวิเคราะห์ให้เชื่อมโยงกับคำถามวิจัยและสมมติฐาน

Lab Exercise

กิจกรรมปฏิบัติประจำบท

ฝึกปฏิบัติแบบครบวงจร ตั้งแต่จัดข้อมูลด้วย Excel วิเคราะห์ด้วย SPSS และนำเสนอผลด้วยกราฟ

Lab 1: Excel Descriptive Statistics

  • สร้างตารางคะแนนสอบ 10 คน
  • คำนวณ Mean, Median, SD
  • สร้าง Histogram

Lab 2: SPSS Paired t-test

  • ป้อนคะแนนก่อนเรียนและหลังเรียน
  • วิเคราะห์ค่าเฉลี่ยและ SD
  • ทดสอบว่าคะแนนหลังเรียนสูงขึ้นหรือไม่

Lab 3: Visualization Selection

  • เลือกกราฟให้เหมาะกับข้อมูล
  • อธิบายเหตุผลการเลือกกราฟ
  • สรุปข้อค้นพบจากกราฟ
Exercises

แบบฝึกหัดท้ายบทที่ 6

แบบฝึกหัดที่ 1: ความเข้าใจพื้นฐาน

  1. ข้อมูลอายุของนักศึกษาเป็นข้อมูลประเภทใด เพราะเหตุใด
  2. อธิบายความแตกต่างระหว่างข้อมูลไม่ต่อเนื่องและข้อมูลต่อเนื่อง พร้อมยกตัวอย่าง
  3. เพราะเหตุใดการทำ Data Cleaning จึงมีความสำคัญก่อนวิเคราะห์ข้อมูล

แบบฝึกหัดที่ 2: การใช้ Excel

  1. กำหนดข้อมูลคะแนนสอบของนักศึกษา 10 คน แล้วคำนวณค่าเฉลี่ย มัธยฐาน และส่วนเบี่ยงเบนมาตรฐาน
  2. สร้าง Histogram เพื่อแสดงการกระจายของคะแนน
  3. สร้างคอลัมน์ผลการสอบด้วย IF โดยกำหนดคะแนนผ่านตั้งแต่ 80 คะแนนขึ้นไป

แบบฝึกหัดที่ 3: การใช้ SPSS

  1. กำหนดข้อมูลคะแนนก่อนเรียนและหลังเรียนของนักศึกษา 20 คน
  2. วิเคราะห์ค่าเฉลี่ยและส่วนเบี่ยงเบนมาตรฐาน
  3. ทดสอบว่าคะแนนหลังเรียนสูงกว่าก่อนเรียนหรือไม่ด้วย Paired Samples t-test

แบบฝึกหัดที่ 4: การเลือก Visualization

  1. ยอดขายรายเดือนควรใช้กราฟใด เพราะเหตุใด
  2. สัดส่วนค่าใช้จ่ายควรใช้กราฟใด เพราะเหตุใด
  3. การกระจายของรายได้พนักงานควรใช้กราฟใด เพราะเหตุใด
ผลลัพธ์ที่คาดหวัง: ผู้เรียนสามารถเตรียมข้อมูลด้วย Excel วิเคราะห์ข้อมูลด้วย SPSS เลือกสถิติให้ตรงกับโจทย์วิจัย และนำเสนอผลการวิเคราะห์ด้วยกราฟที่เหมาะสม
Summary

สรุปบทที่ 6

ข้อมูลเชิงปริมาณเป็นรากฐานของการวิเคราะห์ข้อมูลและงานวิจัยเชิงสถิติ ผู้เรียนควรเข้าใจประเภทข้อมูล การเตรียมข้อมูล การเลือกสถิติที่เหมาะสม การใช้ Excel/SPSS และการนำเสนอผลด้วยกราฟ เพื่อให้ผลการวิจัยมีความถูกต้อง น่าเชื่อถือ และสื่อสารได้อย่างชัดเจน