รายวิชาเหมืองข้อมูล • Data Mining

เรียนรู้ Data Mining จากข้อมูลดิบ สู่ Insight และโมเดลที่ใช้งานได้จริง

รายวิชาที่ครอบคลุม CRISP-DM, Data Understanding, Data Preparation, Association Rules, Classification, Model Evaluation, Deployment และจริยธรรมข้อมูล พร้อมฝึกปฏิบัติด้วย Python/Notebook

9บทเรียนหลัก
16สัปดาห์
30%โครงงาน
PythonLab/Notebook
Data Mining Workflow
CRISP-DM Dashboard
Business → Data → Model → Insight
ModelingClassification / Clustering
AssociationSupport • Confidence • Lift
EthicsPrivacy & Bias Awareness
Course Overview

คำอธิบายรายวิชา

ศึกษาหลักการและขั้นตอนของกระบวนการเหมืองข้อมูล โดยเน้นการคิดแบบเป็นระบบตามแนวทาง CRISP-DM ตั้งแต่การทำความเข้าใจปัญหาและข้อมูล การเตรียมข้อมูล การสร้างแบบจำลอง การประเมินผล ไปจนถึงการนำผลลัพธ์ไปใช้จริงอย่างมีจริยธรรม

Data Understanding

สำรวจข้อมูล สถิติเชิงพรรณนา และ EDA

Data Preparation

Cleaning, Missing Values, Outlier และ Feature Engineering

Modeling

Association, Classification, Evaluation และ Deployment

Responsible Data

ความเป็นส่วนตัว อคติของข้อมูล และการใช้งานอย่างรับผิดชอบ

ข้อมูลรายวิชา
รูปแบบบรรยาย + ปฏิบัติ
เครื่องมือPython / Notebook
สื่อPDF + Code + Dataset

ผู้สอน

ผู้ช่วยศาสตราจารย์ ดร. นัฐพงศ์ ส่งเนียม

xnattapong@gmail.com
Learning Outcomes

เมื่อเรียนจบ ผู้เรียนควรทำอะไรได้

เน้นทักษะที่นำไปใช้กับงานวิจัย งานธุรกิจ และโครงงานจริงได้ทันที

วางแผน CRISP-DM

แปลงโจทย์ธุรกิจ/วิจัยให้เป็นกระบวนการวิเคราะห์ข้อมูลอย่างเป็นระบบ

เตรียมข้อมูลได้

จัดการ Missing, Outlier, Encoding และ Feature Engineering อย่างมีเหตุผล

สร้างและเทียบโมเดล

เลือกเทคนิคเหมาะสม พร้อมประเมินด้วย Metric ที่ตรงโจทย์

สื่อสาร Insight

อธิบายผลลัพธ์เป็นภาพ ตาราง และข้อเสนอแนะที่ตัดสินใจได้

Lessons

แผนบทเรียน 9 บท

ค้นหาและกรองบทเรียนเพื่อเข้าถึงเอกสารได้เร็วขึ้น

ไม่พบบทเรียนที่ตรงกับคำค้นหา
16-Week Plan

ตารางสอน 16 สัปดาห์

Assessment

การประเมินผล

สอบกลางภาค
ทฤษฎี + ปฏิบัติ
20%

ครอบคลุมพื้นฐาน CRISP-DM, Data Understanding, Data Preparation, Association และ Classification เบื้องต้น

โครงงานรายวิชา
Project-Based
30%

ทำโครงงานเหมืองข้อมูลครบกระบวนการ พร้อมรายงาน Notebook/Code และการนำเสนอผลลัพธ์

สอบปลายภาค
วิเคราะห์ + ประยุกต์
30%

ครอบคลุมโมเดลขั้นสูง การประเมินผล การนำไปใช้จริง และประเด็นจริยธรรมข้อมูล

หมายเหตุ: คะแนนกิจกรรม/แบบฝึกหัดในชั้นเรียนสามารถปรับตามบริบทการสอนจริง

Course Project

โครงงานรายวิชาเหมืองข้อมูล

เลือกโดเมน/ชุดข้อมูลจริง แล้วดำเนินงานตาม CRISP-DM ตั้งแต่กำหนดปัญหา เตรียมข้อมูล สร้างโมเดลอย่างน้อย 2 วิธี เปรียบเทียบผล และสรุป Insight สำหรับการตัดสินใจ

1) Define Problem

ระบุโจทย์ โดเมน และวัตถุประสงค์การวิเคราะห์

2) Prepare Data

จัดการข้อมูลให้พร้อมสำหรับ Modeling

3) Build & Compare Models

สร้างโมเดลอย่างน้อย 2 วิธี และประเมินอย่างถูกต้อง

4) Present Insight

นำเสนอผลลัพธ์ ข้อค้นพบ และข้อเสนอแนะ

Project Ideas by Career

ตัวอย่างโครงงานรายวิชาเหมืองข้อมูล แยกตามอาชีพ

ตัวอย่างหัวข้อที่นักศึกษาสามารถเลือกไปต่อยอดเป็นโครงงานกลุ่ม โดยกำหนดปัญหา ชุดข้อมูล เทคนิคเหมืองข้อมูล และผลลัพธ์ที่นำไปใช้ตัดสินใจได้จริง

Classification Association Rule Clustering
ไม่พบตัวอย่างโครงงานที่ตรงกับคำค้นหา ลองค้นด้วยคำว่า ร้านค้า, ลูกค้า, สุขภาพ, เกษตร, Association หรือ Classification
ต้องการเพิ่มตัวอย่างโครงงานใหม่ภายหลัง?

เพิ่มข้อมูลในตัวแปร projectExamples ด้านล่างของไฟล์ โดยคัดลอก object เดิมแล้วแก้ชื่ออาชีพ หัวข้อ เทคนิค Dataset และผลลัพธ์ที่คาดหวัง ระบบจะแสดง Card ให้อัตโนมัติ

Expandable by JavaScript Array
Rubric

รูบริกการให้คะแนนโครงงาน

หัวข้อประเมินยอดเยี่ยมดีพอใช้สัดส่วน
โดเมน/ข้อมูล
ปัญหา แหล่งข้อมูล และข้อจำกัด
ชัดเจน ข้อมูลเหมาะสม มีข้อจำกัดครบใช้ได้ ระบุข้อจำกัดบางส่วนไม่ชัดหรือข้อมูลไม่เหมาะ10%
Data Preparation
Cleaning, Missing, Outlier, Feature Engineering
ครบถ้วน มีเหตุผล ทำซ้ำได้ครอบคลุมหลัก ๆพื้นฐาน ขาดเหตุผล20%
Modeling
อย่างน้อย 2 วิธี พร้อมเหตุผล
เลือกวิธีเหมาะ ปรับแต่งดี อธิบายได้มี ≥2 วิธี และอธิบายพอใช้วิธีจำกัดหรือเหตุผลไม่ชัด20%
Evaluationประเมินดี วิเคราะห์ลึกประเมินครบพื้นฐานMetric ไม่เหมาะหรือวิเคราะห์น้อย20%
Insight & VisualizationInsight ชัด วิชวลดี ตัดสินใจได้Insight ใช้ได้Insight เบาบาง15%
Documentation & Codeเอกสารครบ โค้ดสะอาด รันซ้ำได้ครบพอควรขาดส่วนสำคัญ15%
รวม100%
Resources

เอกสารและสื่อประกอบ

PDF / สไลด์

รวมเอกสารบทที่ 1–8 และสื่อที่จะอัปเดตเพิ่มเติม

ดูรายการบทเรียน
Notebook / Code

Python, pandas, scikit-learn, mlxtend และตัวอย่างการวิเคราะห์

Dataset

ตัวอย่างเช่น Titanic, Iris, Retail Basket และ Customer Segmentation

พร้อมเริ่มเรียน Data Mining แล้วหรือยัง?

เริ่มจากบทที่ 1 แล้วต่อยอดสู่โครงงานที่ใช้ข้อมูลจริงเพื่อสร้าง Insight ที่นำไปใช้ได้