วิชาเหมืองข้อมูล (Data Mining)

Course Overview

คำอธิบายรายวิชา

ศึกษาหลักการและขั้นตอนของกระบวนการเหมืองข้อมูล โดยเน้นการคิดแบบเป็นระบบตามแนวทาง CRISP-DM ตั้งแต่การทำความเข้าใจปัญหาและข้อมูล การเตรียมข้อมูล การสร้างแบบจำลอง การประเมินผล ไปจนถึงการนำผลลัพธ์ไปใช้จริงอย่างมีจริยธรรม

Data Understanding

สำรวจข้อมูล สถิติเชิงพรรณนา และ EDA

Data Preparation

Cleaning, Missing Values, Outlier และ Feature Engineering

Modeling

Association, Classification, Evaluation และ Deployment

Responsible Data

ความเป็นส่วนตัว อคติของข้อมูล และการใช้งานอย่างรับผิดชอบ

ข้อมูลรายวิชา

รูปแบบบรรยาย + ปฏิบัติ

เครื่องมือPython / Notebook

สื่อPDF + Code + Dataset

ผู้สอน

ผู้ช่วยศาสตราจารย์ ดร. นัฐพงศ์ ส่งเนียม

xnattapong@gmail.com

Learning Outcomes

เมื่อเรียนจบ ผู้เรียนควรทำอะไรได้

เน้นทักษะที่นำไปใช้กับงานวิจัย งานธุรกิจ และโครงงานจริงได้ทันที

วางแผน CRISP-DM

แปลงโจทย์ธุรกิจ/วิจัยให้เป็นกระบวนการวิเคราะห์ข้อมูลอย่างเป็นระบบ

เตรียมข้อมูลได้

จัดการ Missing, Outlier, Encoding และ Feature Engineering อย่างมีเหตุผล

สร้างและเทียบโมเดล

เลือกเทคนิคเหมาะสม พร้อมประเมินด้วย Metric ที่ตรงโจทย์

สื่อสาร Insight

อธิบายผลลัพธ์เป็นภาพ ตาราง และข้อเสนอแนะที่ตัดสินใจได้

Lessons

แผนบทเรียน 9 บท

ค้นหาและกรองบทเรียนเพื่อเข้าถึงเอกสารได้เร็วขึ้น

16-Week Plan

ตารางสอน 16 สัปดาห์

Assessment

การประเมินผล

สอบกลางภาค

ทฤษฎี + ปฏิบัติ

20%

ครอบคลุมพื้นฐาน CRISP-DM, Data Understanding, Data Preparation, Association และ Classification เบื้องต้น

โครงงานรายวิชา

Project-Based

30%

ทำโครงงานเหมืองข้อมูลครบกระบวนการ พร้อมรายงาน Notebook/Code และการนำเสนอผลลัพธ์

สอบปลายภาค

วิเคราะห์ + ประยุกต์

30%

ครอบคลุมโมเดลขั้นสูง การประเมินผล การนำไปใช้จริง และประเด็นจริยธรรมข้อมูล

หมายเหตุ: คะแนนกิจกรรม/แบบฝึกหัดในชั้นเรียนสามารถปรับตามบริบทการสอนจริง

Course Project

โครงงานรายวิชาเหมืองข้อมูล

เลือกโดเมน/ชุดข้อมูลจริง แล้วดำเนินงานตาม CRISP-DM ตั้งแต่กำหนดปัญหา เตรียมข้อมูล สร้างโมเดลอย่างน้อย 2 วิธี เปรียบเทียบผล และสรุป Insight สำหรับการตัดสินใจ

รายละเอียดโครงงาน เทมเพลตรายงาน

1) Define Problem

ระบุโจทย์ โดเมน และวัตถุประสงค์การวิเคราะห์

2) Prepare Data

จัดการข้อมูลให้พร้อมสำหรับ Modeling

3) Build & Compare Models

สร้างโมเดลอย่างน้อย 2 วิธี และประเมินอย่างถูกต้อง

4) Present Insight

นำเสนอผลลัพธ์ ข้อค้นพบ และข้อเสนอแนะ

Project Ideas by Career

ตัวอย่างโครงงานรายวิชาเหมืองข้อมูล แยกตามอาชีพ

ตัวอย่างหัวข้อที่นักศึกษาสามารถเลือกไปต่อยอดเป็นโครงงานกลุ่ม โดยกำหนดปัญหา ชุดข้อมูล เทคนิคเหมืองข้อมูล และผลลัพธ์ที่นำไปใช้ตัดสินใจได้จริง

Classification Association Rule Clustering

ต้องการเพิ่มตัวอย่างโครงงานใหม่ภายหลัง?

เพิ่มข้อมูลในตัวแปร projectExamples ด้านล่างของไฟล์ โดยคัดลอก object เดิมแล้วแก้ชื่ออาชีพ หัวข้อ เทคนิค Dataset และผลลัพธ์ที่คาดหวัง ระบบจะแสดง Card ให้อัตโนมัติ

Expandable by JavaScript Array

Rubric

รูบริกการให้คะแนนโครงงาน

หัวข้อประเมิน	ยอดเยี่ยม	ดี	พอใช้	สัดส่วน
โดเมน/ข้อมูล ปัญหา แหล่งข้อมูล และข้อจำกัด	ชัดเจน ข้อมูลเหมาะสม มีข้อจำกัดครบ	ใช้ได้ ระบุข้อจำกัดบางส่วน	ไม่ชัดหรือข้อมูลไม่เหมาะ	10%
Data Preparation Cleaning, Missing, Outlier, Feature Engineering	ครบถ้วน มีเหตุผล ทำซ้ำได้	ครอบคลุมหลัก ๆ	พื้นฐาน ขาดเหตุผล	20%
Modeling อย่างน้อย 2 วิธี พร้อมเหตุผล	เลือกวิธีเหมาะ ปรับแต่งดี อธิบายได้	มี ≥2 วิธี และอธิบายพอใช้	วิธีจำกัดหรือเหตุผลไม่ชัด	20%
Evaluation	ประเมินดี วิเคราะห์ลึก	ประเมินครบพื้นฐาน	Metric ไม่เหมาะหรือวิเคราะห์น้อย	20%
Insight & Visualization	Insight ชัด วิชวลดี ตัดสินใจได้	Insight ใช้ได้	Insight เบาบาง	15%
Documentation & Code	เอกสารครบ โค้ดสะอาด รันซ้ำได้	ครบพอควร	ขาดส่วนสำคัญ	15%
รวม				100%

Resources

เอกสารและสื่อประกอบ

PDF / สไลด์

รวมเอกสารบทที่ 1–8 และสื่อที่จะอัปเดตเพิ่มเติม

ดูรายการบทเรียน

Notebook / Code

Python, pandas, scikit-learn, mlxtend และตัวอย่างการวิเคราะห์

Dataset

ตัวอย่างเช่น Titanic, Iris, Retail Basket และ Customer Segmentation

พร้อมเริ่มเรียน Data Mining แล้วหรือยัง?

เริ่มจากบทที่ 1 แล้วต่อยอดสู่โครงงานที่ใช้ข้อมูลจริงเพื่อสร้าง Insight ที่นำไปใช้ได้

ไปยังบทเรียน

เรียนรู้ Data Mining จากข้อมูลดิบ สู่ Insight และโมเดลที่ใช้งานได้จริง

CRISP-DM Dashboard