รายวิชาที่ครอบคลุม CRISP-DM, Data Understanding, Data Preparation, Association Rules, Classification, Model Evaluation, Deployment และจริยธรรมข้อมูล พร้อมฝึกปฏิบัติด้วย Python/Notebook
ศึกษาหลักการและขั้นตอนของกระบวนการเหมืองข้อมูล โดยเน้นการคิดแบบเป็นระบบตามแนวทาง CRISP-DM ตั้งแต่การทำความเข้าใจปัญหาและข้อมูล การเตรียมข้อมูล การสร้างแบบจำลอง การประเมินผล ไปจนถึงการนำผลลัพธ์ไปใช้จริงอย่างมีจริยธรรม
สำรวจข้อมูล สถิติเชิงพรรณนา และ EDA
Cleaning, Missing Values, Outlier และ Feature Engineering
Association, Classification, Evaluation และ Deployment
ความเป็นส่วนตัว อคติของข้อมูล และการใช้งานอย่างรับผิดชอบ
ผู้ช่วยศาสตราจารย์ ดร. นัฐพงศ์ ส่งเนียม
xnattapong@gmail.comเน้นทักษะที่นำไปใช้กับงานวิจัย งานธุรกิจ และโครงงานจริงได้ทันที
แปลงโจทย์ธุรกิจ/วิจัยให้เป็นกระบวนการวิเคราะห์ข้อมูลอย่างเป็นระบบ
จัดการ Missing, Outlier, Encoding และ Feature Engineering อย่างมีเหตุผล
เลือกเทคนิคเหมาะสม พร้อมประเมินด้วย Metric ที่ตรงโจทย์
อธิบายผลลัพธ์เป็นภาพ ตาราง และข้อเสนอแนะที่ตัดสินใจได้
ค้นหาและกรองบทเรียนเพื่อเข้าถึงเอกสารได้เร็วขึ้น
ครอบคลุมพื้นฐาน CRISP-DM, Data Understanding, Data Preparation, Association และ Classification เบื้องต้น
ทำโครงงานเหมืองข้อมูลครบกระบวนการ พร้อมรายงาน Notebook/Code และการนำเสนอผลลัพธ์
ครอบคลุมโมเดลขั้นสูง การประเมินผล การนำไปใช้จริง และประเด็นจริยธรรมข้อมูล
หมายเหตุ: คะแนนกิจกรรม/แบบฝึกหัดในชั้นเรียนสามารถปรับตามบริบทการสอนจริง
เลือกโดเมน/ชุดข้อมูลจริง แล้วดำเนินงานตาม CRISP-DM ตั้งแต่กำหนดปัญหา เตรียมข้อมูล สร้างโมเดลอย่างน้อย 2 วิธี เปรียบเทียบผล และสรุป Insight สำหรับการตัดสินใจ
ระบุโจทย์ โดเมน และวัตถุประสงค์การวิเคราะห์
จัดการข้อมูลให้พร้อมสำหรับ Modeling
สร้างโมเดลอย่างน้อย 2 วิธี และประเมินอย่างถูกต้อง
นำเสนอผลลัพธ์ ข้อค้นพบ และข้อเสนอแนะ
ตัวอย่างหัวข้อที่นักศึกษาสามารถเลือกไปต่อยอดเป็นโครงงานกลุ่ม โดยกำหนดปัญหา ชุดข้อมูล เทคนิคเหมืองข้อมูล และผลลัพธ์ที่นำไปใช้ตัดสินใจได้จริง
เพิ่มข้อมูลในตัวแปร projectExamples ด้านล่างของไฟล์ โดยคัดลอก object เดิมแล้วแก้ชื่ออาชีพ หัวข้อ เทคนิค Dataset และผลลัพธ์ที่คาดหวัง ระบบจะแสดง Card ให้อัตโนมัติ
| หัวข้อประเมิน | ยอดเยี่ยม | ดี | พอใช้ | สัดส่วน |
|---|---|---|---|---|
| โดเมน/ข้อมูล ปัญหา แหล่งข้อมูล และข้อจำกัด | ชัดเจน ข้อมูลเหมาะสม มีข้อจำกัดครบ | ใช้ได้ ระบุข้อจำกัดบางส่วน | ไม่ชัดหรือข้อมูลไม่เหมาะ | 10% |
| Data Preparation Cleaning, Missing, Outlier, Feature Engineering | ครบถ้วน มีเหตุผล ทำซ้ำได้ | ครอบคลุมหลัก ๆ | พื้นฐาน ขาดเหตุผล | 20% |
| Modeling อย่างน้อย 2 วิธี พร้อมเหตุผล | เลือกวิธีเหมาะ ปรับแต่งดี อธิบายได้ | มี ≥2 วิธี และอธิบายพอใช้ | วิธีจำกัดหรือเหตุผลไม่ชัด | 20% |
| Evaluation | ประเมินดี วิเคราะห์ลึก | ประเมินครบพื้นฐาน | Metric ไม่เหมาะหรือวิเคราะห์น้อย | 20% |
| Insight & Visualization | Insight ชัด วิชวลดี ตัดสินใจได้ | Insight ใช้ได้ | Insight เบาบาง | 15% |
| Documentation & Code | เอกสารครบ โค้ดสะอาด รันซ้ำได้ | ครบพอควร | ขาดส่วนสำคัญ | 15% |
| รวม | 100% | |||
Python, pandas, scikit-learn, mlxtend และตัวอย่างการวิเคราะห์
ตัวอย่างเช่น Titanic, Iris, Retail Basket และ Customer Segmentation
เริ่มจากบทที่ 1 แล้วต่อยอดสู่โครงงานที่ใช้ข้อมูลจริงเพื่อสร้าง Insight ที่นำไปใช้ได้