5.1 บทนำ: กฎความสัมพันธ์คืออะไร?
กฎความสัมพันธ์ (Association Rules) เป็นเทคนิคหนึ่งในงานเหมืองข้อมูลที่ใช้ค้นหารูปแบบความสัมพันธ์ที่ซ่อนอยู่ระหว่างรายการข้อมูลภายในชุดข้อมูลขนาดใหญ่ โดยเฉพาะข้อมูลที่มีลักษณะเป็นธุรกรรม เช่น ใบเสร็จการซื้อสินค้า ประวัติการใช้บริการ พฤติกรรมผู้ใช้เว็บไซต์ หรือเหตุการณ์ที่เกิดร่วมกัน
แนวคิดหลักของบทนี้คือการค้นหาว่า “รายการใดมักเกิดขึ้นร่วมกับรายการใด” และความสัมพันธ์นั้นเกิดขึ้นบ่อย น่าเชื่อถือ และน่าสนใจเพียงใด ตัวอย่างที่นิยมที่สุดคือ Market Basket Analysis หรือการวิเคราะห์ตะกร้าสินค้า เพื่อดูว่าสินค้าใดมักถูกซื้อพร้อมกัน
รูปแบบของกฎความสัมพันธ์
อ่านว่า “ถ้ามี A เกิดขึ้น มักจะมี B เกิดขึ้นตามมาหรือเกิดร่วมกัน” เช่น {ขนมปัง} → {นม} หมายถึง ลูกค้าที่ซื้อขนมปังมีแนวโน้มที่จะซื้อนมร่วมด้วย
| ส่วนประกอบ | ความหมาย | ตัวอย่าง |
|---|---|---|
| Antecedent | เงื่อนไขหรือรายการด้านซ้ายของกฎ | {ขนมปัง} |
| Consequent | ผลลัพธ์หรือรายการด้านขวาของกฎ | {นม} |
| Association Rule | กฎที่อธิบายความสัมพันธ์ระหว่างรายการ | {ขนมปัง} → {นม} |
กฎความสัมพันธ์ไม่ได้หมายความว่า A เป็นสาเหตุทำให้ B เกิดขึ้นเสมอ แต่หมายถึง A และ B มีแนวโน้มเกิดร่วมกัน ดังนั้นควรใช้คำว่า “มีแนวโน้ม”, “มักเกิดร่วมกัน” หรือ “มีความสัมพันธ์ในการเกิดร่วมกัน” มากกว่าการสรุปว่า “เป็นสาเหตุของกันและกัน”
ความสำคัญของกฎความสัมพันธ์
ค้นหารูปแบบที่ซ่อนอยู่
ช่วยค้นพบความสัมพันธ์ที่ไม่เห็นได้ชัดจากการดูข้อมูลทั่วไป เช่น ลูกค้าที่ซื้อโทรศัพท์มือถือมักซื้อเคสและฟิล์มกันรอย
สนับสนุนการตัดสินใจ
ใช้ประกอบการจัดโปรโมชัน การแนะนำสินค้า การวางสินค้า และการวางแผนสต็อก
เพิ่มยอดขายและลดต้นทุน
ช่วยจัดชุดสินค้า แนะนำสินค้าเสริม และเตรียมสินค้าที่มักขายร่วมกันให้เพียงพอ
เข้าใจพฤติกรรมลูกค้า
ช่วยให้ธุรกิจรู้ว่าลูกค้าสนใจสินค้า บริการ หรือคอนเทนต์ใดร่วมกัน
5.2 พื้นฐานของกฎความสัมพันธ์
ก่อนวิเคราะห์กฎความสัมพันธ์ ผู้เรียนควรเข้าใจคำศัพท์พื้นฐาน ได้แก่ Transaction Data, Item, Itemset, Association Rule, Antecedent และ Consequent เพราะเป็นองค์ประกอบหลักที่ใช้สร้างกฎและตีความผลลัพธ์
5.2.1 Transaction Data
Transaction Data คือข้อมูลที่บันทึกรายการต่าง ๆ ที่เกิดขึ้นในแต่ละธุรกรรม โดยหนึ่งธุรกรรมอาจประกอบด้วยหลายรายการ เช่น ใบเสร็จหนึ่งใบมีสินค้าหลายรายการ
| Transaction ID | รายการสินค้า |
|---|---|
| T001 | ขนมปัง, นม, ไข่ |
| T002 | ขนมปัง, นม |
| T003 | นม, กาแฟ |
| T004 | ขนมปัง, ไข่, น้ำผลไม้ |
| T005 | กาแฟ, น้ำผลไม้ |
5.2.2 Item และ Itemset
Item คือรายการข้อมูลเดี่ยว เช่น ขนมปัง นม ไข่ หรือพฤติกรรมหนึ่งอย่างของผู้ใช้ ส่วน Itemset คือกลุ่มของ Item ตั้งแต่หนึ่งรายการขึ้นไปที่ปรากฏอยู่ร่วมกันในธุรกรรมเดียวกัน
| ประเภท | ตัวอย่าง |
|---|---|
| 1-itemset | {ขนมปัง}, {นม}, {ไข่} |
| 2-itemset | {ขนมปัง, นม}, {ขนมปัง, ไข่}, {นม, ไข่} |
| 3-itemset | {ขนมปัง, นม, ไข่} |
5.2.3 Antecedent และ Consequent
ในกฎ A → B รายการด้านซ้ายหรือ A เรียกว่า Antecedent เป็นเงื่อนไขเริ่มต้นของกฎ ส่วนรายการด้านขวาหรือ B เรียกว่า Consequent เป็นผลลัพธ์ที่มีแนวโน้มเกิดร่วมกับ A
ตัวอย่าง: {โทรศัพท์มือถือ} → {เคสโทรศัพท์}
- Antecedent คือ {โทรศัพท์มือถือ}
- Consequent คือ {เคสโทรศัพท์}
- ความหมายคือ ลูกค้าที่ซื้อโทรศัพท์มือถือมีแนวโน้มที่จะซื้อเคสโทรศัพท์ร่วมด้วย
5.3 ตัววัดสำคัญของกฎความสัมพันธ์
การค้นพบกฎจำนวนมากไม่ได้หมายความว่าทุกกฎจะมีประโยชน์ ผู้วิเคราะห์จึงต้องใช้ตัววัดเพื่อประเมินว่ากฎใดเกิดขึ้นบ่อย น่าเชื่อถือ และน่าสนใจเพียงพอ ได้แก่ Support, Minimum Support, Confidence, Minimum Confidence และ Lift
5.3.1 Support
Support ใช้วัดว่า Itemset หนึ่ง ๆ ปรากฏอยู่ในธุรกรรมทั้งหมดบ่อยเพียงใด ตอบคำถามว่า “รายการนี้เกิดขึ้นบ่อยแค่ไหนในข้อมูลทั้งหมด”
ตัวอย่าง หากมีธุรกรรม 5 รายการ และ {ขนมปัง, นม} ปรากฏร่วมกัน 2 รายการ
5.3.2 Minimum Support
Minimum Support คือค่าขั้นต่ำที่ผู้วิเคราะห์กำหนดเพื่อคัดเลือก Itemset ที่เกิดขึ้นบ่อยพอจะนำไปวิเคราะห์ต่อ หาก Itemset มีค่า Support มากกว่าหรือเท่ากับ Minimum Support จะถือว่าเป็น Frequent Itemset
| การกำหนดค่า | ผลที่เกิดขึ้น |
|---|---|
| Minimum Support สูง | ได้ Itemset น้อยลง แต่เป็นรายการที่เกิดขึ้นบ่อยมาก |
| Minimum Support ต่ำ | ได้ Itemset มากขึ้น แต่อาจมีรายการที่เกิดขึ้นน้อยและไม่สำคัญปะปน |
| ต่ำเกินไป | อาจได้กฎจำนวนมากเกินไปและตีความยาก |
| สูงเกินไป | อาจพลาดความสัมพันธ์ที่น่าสนใจแต่เกิดไม่บ่อย |
5.3.3 Confidence
Confidence ใช้วัดความน่าจะเป็นที่ Consequent จะเกิดขึ้นเมื่อ Antecedent เกิดขึ้นแล้ว ตอบคำถามว่า “ถ้าเกิด A แล้ว B มีโอกาสเกิดตามมากี่เปอร์เซ็นต์”
ตัวอย่าง หาก Support({ขนมปัง, นม}) = 0.40 และ Support({ขนมปัง}) = 0.60
แปลว่า ในบรรดาลูกค้าที่ซื้อขนมปัง มีประมาณ 66.7% ที่ซื้อนมร่วมด้วย
5.3.4 Minimum Confidence
Minimum Confidence คือค่าขั้นต่ำที่ใช้คัดเลือกกฎที่มีความน่าเชื่อถือเพียงพอ เช่น หากกำหนด Minimum Confidence = 70% กฎที่มี Confidence ต่ำกว่า 70% จะไม่ผ่านเกณฑ์
5.3.5 Lift
Lift ใช้วัดว่าการเกิด Antecedent เพิ่มโอกาสการเกิด Consequent มากกว่าปกติหรือไม่ ช่วยแก้ข้อจำกัดของ Confidence เพราะบางครั้ง Consequent เป็นรายการที่เกิดบ่อยอยู่แล้ว ทำให้ Confidence สูงโดยไม่จำเป็นต้องมีความสัมพันธ์พิเศษ
| ค่า Lift | การตีความ |
|---|---|
| Lift > 1 | A และ B มีความสัมพันธ์เชิงบวก เกิดร่วมกันมากกว่าปกติ |
| Lift = 1 | A และ B เป็นอิสระต่อกันหรือไม่มีความสัมพันธ์เด่นชัด |
| Lift < 1 | A อาจลดโอกาสการเกิด B หรือเกิดร่วมกันน้อยกว่าปกติ |
ข้อควรระวังในการตีความ
Confidence สูงไม่ได้หมายความว่ากฎนั้นดีที่สุดเสมอ ควรพิจารณาร่วมกับ Support และ Lift รวมถึงความหมายทางธุรกิจ เช่น สินค้าบางรายการขายดีมากอยู่แล้ว กฎที่มีสินค้านั้นเป็น Consequent อาจมี Confidence สูงโดยธรรมชาติ
5.4 ขั้นตอนการค้นหากฎความสัมพันธ์
กระบวนการค้นหากฎความสัมพันธ์โดยทั่วไปประกอบด้วย 6 ขั้นตอน ตั้งแต่การเตรียมข้อมูลไปจนถึงการประเมินและปรับค่าเกณฑ์ให้เหมาะสม
เตรียมข้อมูล
จัดข้อมูลให้อยู่ในรูปแบบ Transaction Data หรือ One-hot Encoding ตรวจสอบค่าว่าง ข้อมูลซ้ำ และรายการผิดปกติ
ค้นหา Frequent Itemsets
หา Itemset ที่มีค่า Support ผ่านเกณฑ์ Minimum Support
สร้าง Association Rules
สร้างกฎ A → B จาก Frequent Itemsets โดย A และ B ต้องไม่ซ้ำกัน
คัดเลือกกฎที่น่าสนใจ
ใช้ Support, Confidence และ Lift เพื่อเลือกกฎที่มีคุณภาพ
จัดลำดับกฎ
เรียงตาม Confidence, Support, Lift หรือเป้าหมายทางธุรกิจ
ประเมินและปรับค่าเกณฑ์
ปรับ Minimum Support และ Minimum Confidence หากกฎมากหรือน้อยเกินไป
ตัวอย่างการเลือกค่าเกณฑ์เบื้องต้น
| ลักษณะข้อมูล | Minimum Support ที่แนะนำ | Minimum Confidence ที่แนะนำ |
|---|---|---|
| ข้อมูลขนาดเล็ก | 0.20 – 0.40 | 0.60 – 0.80 |
| ข้อมูลขนาดกลาง | 0.05 – 0.20 | 0.50 – 0.80 |
| ข้อมูลขนาดใหญ่ | 0.01 – 0.10 | 0.50 – 0.80 |
| สินค้ามีจำนวนมาก | ใช้ Support ต่ำลง | ใช้ Confidence ร่วมกับ Lift |
5.5 อัลกอริทึมสำหรับกฎความสัมพันธ์
การค้นหากฎความสัมพันธ์จำเป็นต้องใช้อัลกอริทึมเพื่อค้นหา Frequent Itemsets จากข้อมูลธุรกรรม อัลกอริทึมที่นิยม ได้แก่ Apriori, FP-Growth และ Eclat โดยในระดับพื้นฐานควรเริ่มจาก Apriori เพราะเข้าใจง่ายและเห็นขั้นตอนชัดเจน
5.5.1 แนวคิดของ Apriori Algorithm
Apriori Algorithm อาศัยหลักการที่เรียกว่า Apriori Property คือ หาก Itemset ใดเป็น Frequent Itemset แล้ว Subset ของ Itemset นั้นต้องเป็น Frequent Itemset ด้วย และหาก Itemset ใดไม่ผ่าน Minimum Support ก็ไม่จำเป็นต้องพิจารณา Itemset ที่ใหญ่กว่าซึ่งมี Itemset นั้นเป็นส่วนประกอบ
ตัวอย่าง: ถ้า {ขนมปัง, กาแฟ} ไม่ผ่าน Minimum Support ก็ไม่จำเป็นต้องพิจารณา {ขนมปัง, กาแฟ, นม} หรือ {ขนมปัง, กาแฟ, ไข่} เพราะมี {ขนมปัง, กาแฟ} เป็นส่วนย่อย
5.5.2 ขั้นตอนของ Apriori
กำหนด Minimum Support
เช่น 40% หมายถึง Itemset ต้องปรากฏอย่างน้อย 40% ของธุรกรรมทั้งหมด
สร้าง Candidate 1-itemset
นับจำนวน Item เดี่ยว เช่น {ขนมปัง}, {นม}, {ไข่}
คัดเลือก Frequent 1-itemset
เลือกเฉพาะ Item ที่ Support ผ่านเกณฑ์
สร้าง Candidate 2-itemset
นำ Frequent 1-itemset มาจับคู่ เช่น {ขนมปัง, นม}
ทำซ้ำกับ k-itemset
ขยายขนาด Itemset จนไม่พบ Frequent Itemset ใหม่
สร้าง Association Rules
นำ Frequent Itemsets มาสร้างกฎและคำนวณ Confidence/Lift
5.5.3 ตัวอย่างคำนวณ Apriori แบบง่าย
กำหนดข้อมูล 5 ธุรกรรม และ Minimum Support = 40% ดังนั้น Itemset ต้องปรากฏอย่างน้อย 2 ครั้งจึงจะผ่านเกณฑ์
| Itemset | จำนวนครั้งที่พบ | Support | ผล |
|---|---|---|---|
| {ขนมปัง} | 3 | 60% | ผ่าน |
| {นม} | 3 | 60% | ผ่าน |
| {ไข่} | 2 | 40% | ผ่าน |
| {กาแฟ} | 2 | 40% | ผ่าน |
| {น้ำผลไม้} | 1 | 20% | ไม่ผ่าน |
เมื่อนำ Frequent 1-itemset มาจับคู่ จะได้ Frequent 2-itemset เช่น {ขนมปัง, นม} และ {ขนมปัง, ไข่} จากนั้นสามารถสร้างกฎได้ เช่น
{นม} → {ขนมปัง}
{ขนมปัง} → {ไข่}
{ไข่} → {ขนมปัง}
ข้อดีและข้อจำกัดของ Apriori
ข้อดี
- เข้าใจง่าย เหมาะกับการสอนพื้นฐาน
- อธิบายแนวคิด Support และ Frequent Itemset ได้ชัดเจน
- มีไลบรารี Python รองรับ เช่น mlxtend
ข้อจำกัด
- สร้าง Candidate Itemsets จำนวนมาก
- ต้องสแกนฐานข้อมูลหลายรอบ
- ใช้เวลามากเมื่อข้อมูลมีขนาดใหญ่
5.6 การวิเคราะห์กฎความสัมพันธ์ด้วย Python
การวิเคราะห์กฎความสัมพันธ์ด้วย Python นิยมใช้ไลบรารี mlxtend โดยใช้ TransactionEncoder เพื่อแปลงข้อมูลธุรกรรมเป็น One-hot Encoding ใช้ apriori() เพื่อหา Frequent Itemsets และใช้ association_rules() เพื่อสร้างกฎความสัมพันธ์
ติดตั้งไลบรารีที่จำเป็น
pip install pandas mlxtend
ตัวอย่างโค้ดวิเคราะห์ Association Rules ด้วย mlxtend
import pandas as pd
from mlxtend.preprocessing import TransactionEncoder
from mlxtend.frequent_patterns import apriori, association_rules
transactions = [
['Milk', 'Bread', 'Eggs'],
['Bread', 'Eggs'],
['Milk', 'Bread', 'Cookies'],
['Milk', 'Eggs'],
['Bread', 'Cookies']
]
te = TransactionEncoder()
te_array = te.fit(transactions).transform(transactions)
df = pd.DataFrame(te_array, columns=te.columns_)
frequent_itemsets = apriori(df, min_support=0.2, use_colnames=True)
rules = association_rules(frequent_itemsets, metric="confidence", min_threshold=0.7)
print("Frequent Itemsets")
print(frequent_itemsets)
print("\nAssociation Rules")
print(rules[['antecedents', 'consequents', 'support', 'confidence', 'lift']])
การแปลผลตาราง Rules
| คอลัมน์ | ความหมาย |
|---|---|
antecedents | รายการด้านซ้ายของกฎ หรือเงื่อนไขเริ่มต้น |
consequents | รายการด้านขวาของกฎ หรือผลลัพธ์ที่คาดว่าจะเกิดร่วมกัน |
support | สัดส่วนธุรกรรมทั้งหมดที่มี Antecedent และ Consequent ร่วมกัน |
confidence | โอกาสที่ Consequent เกิด เมื่อ Antecedent เกิด |
lift | ระดับความสัมพันธ์เชิงบวกเมื่อเทียบกับการเกิดแบบปกติ |
ตัวอย่างโจทย์ด้านสุขภาพ
นอกจากข้อมูลสินค้า Association Rules ยังประยุกต์กับข้อมูลสุขภาพได้ เช่น วิเคราะห์ความสัมพันธ์ระหว่างความดันสูง ไขมันสูง การสูบบุหรี่ และโรคหัวใจ
import pandas as pd
from mlxtend.frequent_patterns import apriori, association_rules
data = pd.DataFrame({
'ความดันสูง': [True, True, True, False, True],
'ไขมันสูง': [True, True, False, True, True],
'สูบบุหรี่': [False, True, True, True, False],
'โรคหัวใจ': [True, True, False, True, True]
})
frequent_itemsets = apriori(data, min_support=0.4, use_colnames=True)
rules = association_rules(frequent_itemsets, metric='confidence', min_threshold=0.7)
rule_target = rules[
(rules['antecedents'] == frozenset({'ความดันสูง', 'ไขมันสูง'})) &
(rules['consequents'] == frozenset({'โรคหัวใจ'}))
]
print(rule_target[['antecedents', 'consequents', 'support', 'confidence', 'lift']])
5.7 การประยุกต์ใช้กฎความสัมพันธ์
กฎความสัมพันธ์สามารถใช้ได้มากกว่าร้านค้าปลีก เพราะแกนหลักคือการค้นหาความสัมพันธ์ของเหตุการณ์หรือรายการที่เกิดร่วมกัน ดังนั้นจึงนำไปประยุกต์ได้ในธุรกิจ การแพทย์ การศึกษา การตลาด เว็บไซต์ และระบบแนะนำสินค้า
Market Basket Analysis
ค้นหาว่าสินค้าใดมักถูกซื้อร่วมกัน เช่น ขนมปังกับนม กาแฟกับน้ำตาล
Promotion
จัดโปรโมชันซื้อคู่ ส่วนลดสินค้าเสริม หรือ Bundle Set
Recommendation
แนะนำสินค้า บทเรียน หรือคอนเทนต์ที่ผู้ใช้มีแนวโน้มสนใจ
Inventory Planning
เตรียมสต็อกสินค้าที่มักขายร่วมกันให้เพียงพอ
การศึกษา
วิเคราะห์พฤติกรรมผู้เรียน เช่น ดูวิดีโอแล้วทำแบบทดสอบ
การแพทย์
ศึกษาความสัมพันธ์ระหว่างอาการ ปัจจัยเสี่ยง และโรค
5.8 กรณีศึกษา
กรณีศึกษา 1: ร้านขายโทรศัพท์มือถือ
ร้านโทรศัพท์มือถือสามารถใช้ Association Rules เพื่อวิเคราะห์ว่าลูกค้าที่ซื้อโทรศัพท์มือถือมักซื้ออะไรเพิ่มเติม เช่น เคส ฟิล์มกันรอย หรือประกันเครื่อง
กฎตัวอย่าง: {โทรศัพท์มือถือ} → {ฟิล์มกันรอย}
- Support = 35% หมายถึง 35% ของธุรกรรมทั้งหมดซื้อโทรศัพท์และฟิล์มกันรอยร่วมกัน
- Confidence = 80% หมายถึง ลูกค้าที่ซื้อโทรศัพท์มือถือ 80% ซื้อฟิล์มกันรอยร่วมด้วย
- Lift = 1.5 หมายถึง การซื้อโทรศัพท์เพิ่มโอกาสซื้อฟิล์มกันรอยมากกว่าปกติ 1.5 เท่า
กรณีศึกษา 2: Walmart / Target
ธุรกิจค้าปลีกรายใหญ่สามารถใช้กฎความสัมพันธ์เพื่อวิเคราะห์พฤติกรรมการซื้อสินค้า ปรับปรุงประสบการณ์ลูกค้า เพิ่มยอดขาย และลดต้นทุน เช่น แนะนำสินค้าที่เกี่ยวข้อง จัดโปรโมชันสินค้าร่วมกัน หรือวางสินค้าให้อยู่ในตำแหน่งที่เหมาะสม
กรณีศึกษา 3: เว็บไซต์และ E-commerce
เว็บไซต์สามารถใช้กฎความสัมพันธ์เพื่อวิเคราะห์เส้นทางการใช้งาน เช่น ผู้ใช้ที่เข้าหน้าสินค้าอาจเพิ่มสินค้าลงตะกร้า หรือผู้เรียนที่เปิดวิดีโอบทเรียนหนึ่งมีแนวโน้มทำแบบทดสอบต่อ จากนั้นระบบสามารถนำผลลัพธ์ไปใช้แนะนำเนื้อหาหรือออกแบบ UX ให้ดีขึ้น
5.9 แบบฝึกปฏิบัติท้ายบท
ให้ผู้เรียนฝึกวิเคราะห์กฎความสัมพันธ์จากข้อมูลธุรกรรมตัวอย่าง โดยทำตามขั้นตอนต่อไปนี้
สร้างชุดข้อมูลตัวอย่าง
กำหนดรายการธุรกรรมอย่างน้อย 10 รายการ เช่น ขนมปัง นม ไข่ กาแฟ น้ำผลไม้
แปลงข้อมูลด้วย TransactionEncoder
แปลง Transaction List เป็น One-hot Encoding
หา Frequent Itemsets
ทดลองปรับค่า Minimum Support เช่น 0.2, 0.3, 0.4 แล้วเปรียบเทียบผลลัพธ์
สร้าง Association Rules
ใช้ metric="confidence" และ min_threshold หลายระดับ เช่น 0.5, 0.7, 0.8
แปลผล Support, Confidence, Lift
เลือกกฎที่น่าสนใจ 3 กฎ และอธิบายว่านำไปใช้เชิงธุรกิจได้อย่างไร
คำถามทบทวน
- Association Rules แตกต่างจาก Classification อย่างไร?
- ทำไม Confidence สูงอย่างเดียวจึงอาจไม่เพียงพอในการเลือกกฎ?
- ค่า Lift มากกว่า 1 มีความหมายอย่างไร?
- ถ้ากำหนด Minimum Support ต่ำเกินไป จะเกิดผลอย่างไร?
- จงยกตัวอย่างการใช้ Association Rules ในการศึกษา การแพทย์ หรือเว็บไซต์
5.10 สรุปบทเรียน
กฎความสัมพันธ์เป็นเทคนิคสำคัญในงานเหมืองข้อมูลที่ใช้ค้นหารูปแบบการเกิดร่วมกันของรายการข้อมูล โดยเฉพาะข้อมูลธุรกรรม เช่น ใบเสร็จการซื้อสินค้า ข้อมูลการใช้บริการ หรือพฤติกรรมผู้ใช้ในระบบออนไลน์
สรุปแนวคิดสำคัญ
- กฎความสัมพันธ์เขียนในรูปแบบ A → B โดย A คือ Antecedent และ B คือ Consequent
- Support ใช้วัดความถี่ของการเกิดร่วมกันในข้อมูลทั้งหมด
- Confidence ใช้วัดโอกาสที่ B เกิดเมื่อ A เกิด
- Lift ใช้วัดว่าความสัมพันธ์นั้นเด่นกว่าการเกิดแบบปกติหรือไม่
- Apriori Algorithm ใช้ค้นหา Frequent Itemsets จากขนาดเล็กไปใหญ่
- Python สามารถใช้
mlxtendเพื่อวิเคราะห์ Frequent Itemsets และ Association Rules ได้สะดวก
ข้อควรจำ
Association Rules ไม่ใช่การพิสูจน์เหตุและผล แต่เป็นการค้นหาความสัมพันธ์หรือแนวโน้มการเกิดร่วมกัน ผู้วิเคราะห์ควรใช้ผลลัพธ์ร่วมกับความรู้ด้านธุรกิจ บริบทข้อมูล และการตรวจสอบคุณภาพของกฎก่อนนำไปใช้จริง