รายละเอียดคอร์ส
สอนโดย Data Scientist จากบริษัทชั้นนำ มอบความรู้และเทคนิคในการวิเคราะห์ข้อมูลและทำโมเดลที่ตอบโจทย์ในแง่ของ Marketing
ทำไมต้องเรียนคอร์สนี้
1. ได้อัพสกิลทางด้าน Data Science
2. ได้เห็นการวิเคราะห์ข้อมูลและทำโมเดลที่ตอบโจทย์ในแง่ของ Marketing ไม่ได้แค่เรียกใช้ Library
3. มีโอกาสนำไปใช้จริงในภาคธุรกิจที่หลากหลาย เช่น Retail Ecommerce Telecommunication Bank เป็นต้น
สิ่งที่จะได้รับจากคอร์สนี้
- ความรู้และเทคนิคในการวิเคราะห์ข้อมูลและทำโมเดลที่ตอบโจทย์ในแง่ของ Marketing
- Free dataset และ โค้ดที่สามารถนำไปต่อยอดได้
- คู่มือการเริ่มใช้งาน Google Colab
คอร์สนี้เหมาะกับใคร
คนที่สนใจสายงานหรืออยากอัพสกิลทางด้าน Data Science เช่น นักเรียน นักศึกษา นักการตลาด Data Scientist Data Analyst Software Engineer เป็นต้น
ระดับของคอร์สเรียน พื้นฐานที่จำเป็นสำหรับคอร์สนี้
ระดับ: ง่าย / ปานกลาง / ยาก
1. ควรมีพื้นฐานการเขียนโปรแกรมภาษา Python เช่น รู้จักชนิดของตัวแปร เงื่อนไข การทำงานซ้ำ การเขียนและเรียกใช้ Function เป็นต้น
2. ควรรู้จักและเคยใช้ Library พื้นฐานที่สำคัญสำหรับการวิเคราะห์ข้อมูล เช่น pandas numpy matplotlib sklearn (optional)
โปรแกรมที่ต้องใช้
Google Colab (สามารถ Download ได้ฟรีทั้งหมด)
เนื้อหาทั้งหมดของคอร์สนี้
Chapter 1: Business Understanding
- ทำความเข้าใจปัญหาในทางธุรกิจก่อนเริ่มวิเคราะห์ข้อมูล
- โจทย์ปัญหาในคอร์สเรียน
- รู้จักกับ Conversion Rate
- การติดตั้งและเริ่มต้นใช้งาน Google Colab (สำหรับคนที่ใช้งานเป็นอยู่แล้ว สามารถข้ามหัวข้อนี้ไปได้เลย)
Chapter 2: Recap Basic Machine Learning
- ทบทวน Python library สำหรับสายงานทางด้าน Data Science
- Machine Learning มีกี่ประเภท แต่ละประเภทมีอะไรบ้าง
- อธิบายว่าโจทย์ในคอร์สนี้จัดเป็นปัญหาที่ต้องใช้ Machine Learning ประเภทไหน
Chapter 3: Data Understanding
- สถิติพื้นฐานที่จำเป็นต้องรู้
- รู้จักกับ Exploratory Data Analysis หรือ EDA
- ตัวอย่างการทำ EDA สำหรับไปคุยกับทีม Business
- Workshop in Google Colab
Chapter 4: Data Preprocessing
- ภาพรวมการเตรยีมข้อมูล (Data Preparation)
- การทำความสะอาดข้อมูล (Data Cleaning)
- การสร้างตัวแปร (Feature Engineering)
- การเลือกตัวแปร (Feature Selection)
- การเตรียมข้อมูลสำหรับโมเดล Logistic Regression ด้วยเทคนิค Weight of Evidence (WOE) และ Information Value (IV)
- Workshop in Google Colab
Chapter 5: Build Machine Learning Model Using Logistic Regression
- การแบ่งข้อมูลสำหรับการฝึกสอน Machine Learning
- รู้จักกับ Logistic Regression ว่าคืออะไร มี Assumption อะไรบ้างที่ต้องคำนึงถึง รวมถึงคณิตศาสตร์เบื้องหลัง
- รู้จักกับ Variance Inflation Factor (VIF)
- ทดลองสร้างโมเดล Logistic Regression ด้วย Statsmodels และดูผลลัพธ์ที่ออกมาจากโมเดล
- Workshop in Google Colab
Chapter 6: Model Evaluation & Interpretation
- อธิบายเมทริกซ์สำหรับวัดผลปัญหาประเภท Classification
- รู้จักกับ AUC of ROC
- รู้จักกับ Gain Table และ Kolmogorov Smirnov (KS)
- ตีความผลลัพธ์ที่ได้จากโมเดลจาก ตัวแปรที่ใช้ ค่า IV ค่า VIF ค่า p-value และ ค่าความสำคัญของตัวแปร (Feature Importance)
- ปรับจูนโมเดล Logistic Regression ให้เหมาะสม
- สร้างโมเดลครั้งสุดท้าย และ Save Model ที่ฝึกสอนเสร็จไว้ใช้งานต่อในอนาคต
- Workshop in Google Colab
Chapter 7: Model Impact & Business Suggestion
- ทำความเข้าใจ Probability ที่ออกมาจากโมเดล Logistic Regression
- รู้จักกับ Cut-off
- เลือก Cut-off ให้ตอบโจทย์ทางธุจกิจ
- Workshop in Google Colab
Chapter 8: Conclusion & Other Practical Techniques
- สรุปเนื้อหาที่สอน
- แนะนำเพิ่มเติมจากประสบการณ์ทำงานจริง เช่น SQL หรือ Machine Learning ประเภทอื่นๆ
- แบบทดสอบท้ายบทเรียน 14 ข้อ
*** เนื้อหาในคอร์สนี้ไม่ได้ครอบคลุมเรื่อง ***
1. การดึงข้อมูลตรงออกจาก Database ด้วย SQL
2. การนำโมเดลที่ฝึกสอนเสร็จไปใช้งานจริงบน Production
3. การทำ Model Performance Monitoring
4. การทำ A/B Testing
5. การฝึกสอนด้วย Advanced Machine Learning เช่น Random Forest หรือ Gradient Boosting