รายละเอียดคอร์ส


สอนโดย Data Scientist จากบริษัทชั้นนำ มอบความรู้และเทคนิคในการวิเคราะห์ข้อมูลและทำโมเดลที่ตอบโจทย์ในแง่ของ Marketing

ทำไมต้องเรียนคอร์สนี้
1. ได้อัพสกิลทางด้าน Data Science
2. ได้เห็นการวิเคราะห์ข้อมูลและทำโมเดลที่ตอบโจทย์ในแง่ของ Marketing ไม่ได้แค่เรียกใช้ Library
3. มีโอกาสนำไปใช้จริงในภาคธุรกิจที่หลากหลาย เช่น Retail Ecommerce Telecommunication Bank เป็นต้น

สิ่งที่จะได้รับจากคอร์สนี้
- ความรู้และเทคนิคในการวิเคราะห์ข้อมูลและทำโมเดลที่ตอบโจทย์ในแง่ของ Marketing
- Free dataset และ โค้ดที่สามารถนำไปต่อยอดได้
- คู่มือการเริ่มใช้งาน Google Colab

คอร์สนี้เหมาะกับใคร
คนที่สนใจสายงานหรืออยากอัพสกิลทางด้าน Data Science เช่น นักเรียน นักศึกษา นักการตลาด Data Scientist Data Analyst Software Engineer เป็นต้น

ระดับของคอร์สเรียน พื้นฐานที่จำเป็นสำหรับคอร์สนี้
ระดับ: ง่าย / ปานกลาง / ยาก
1. ควรมีพื้นฐานการเขียนโปรแกรมภาษา Python เช่น รู้จักชนิดของตัวแปร เงื่อนไข การทำงานซ้ำ การเขียนและเรียกใช้ Function เป็นต้น
2. ควรรู้จักและเคยใช้ Library พื้นฐานที่สำคัญสำหรับการวิเคราะห์ข้อมูล เช่น pandas numpy matplotlib sklearn (optional)

โปรแกรมที่ต้องใช้
Google Colab (สามารถ Download ได้ฟรีทั้งหมด)

เนื้อหาทั้งหมดของคอร์สนี้
Chapter 1: Business Understanding
- ทำความเข้าใจปัญหาในทางธุรกิจก่อนเริ่มวิเคราะห์ข้อมูล
- โจทย์ปัญหาในคอร์สเรียน
- รู้จักกับ Conversion Rate
- การติดตั้งและเริ่มต้นใช้งาน Google Colab (สำหรับคนที่ใช้งานเป็นอยู่แล้ว สามารถข้ามหัวข้อนี้ไปได้เลย)

Chapter 2: Recap Basic Machine Learning
- ทบทวน Python library สำหรับสายงานทางด้าน Data Science
- Machine Learning มีกี่ประเภท แต่ละประเภทมีอะไรบ้าง
- อธิบายว่าโจทย์ในคอร์สนี้จัดเป็นปัญหาที่ต้องใช้ Machine Learning ประเภทไหน

Chapter 3: Data Understanding
- สถิติพื้นฐานที่จำเป็นต้องรู้
- รู้จักกับ Exploratory Data Analysis หรือ EDA
- ตัวอย่างการทำ EDA สำหรับไปคุยกับทีม Business
- Workshop in Google Colab

Chapter 4: Data Preprocessing
- ภาพรวมการเตรยีมข้อมูล (Data Preparation)
- การทำความสะอาดข้อมูล (Data Cleaning)
- การสร้างตัวแปร (Feature Engineering)
- การเลือกตัวแปร (Feature Selection)
- การเตรียมข้อมูลสำหรับโมเดล Logistic Regression ด้วยเทคนิค Weight of Evidence (WOE) และ Information Value (IV)
- Workshop in Google Colab

Chapter 5: Build Machine Learning Model Using Logistic Regression
- การแบ่งข้อมูลสำหรับการฝึกสอน Machine Learning
- รู้จักกับ Logistic Regression ว่าคืออะไร มี Assumption อะไรบ้างที่ต้องคำนึงถึง รวมถึงคณิตศาสตร์เบื้องหลัง
- รู้จักกับ Variance Inflation Factor (VIF)
- ทดลองสร้างโมเดล Logistic Regression ด้วย Statsmodels และดูผลลัพธ์ที่ออกมาจากโมเดล
- Workshop in Google Colab

Chapter 6: Model Evaluation & Interpretation
- อธิบายเมทริกซ์สำหรับวัดผลปัญหาประเภท Classification
- รู้จักกับ AUC of ROC
- รู้จักกับ Gain Table และ Kolmogorov Smirnov (KS)
- ตีความผลลัพธ์ที่ได้จากโมเดลจาก ตัวแปรที่ใช้ ค่า IV ค่า VIF ค่า p-value และ ค่าความสำคัญของตัวแปร (Feature Importance)
- ปรับจูนโมเดล Logistic Regression ให้เหมาะสม
- สร้างโมเดลครั้งสุดท้าย และ Save Model ที่ฝึกสอนเสร็จไว้ใช้งานต่อในอนาคต
- Workshop in Google Colab

Chapter 7: Model Impact & Business Suggestion
- ทำความเข้าใจ Probability ที่ออกมาจากโมเดล Logistic Regression
- รู้จักกับ Cut-off
- เลือก Cut-off ให้ตอบโจทย์ทางธุจกิจ
- Workshop in Google Colab

Chapter 8: Conclusion & Other Practical Techniques
- สรุปเนื้อหาที่สอน
- แนะนำเพิ่มเติมจากประสบการณ์ทำงานจริง เช่น SQL หรือ Machine Learning ประเภทอื่นๆ
- แบบทดสอบท้ายบทเรียน 14 ข้อ

*** เนื้อหาในคอร์สนี้ไม่ได้ครอบคลุมเรื่อง ***
1. การดึงข้อมูลตรงออกจาก Database ด้วย SQL
2. การนำโมเดลที่ฝึกสอนเสร็จไปใช้งานจริงบน Production
3. การทำ Model Performance Monitoring
4. การทำ A/B Testing
5. การฝึกสอนด้วย Advanced Machine Learning เช่น Random Forest หรือ Gradient Boosting 

เนื้อหาของคอร์ส

ผู้สอน


พรพระ ชำนาญวนิชกุล
ไปที่หน้าผู้สอน
  • Meta Certified Digital Marketing Associate
  • Certified NVIDIA Jetson AI Specialist
  • Data Scientist ที่ บริษัท ปตท. น้ำมันและการค้าปลีก จำกัด (มหาชน) (PTTOR)
  • ผู้สอนและให้ความรู้ด้าน Data Science และ Machine Learning
  • อดีต Senior Data Scientist ที่บริษัท Ascend Group
  • อดีต Data Scientist ที่บริษัท Ascend Group
  • อดีต Data Science Instructor ที่ True Digital Academy
  • อดีต ผู้ช่วยนักวิจัยทางด้าน Data Science ให้กับ Smart Grid Research Unit (SGRU) ภาควิชาวิศวกรรมไฟฟ้า จุฬาลงกรณ์มหาวิทยาลัย
  • ผ่านเข้ารอบชิงชนะเลิศโครงการ National Software Contest (NSC) 2020 ในหัวข้อ “อัลกอริทึมประหยัดพลังงานสำหรับเครื่องปรับอากาศด้วยเทคนิคการผสมผสานการเรียนรู้แบบมีผู้สอน (Supervised Learning) และการเรียนรู้แบบเสริมกำลัง (Reinforcement Learning) สำหรับการจัดการพลังงานในรูปแบบอาคาร”
  • ปริญญาโท วิศวกรรมไฟฟ้า จุฬาลงกรณ์มหาวิทยาลัย
  • ปริญญาตรี วิศวกรรมไฟฟ้า (เกียรตินิยมอันดับสอง) มหาวิทยาลัยมหิดล
  • Marketing-Analytics-for-Business-with-Machine-Learning
    คอร์สออนไลน์