یادگیری نظارتی (supervised learning) به زبانی دیگر – بخش اول

  • یوسف مهرداد

مقدمه:
یکی از سرگرمی‌های من پیدا کردن راه‌هایی است تا مفاهیم یادگیری ماشین را به زبان ساده‌تر توضیح بدهم. این نوشته نمونه‌ای از راه‌کارهایی است که موقع برگزاری کلاس اتفاقی پیدا کردم.

یادگیری نظارتی (Supervised Learning)
داستان
:
فرض کنید که معلمی با والدین یک شاگرد توافق می‌کند که به فرزندشان کمک کند تا نمره بهتری در درس ریاضی بگیرد. معلم با والدین روی نمره‌ی بالاتر از ۱۸ توافق می‌کند.
ابزاری که معلم دارد فقط ۱۰۰۰ نمونه سوال ریاضی از سال‌های گذشته است. معلم تصمیم می‌گیرد که ۲۰۰ سوال را از بین ۱۰۰۰ سوال جدا کند و از آنها به عنوان آزمون نهایی استفاده کند. اگر شاگرد بتواند پس از پاسخ به این ۲۰۰ سوال به نمره‌ای بالاتر از ۱۸ برسد، تعهد او با والدین انجام شده، وگرنه خیر.

حالا معلم ۸۰۰ سوال در اختیار دارد و باید به شکلی مطمئن شود که شاگرد نمره‌ی بالای ۱۸ از ۲۰۰ سوال آزمون آزمایشی خواهد گرفت. او این ۸۰۰ سوال را نیز به دو بخش ۶۴۰ و ۱۶۰ تایی تقسیم می‌کند. از ۶۴۰ سوال اول برای آموزش به شاگرد استفاده می‌کند و از ۱۶۰ سوال باقی‌مانده هم برای آن که مطمئن شود شاگرد حل ۶۴۰ سوال را به خوبی یاد گرفته است و آماده‌ی آموزن نهایی است.

سوال بعدی معلم این خواهد بود که چند بار کل ۶۴۰ سوال را با شاگردش حل کند و در هر جلسه‌ی چند تا سوال را حل کند. مثلا می‌تواند ۳ بار کل سوالات را حل کند (۳ * ۶۴۰ سوال) و در هر جلسه هم ۶۴ تا سوال (در مجموع ۳ * ۱۰ جلسه).

حالا اگر پس از برگزاری جلسات آموزشی، به کمک ۱۶۰ سوال باقی مانده از شاگرد آزمون (آزمون دست‌گرمی) بگیریم و نمره شاگرد ۱۶ شد چه اتفاقی می‌افتد؟ اگر نمره شاگرد ۱۹ شد چه خواهد شد؟
فرض کنیم که شاگرد به خوبی آزمون دست‌گرمی را پشت سر گذاشت و معلم خیالش راحت شد. حالا نوبت برگزاری آزمون نهایی است. اگر شاگرد پس از حل ۲۰۰ سوال نهایی، نمره‌اش ۱۷ شد چه خواهد شد؟ اگر ۱۸.۵ شد چه خواهد شد؟
در چه صورت خیال والدین راحت خواهد بود که فرزندشان می‌تواند در آزمون مدرسه نمره بالای ۱۸ را به دست بیاورد؟

نکات مهم داستان:
– معلم
– ۱۰۰۰ سوال
– ۲۰۰ سوال برای آزمون نهایی (۲۰ درصد کل سوالات)
– ۸۰۰ سوال
– ۱۶۰ سوال
– ۶۴۰ سوال
– نمره به دست آمده از آزمون دست‌گرمی (ارزیابی)
– تفاوت نمره آزمون ارزیابی با نمره تعهدشده
– نمره به دست آمده از آزمون نهایی
– تفاوت نمره آزمون نهایی با نمره تعهدشده

مفاهیم یادگیری ماشین:
– معلم: معلم کسی است که جواب‌ها را می‌داند. در نتیجه این روش یادگیری، یادگیری تحت نظارت یا تحت سرپرستی معلم است.
-نمره ۱۸: مقدار سنجه (metric) قابل قبول
– ۱۰۰۰ سوال: مجموع داده‌ها یا dataset
– ۲۰۰ سوال برای آزمون نهایی (۲۰ درصد کل سوالات): داده‌های آزمون یا test data
– ۸۰۰ سوال: داده‌های آموزشی یا train data
– ۱۶۰ سوال: داده‌های ارزیابی یا validation data
– ۶۴۰ سوال: داده‌های آموزشی train data
– نمره به دست آمده از آزمون دست‌گرمی (ارزیابی): مقدار سنجه (متریک) حاصل از داده‌های ارزیابی (validation metrics)
– تفاوت نمره آزمون ارزیابی با نمره تعهدشده: انحراف مقدار سنجه در مرحله‌ی ارزیابی با مقدار سنجه‌ی قابل قبول
– نمره به دست آمده از آزمون نهایی: مقدار سنجه‌ی‌ حاصل از داده‌های آزمایشی (test metrics)
– تفاوت نمره آزمون نهایی با نمره تعهدشده: انحراف سنجه حاصل از داده‌های آزمایشی با سنجه قابل قبول

نکته پایانی:
برگردان مفاهیم یادگیری ماشین به فارسی چه کار دشواری شد!

گزیده:
مردم نگرانند که کامپیوترها بیش از اندازه باهوش شوند که دنیا را قبضه کنند. اما مساله‌ی واقعی این است که آنها خیلی احمق‌اند ولی با این حال، همین الان هم دنیا را قبضه کرده‌اند. پدرو دومینگوس

https://bibalan.com/?p=3111
یوسف مهرداد

یوسف مهرداد


کانال تلگرام

نظرات (2)

wave
  • فرزاد کاظمی بالانی

    ۶ تیر ۱۴۰۰ در ۰۸:۳۲

    مفاهیم خیلی جالب بود. مرسی جناب دکتر

    پاسخ
    • یوسف مهرداد

      ۷ تیر ۱۴۰۰ در ۰۹:۵۵

      سلام فرزاد جان عزیزم
      محبت دارید. خوشحالم که برای شما جالب بود.

      پاسخ

دیدگاهتان را بنویسید

نشانی ایمیل شما منتشر نخواهد شد. بخش‌های موردنیاز علامت‌گذاری شده‌اند *

برای خروج از جستجو کلید ESC را بفشارید