۲) سه مؤلفه یادگیری ماشین
۱-۲) دادهها (Data)
در نوشته قبل (اینجا) مطالعه نمایید.
۲-۲) ویژگیها (Features)
ویژگیها با نام پارامترها(parameters) یا متغیرها (variables) نیز شناخته می شوند. کارکرد خودرو، جنسیت کاربر، قیمت سهام، تعداد تکرار کلمه در یک متن نمونههایی از ویژگیها هستند. به عبارت دیگر، ویژگیها عاملهاییاند که ماشین برای پیدا کردن الگوها آنها را بررسی میکند.
وقتی دادهها در جدول ذخیره شده باشند، پیدا کردن ویژگیها ساده است، هر ویژگی معادل یکی از ستونهای جدول است. اما اگر ۱۰۰ گیگابایت تصویر از گربهها داشته باشید چه چیزهایی را به عنوان ویژگی انتخاب میکنید؟ بیشک نمیتوان هر پیکسل از تصویر را یک ویژگی در نظر بگیریم. به همین دلیل است که انتخاب ویژگیهای درست معمولاً بیشتر از سایر بخشهای یادگیری ماشین طول میکشد. و همین انتخاب ویژگیها نیز یکی از دلایل اصلی بروز خطاها و اشتباهات در کارهای یادگیری ماشین است. انسانها معمولا بر اساس تفکر و تحلیل خود عمل میکنند.آنها فقط ویژگیهایی راانتخاب میکنند که به آنها علاقه دارند یا فکر میکنند “مهم تر” از بقیهاند. لطفا در انتخاب ویژگیها تمایلات و احساسات انسانی را کنار بگذارید.
۳-۲) الگوریتمها (Algorithms)
الگوریتمها بدیهیترین بخش یادگیری ماشین هستند. هر مسالهی یادگیری ماشین را میتوان با روشهای متفاوتی حل کرد. روش انتخابی شما بر دقت، کارایی و اندازهی مدل نهایی تأثیرگذار خواهد بود. به این نکته مهم دقت کنید: اگر دادهها نادرست باشند بهترین الگوریتمها هم کمکی به حل مساله نخواهد کرد. به این نکتهی مهم گاهی به اختصار «ورودی آشغال-خروجی آشغال» (garbage in – garbage out) گفته میشود. بنابراین بیش از حد دنبال به دقت مدل (accuracy)که به صورت درصد بیان میشود توجه نکنید، تلاش کنید در ابتدای کار، دادههای بیشتری آماده کنید.
مترجم: خانم سپیده مشایخی
گزیده:
با وجود تمام پیشرفتهای انجامشده به نظر میرسد که تقریباً همه پرسشهای مهم در هوش مصنوعی بیپاسخ ماندهاند. حتی بسیاری از پرسشها هنوز به درستی مطرح نشدهاند. فرانسوا شوله
دیدگاهتان را بنویسید