از هفته پیش که ترم جاری دانشگاه رسما به پایان رسید، کمی فرصت پیدا کردم به کارهایی که دوست داشتم بپردازم. آموختن علم داده و یادگیری ماشین که خود یک سفر بی‌پایان است کمک می‌کند تا به مساله‌های جدیدی فکر کنم و راهکارهایی هم در ذهنم برای آنها آماده کنم.

یکی از این طیف مساله‌ها، کاربرد یادگیری ماشین در ادبیات فارسی است. عزیزانی که با یادگیری ماشین آشنایی دارند بی‌شک می‌دانند که چقدر مساله‌های جالب می‌توان  از کاربرد یادگیری ماشین در این حوزه تعریف کرد که به شناخت و گسترش آن کمک کند.

هفته پیش تصمیم گرفتم یکی کارهایی را که دوست داشتم  شروع کنم و بخشی از مرخصی بین ترم را به آن اختصاص دهم. این کار، تحقیقی بود روی اشعار مولانا. داده‌ها را از سایت گنجور دانلود کردم و شروع کردم به کار روی دیوان شمس. فهمیدن ساختار پایگاه داده یک کم زمان برد ولی به دلیل طراحی ساده و قشنگ آن، خیلی زود متوجه شدم که ابیات را چگونه پیدا کنم. نتایج‌ اولیه‌اش برای خودم خیلی جالب بود.

یکی از مساله‌های مهمی که با آن برخورد کردم، نبود کتابخانه‌ها و مدل‌های آموزش‌دیده (trained model) برای زبان فارسی بود. امیدوارم که روز به روز به تعداد این کتابخانه‌ها و مدل‌ها افزوده شود. با خود فکر می‌کردم چقدر کارهایی جالب بین رشته‌ای می‌توان در حوزه‌ی ادبیات فارسی و علوم داده تعریف کرد.

نومید نیم گرچه ز من ببریدی
یا بر سر من یار دگر بگزیدی
تا جان دارم غم تو خواهم خوردن
بسیار امیدهاست در نومیدی

تا یادم نرفته عرض کنم که سایت گنجور از سایت‌های مورد علاقه‌ی من است. قدردان زحمات بنیانگذار و همه‌ی دست‌اندرکاران آن هستم. پاینده باشید.

 

گزیده:
تا در طلب گوهر کانی کانی
تا در هوس لقمهٔ نانی نانی
این نکتهٔ رمز اگر بدانی دانی
هر چیزی که در جستن آنی آنی

Share