−فهرست مندرجات
یادگیری برخط - نیمسال اول ۱۴۰۰
مدرسین | ایمیل |
---|---|
محمدهادی فروغمند | foroughmand@sharif.ir |
کسری علیشاهی | alishahi@sharif.ir |
اهداف درس
درس همزمان جنبەی آموزشی و پژوهشی دارد. یکی از اهداف مهم کسب آمادگی برای دنبال کردن مقالات و ادبیات روز در موضوع یادگیری برخط، پژوهش در زمینەهای نزدیک و به کارگیری این ایدەها در مدلسازی و ارایەی راه حل برای مسالەهای واقعی است.
شرح مختصر درس
تصمیمگیری در حضور عدم قطعیت، چالشی همیشگی، با اهمیت و همراه با کابردهای روزافزون است. یادگیری برخط چارچوبی است برای مدلسازی و طراحی فرآیند تصمیمگیری در دنبالەای از موقعیتها، بر مبنای اطلاعاتی (نه لزوماکامل) از تصمیمهای قبلی و نتایج آنها. در این فرآیند، یادگیرنده همزمان که پیامدهای تصمیمهای مختلف را میآموزد، هزینەی این تصمیمها را نیز پرداخت میکند و بنابراین مسالەی اصلی برقراری توازنی است میان تصمیمهایی که منجر به کشف بهتر محیط میشوند (اکتشاف) و آنهاییکه بر مبنای آنچه تا کنون آموختەایم کمترین هزینە را دارند (بهرەبرداری). دستەی خاصی از مسالەهای یادگیری برخط، با عنوان مسالەهای بندیت، در سالهای اخیر مورد توجه زیادی قرارگرفتەاند و پژوهشهای انجام شده دربارەی آنها، نظریەای غنی به وجود آورده که نویدبخش پیشرفتهای اساسی در یادگیری برخط و حوزەهای مرتبط مانند یادگیری تقویتی در آیندەی نزدیک است.
سرفصلها
- مقدمه
- بازی حدس زدن!
- مشاوره با مشاوران!
- بندیت چنددستەی
- کاهش گرادیان برخط
- رگرسیون برخط
- ارتباط یادگیری برخط و یادگیری کلاسیک
- ارتباط پشیمانی و PAC
- مسالەی دستەبندی برخط
- بازخورد محدود
- بندیت چنددستەای و الگوریتم EXP3
- بندیت زمینەای و الگوریتم EXP4
- بندیت خطی
- بندیتهای ترکیبیاتی
- بندیت ناایستا
- کاهش آیینەای
- بەروزرسانی ضربی وزنها
- EXP3
- پیروی از پیشروی منظمشده
- مسیریابی درگراف
- مسالەها و مباحث انتخابی …
پیشنیازها
تسلط به احتمال و توانایی اولیه در انجام آزمایش و شبیەسازی کامپیوتری ضروری است. آشنایی هرچه بیشتر با فرآیندهای تصادفی، آمار و یادگیری، الگوریتم، بهینەسازی (محدب)، نظریەی بازیها برای پیگیری درس مفید است.
منابع
- [1] Shalev-Shwartz, Shai. Online learning and online convex optimization. Foundations and trends in Machine Learning 4.2 (2011): 107-194.
- [2] Elad Hazan. Introduction to Online Convex Optimization, Now Publishers, .2016
- [3] Tor Lattimore, Csaba Szepesvari. Bandit Algorithms. Cambridge University Press, 2020.
- [4] Francesco Orabona A Modern Introduction to Online Learning. 2021
ارزشیابی
- طرح الف) آموزشی
- تمرین (۶ نمره): دو یا سه سری تمرین تحویلی
- امتحان پایانترم (٧ نمره): امتحانی شفاهی از مفاهیم، مسالەها، اثباتها یا طرح اثبات قضیەها
- امتحان خانەبَر (٨ نمره): امتحانی برای حل مسالەهای سخت!
- طرح ب) پژوهشی
- تمرین (۶ نمره): دو یا سه سری تمرین تحویلی
- امتحان پایانترم (٧ نمره): امتحانی شفاهی از مفاهیم، مسالەها، اثباتها یا طرح اثبات قضیەها
- پروژه (١٠ نمره): طرح یک مسالە، تلاش برای حل مساله با شبیەسازی، محاسبه، بررسی مثال، حدس، اثبات، ….گزارش مکتوب و شفاهی از کارهای انجام شده.
توضیحات
کسانی که طرح ارزشیابی پژوهشی را انتخاب میکنند، همراه درس یادگیری برخط درس سمینار نظریەی یادگیری را نیز خواهند گرفت و نمرەی درس سمینارشان همان نمرەی درس یادگیری برخط خواهد بود. به علت محدودیت در تصحیح و بررسی تمرینها، امتحانات و پروژەها، ظرفیت درس محدود خواهد بود. ابتدا نوبت ثبت نام با دانشجویان تحصیلات تکمیلی است و پس از آن با توجه به ظرفیت باقیمانده، درخواستهای دانشجویان کارشناسی بررسی و با ثبت نام تعدادی از آنها موافقت خواهد شد.