−فهرست مندرجات
نظریه پیشرفته آمار، کسری علیشاهی
توصیف درس
آنچه امروزه با عناوینی از قبیل علوم داده، هوش مصنوعی، یادگیری ماشین یا … شناخته میشود و مورد توجه فراوان است، ناگهان و از ناکجا سر بر نیاورده است! با نظری دقیق میتوان دید که ایدههای اصلی مبتنی بر سنت صدسالهی آمار و استنباط آماری است. هرچند افزایش سرسامآور حجم دادهها و قدرت محاسباتی به علاوهی علاقهمندی و تاثیرگذاری دانشمندان سایر حوزهها به ویژه متخصصان علوم کامپیوتر، چهرهی آمار سنتی را دگرگون کرده است. در این درس پیگیری ایدهها و روشهای کلاسیک آماری را از روزهای نخست شکلگیری علم آمار در نیمهی اول قرن بیستم آغاز میکنیم و با دنبال کردن تحول این ایدهها و روشها در طول زمان تا عصر حاضر، تلاش خواهیم کرد از منظر تفکر آماری به دستاوردهای (نسبتا) متاخر در حوزهی یادگیری و علوم داده بنگریم!
سرفصلها
- الگوریتم و استنباط
- مدلسازی احتمالاتی: مدلهای پارامتری
- برآوردگر بیشترین درستنمایی، بسندگی و بهینگی
- فراوانیگرایان در برابر بیزگرایان!
- برآوردگرهای انقباضی
- مدل رگرسیون و چالش واریانس: هموارسازی (regularization)
- مدلهای خطی تعمیمیافته و درختهای تصمیم
- خودگردانسازی (bootstrap) و اعتبارسنجی متقابل (cross-validation)
- آزمونهای فرض همزمان
- مدلسازی تُنُک (sparse)
- جنگلهای تصادفی و تقویت (boosting)
- شبکههای عصبی و یادگیری عمیق
- استنباط عِلّی (causal inference)
پیشنیازها
آشنایی هر چه بیشتر با مفاهیم آماری و یادگیری برای استفاده بهتر از درس مفید خواهد بود.
منابع درس
مرجع اصلی درس کتاب زیر است اما بر حسب موضوع از منابع جانبی یا مقالات استفاده میشود که در طول درس معرفی خواهیم کرد.
Bradley Efron & Trevor Hastie. Computer Age Statistical Inference. Cambridge University Press. 2016
نحوه ارزشیابی (تقریبی)
- دو یا سه سری تمرین تحویلی (6 نمره)
- امتحان پایانترم (8 نمره) : کتبی یا شفاهی از مفاهیم، روشها، مثالها و تحلیلهای مورد بررسی در کلاس
- ارائه (6 نمره) : انتخاب یکی از موضوعات از پیش مشخص شده، خواندن چند منبع مرتبط و تسلط به محتوای آنها و ارائهی مکتوب و شفاهی
ثبت نام
به علت محدودیت در تصحیح تمرینها، امتحان و ارائهها، ظرفیت درس محدود خواهد بود. پس از ثبت نام دانشجویان تحصیلات تکمیلی با توجه به ظرفیت باقیمانده دربارهی ثبت نام دانشجویان کارشناسی تصمیم گرفته خواهد شد.