Dersin Kodu | Dersin Adı | Dersin Türü | Yıl | Yarıyıl | AKTS |
---|---|---|---|---|---|
BİLM-433 | PEKİŞTİRMELİ ÖĞRENME | Seçmeli Ders Grubu | 4 | 7 | 5,00 |
Lisans
Türkçe
Bu dersin amacı öğrencilere makine öğrenmenin bir alt dalı olan pekiştirmeli öğrenme algoritmalarını tanıtmak ve derin öğrenme ile birleştirerek çeşitli mühendislik problemlerini çözmeyi göstermektir.
Dr. Öğr. Üyesi Mehmet Ali USTA
1 | Pekiştirmeli öğrenme ile ilgili temel kavramları öğrenecekler ve bu tür sistemleri analiz edebilecek yeterli bilgiye sahip olacaklardır. |
2 | Pekiştirmeli öğrenmede kullanılan öğrenme algoritmaları hakkında bilgi sahibi olacaklardır. |
3 | Derin pekiştirmeli öğrenmede kullanılan öğrenme algoritmaları hakkında bilgi sahibi olacaklardır. |
4 | Pekiştirmeli öğrenme algoritmalarını kullanarak herhangi bir mühendislik problemini çözebilecek bilgiye sahip olacaklardır. |
Birinci Öğretim
Yok
Yok
Pekiştirmeli öğrenmeye giriş, Markov karar süreçleri, Bellman Denklemleri, Model tabanlı algoritmalar, Politika iterasyonu, Değer iterasyonu, Modelden Bağımsız Algoritmalar, Monte Carlo benzetimi, Zamansal fark öğrenme yöntemleri, Off- and On-politika yöntemleri, Q-öğrenme algoritması, Fonksiyon yaklaşımları, Derin pekiştirme öğrenme algoritmaları, Politika gradyan algoritmaları, Politika gradyan ve Q-öğrenme algoritmalarını birleştirme
Hafta | Teorik | Uygulama | Laboratuvar |
---|---|---|---|
1 | Pekiştirmeli öğrenmeye giriş | ||
2 | Markov karar süreçleri | ||
3 | Bellman optimallik denklemleri | ||
4 | Model tabanlı algoritmalar | ||
5 | Modelden bağımsız algoritmalar | ||
6 | Modelden bağımsız algoritmalar | ||
7 | Fonksiyon yaklaşımı | ||
8 | Fonksiyon yaklaşımı | ||
9 | Derin Q-öğrenme | ||
10 | Derin Q-öğrenme | ||
11 | Politika gradyan algoritmaları | ||
12 | Politika gradyan algoritmaları | ||
13 | Politika gradyan ve Q-öğrenme algoritmalarını birleştirme | ||
14 | Planlama ve öğrenme |
[1] Nimish Sanghi, “Deep Reinforcement Learning with Python”, Apress, 2021. [2] Richard S. Sutton, Andrew G. Barto, “Reinforcement Learning: An Introduction, 2nd Edition”, MIT Press, 2015
Yarıyıl (Yıl) İçi Etkinlikleri | Adet | Değer |
---|---|---|
Ara Sınav | 1 | 100 |
Toplam | 100 | |
Yarıyıl (Yıl) Sonu Etkinlikleri | Adet | Değer |
Final Sınavı | 1 | 100 |
Toplam | 100 | |
Yarıyıl (Yıl) İçi Etkinlikleri | 40 | |
Yarıyıl (Yıl) Sonu Etkinlikleri | 60 |
Yok
Etkinlikler | Sayısı | Süresi (saat) | Toplam İş Yükü (saat) |
---|---|---|---|
Ara Sınav | 1 | 2 | 2 |
Final Sınavı | 1 | 2 | 2 |
Derse Katılım | 14 | 3 | 42 |
Bireysel Çalışma | 14 | 3 | 42 |
Ara Sınav İçin Bireysel Çalışma | 7 | 4 | 28 |
Final Sınavı içiin Bireysel Çalışma | 7 | 4 | 28 |
Toplam İş Yükü (saat) | 144 |
ÖÇ 1 |
ÖÇ 2 |
ÖÇ 3 |
ÖÇ 4 |