모두를 위한 딥러닝 2 – Deep Reinforcement Learning
홍콩과학기술대학교의 김성훈 교수님의 ‘모두를 위한 딥러닝’ 시리즈의 두번째 강좌입니다.
1. 강좌 소개
본 Deep Reinforcement Learning 강좌는 홍콩과학기술대학교의 김성훈 교수님의 ‘모두를 위한 딥러닝‘ 시리즈의 두번째 강좌입니다. 딥러닝의 명강의로서 강화학습 기초부터 DQN까지 다루고 있습니다. 이전 강의를 안보신 분은 첫번째 강좌 머신러닝과 딥러닝강좌를 먼저 보실 것을 추천드립니다.
알파고와 이세돌의 경기를 보면서 이제 머신 러닝이 인간이 잘 한다고 여겨진 직관과 의사 결정능력에서도 충분한 데이타가 있으면 어느정도 또는 우리보다 더 잘할수도 있다는 생각을 많이 하게 되었습니다. Andrew Ng 교수님이 말씀하신것 처럼 이런 시대에 머신 러닝을 잘 이해하고 잘 다룰수 있다면 그야말로 “Super Power”를 가지게 되는 것이 아닌가 생각합니다.
더 많은 분들이 머신 러닝과 딥러닝에 대해 더 이해하고 본인들의 문제를 이 멋진 도구를 이용해서 풀수 있게 하기위해 비디오 강의를 준비하였습니다. 더 나아가 이론에만 그치지 않고 최근 구글이 공개한 머신러닝을 위한 오픈소스인 TensorFlow를 이용해서 이론을 구현해 볼수 있도록 하였습니다. 이 머신러닝, 딥러닝 강좌는 수학이나 컴퓨터 공학적인 지식이 없이도 쉽게 볼수 있도록 만들려고 노력하였습니다.
2.강의 대상
- 인공지능 초기인 지금 과감하게 야망을 가지고 AI 분야의 대가가 되실 분
(지금 시작 하셔도 초기라서 얼마든지 유명해 질 수 있습니다.) - 인공지능에 대해 관심이 있는 누구나
- 머닝러신, 딥러닝의 개념을 이해하고 싶으신분
- 머닝러신의 직접 구현해보고 싶으신 분
3.참고 자료
이 비디오는 저도 인터넷등을 통해 공부하면서 만든것이며 아래 자료를 많이 사용하였습니다.
- Andrew Ng’s and other ML tutorials
- Lecture Videos
- Tensorflow
4.교수님 소개
김성훈 교수님은 Hong Kong University of Science and Technology 에서 컴퓨터 공학쪽으로 연구를 하고 있습니다. 비디오나 강의에 대한 의견이 있으시면 아래로 이메일을 보내 주시면 됩니다. hunkim+ml@gmail.com
강좌 교육과정 소개 (COURSE CURRICULUM)
Lecture 1. 오리엔테이션 | |||
수업소개 (Introduction) | 00:13:00 | ||
Lecture 2. OpenAI GYM 게임 | |||
이론 – Playing OpenAI GYM Games | 00:10:00 | ||
실습 – Playing OpenAI GYM Games | 00:09:00 | ||
Lecture 3: Dummy Q-learning (table) | |||
이론 – Dummy Q-learning (table) | 00:21:00 | ||
실습 – Dummy Q-learning (table) | 00:13:00 | ||
Lecture 4: Q-learning 을 완벽하게 하기 | |||
이론 – Q-learning (table) exploit&exploration and discounted reward | 00:17:00 | ||
실습 – Q-learning (table) exploit&exploration and discounted reward | 00:07:00 | ||
Lecture 05: 비결정론적 환경(non-deterministic world) 에서의 Q-learning | |||
이론 – Q-learning on Nondeterministic Worlds! | 00:14:00 | ||
실습 1 – Q-learning on Nondeterministic Worlds! | 00:09:00 | ||
실습 1 – Q-learning (Table) Demo by Jae Hyun Lee (배경 음악과 함께) | 00:01:00 | ||
Lecture 6: Q-Network | |||
이론 – Q-Network | 00:17:00 | ||
실습 1 – Q Network for Frozen Lake | 00:18:00 | ||
실습 2 – Q Network for Cart Pole | 00:22:00 | ||
Lecture 7: DQN | |||
이론 – DQN | 00:18:00 | ||
실습 1 – DQN 1 (NIPS 2013) | 00:19:00 | ||
실습 2 – DQN 2 (Nature 2015) | 00:16:00 | ||
실습 3 – DQN Cart Pole Demo (음악 들어 있음)! | 00:01:00 | ||
실습 4 – DQN Simple Pacman exercise example (음악과 함께)! | 00:01:00 |
전설의 시작
어렵다고 넘보기 힘들어 하거나, 또는 해야되는데 당장 프로젝트가 없어 차일 피일 미루던 개발자 분들에게
머신러닝의 열정을 지펴 주시더니, 이제 DQN 까지.. 아 정말 무시 무시한 최고의 강의입니다!
한국 머신러닝, 딥러닝 역사에 아주 중요한 기여를 하신 분입니다.
마치 쇄국을 취하던 조선말에, 선각자 처럼..
민중을 깨우쳐 주시는 명강의며 대한민국의 지적 자산입니다! 애국 하신겁니다.
감사합니다.