Exploration은 내실을 다지는 것, Exploitation은 새로운 능력을 개발하는 것
이러한 관점에 동의합니다. 결국 내실은 기존의 삶의 경험과, 새로운 능력은 새로운 도전/시도와 관련이 있다고 생각합니다. 우리가 갖고있는 삶에 대한 가정과 사전지식이 종종 모호해지거나 부재함을 깨닫게 되는 때가 오는 것처럼, 강화학습에서는 정말로 많은 알고리즘과 방법론이 등장하지만, 그 중 Q-learning 이 어쩌면 결국 삶을 살아나가는 과정과 비슷하지 않나 생각합니다. 댓글 감사합니다.