알파고가 현실 세계에도 적용된다면?
4개의 로봇팔이 4개의 닫힌 문을 향해 놓여있다. 로봇팔은 문에 다가가보지만 손잡이를 돌리는데 실패한다. 그래서 다시한번 문을 향해 다가가고, 이번엔 손잡이를 잡지는 못했지만 문틀을 건드려 흔든다. 다시한번, 또 다시한번 계속해서 시도하다가 마침내 손잡이를 잡고 문을깔끔하게 여는데 성공한다. 그리고 몇시간 동안 더 도전과 실패를 반복하다가 마침내 문을 완벽하게 열 수 있게 되었다. 이 로봇팔들은 구글 내부의 모처에 존재한다. 비록 이미 다른 로봇팔들은 충분히 문을 열고 닫을 수 있는 기능을 가지고 있지만, 이 로봇팔은 조금 다르다. 스스로 문을 어떻게 열 수 있는지 알아낸 것이다. ‘강화학습 reinforcement learning’이라는 기술을 통해서, 특정 임무를 수백 수천 번 반복해서 연습한다. 그..