바알못이지만 알파고의 악수에 대해서...?
보라색맛나썽
0
167
2016.03.11 22:50
바알못이지만 컴퓨터공학이 전공이라 딥러닝이 대애충 어떤 느낌인지는 압니다.
그래서 흥미로워서 그제하고 그그제 바둑 잘 몰라도 라디오처럼 틀어놓고 구경했는데요. 김성룡 9단 이분이 잠깐 알파고는 자신이 유리할 때 실수를 낸다... 라는 식으로 말씀을 하시더라고요. 근데 제 생각에는 그건 알파고가 멍청하거나 결함이 아니라 알파고가 배운 '승리'들은 다 그런 식이었기 때문이지 않을까 싶습니다. 즉 알파고한테 완승/완패는 별로 학습가치가 없는 에러 데이터라는 거죠. 실제로 에러라고 취급하진 않고 좀 동떨어진 놈이네라고해서 outlier라고 합니다.
학습한 프로 수준 기보 중에 일방적인 차이가 났던 데이터 비중하고 고만고만한 차이가 나는 싸움의 비중하고 뭐가 더 많을까 생각하면 알파고는 이대로 내가 기세를 잡고 적을 무너뜨려버린다 스토리보다는 상대보다 한발짝만 앞서면 이기는 건 똑같고, 그런 수에 더 익숙해졌기 때문에 유리할 때 덜 유리한 수를 둘 수 있다는 거...라고 추측합니다.
물론 김성룡 9단도 언급하셨듯이 사람이 보면 악수지만 결국 승리에는 지장이 없죠. 그것도 상대보다 한 발짝 앞설 거라 계산된 곳에 둔 거니까요.
역전승이든 원사이드한 경기든 서로 적당히 투닥투닥하는 싸움보다는 학습할 기회가 적을테니 알파고는 가장 확률이 높은 케이스인 적당히 투닥투닥하지만 결국 자기가 이기는 케이스를 찾아가는 게 당연한 수순이기 때문에 치고올라갈 수 있는 기회에서 한발짝 내려가는 행보를 보인다 이런 느낌이네요.
알파고의 목표설정이 집차이를 최대한 내라가 아니라 상대를 이겨라라고 세팅되어있는 이상 저런 묘한 수는 앞으로 계속 보게 될 것 같습니다.
어떻게보면 알파고는 한 발만 앞서는 게 제일 흔하기 때문에, 바람직한 승리라고 보고 있다는 게 맞을 거 같네요.
본다기 보단 계산 결과 그런 승리의 점수가 제일 높을 뿐이겠지만...