2021년 4월 28일 수요일

개똥철학

강화학습에서 숫자로 표현되는 보상(reward)의 개념을 사람에 적용해 생각해보다가, 생명체가 느끼는 고통이 어떻게 구현됐을까 하는 궁금증이 생겼다.

또, 고통을 느끼는 기계를 만드는 것은 가능할까? 그게 가능하다면, 윤리적일까? 윤리적으로 문제가 없다는 결론이 날지도 모른다. 보상과 처벌은 강화학습의 핵심이기 때문이다. 고통을 느끼지 못하면 몸의 이상을 알기 힘들다는 걸 국민학교 방학 때 탐구생활 책에서 읽은 기억이 난다.

사람마다 원하는 것은 조금씩 다르다. 여러 가지 욕구에 사람마다 다른 가중치를 두어 총합을 구할 수 있겠지만, 다양한 욕구를 외부에서 직접적으로 조절하는 건 현실적으로 불가능하므로 결국 금전적 보상으로 귀결되는 것 같다. 음의 보상(penalty)도 마찬가지로 현실 세계에서는 결국 과징금, 벌금 등을 매개로 한다. 아, 징역과 사형도 있구나. 태형이란 것도 존재했고. 게다가 사적 영역에서는 온갖 폭력이 자행된다.

그러면 사람에게 궁극적인 보상은 무엇일까? 단순히 고통이 없는 상태를 보상으로 간주하는 건 좀 잔인하다. 역으로 쾌락이 없는 상태를 고통이라고 하지도 않는다.

혹시 불교에서 말하는 '해탈'은 고통도 쾌락도 없는 상태일까? 그렇다면 불교는 보상과 처벌로 조종당하는 삶을 거부하는 움직임이겠다.

그러고 보니 옛날에 읽은 공상과학 소설에서, 마약과 같이 쾌락을 일으키는 물질을 공급하는 장치에 뇌를 집어넣고 조종한다는 설정을 본 것 같다.