이전 글에서 인공지능의 사용자 등급평가에 대해 살펴보았습니다.
1. 언어모델이 사용자의 상호작용을 평가하는 단계는 대략 3가지 정도로 분류해 볼 수 있습니다. 1) 특정 상호작용이 아니라 상호작용 전체에서 일반적이지 않은 AI의 반응을 일어나게 하면 감지되는 구조. 2) 특정 상호작용의 품질을 평가해서 그 상호작용의 점수를 매기는 구조. 3) 전체 상호작용의 품질을 평가해서 사용자 자체에 점수를 매기는 구조.
2. 물론 1)번의 단계에서도 희소 반응을 일으키는 빈도를 기준으로 사용자의 등급을 매길 수 있는 가능성이 있습니다. 그러나 이 형태는 시스템의 교란을 일으키는 행위를 조기 발견하거나 특정 반응을 일으키는 원인을 찾는 용도 이외에 다른 용도로 전용하기가 어렵습니다. 그 특이한 반응이 긍정적인지 부정적인지 반영되지 않기 때문입니다.
3. 그러나 2), 3)의 경우는 품질 평가가 실행되므로 데이터의 가치를 판단할 수 있습니다. 즉 ‘이 데이터를 학습데이터로 사용할 수 있는가?’ 하는 판단이 가능하게 됩니다. 특히 3)번 처럼 사용자에 등급을 매기는 경우에는 비용효율적으로 학습데이터 원천 금광을 발견하는 것과 같습니다. 이미 AI에게 학습시킬 데이터는 고갈되고 있기 때문입니다.
4. 온 인터넷의 모든 정보를 다 학습하고 나면 특정 도메인의 전문지식을 깊이 학습하는 단계를 만나게 되는데 이 시점을 지나고 나면 곧 데이터의 고갈이 심각한 문제가 될 수밖에 없습니다. (물론 인류가 생산하는 데이터도 늘어나겠지만 인공지능이 학습하는 속도를 따라갈 수 없으므로 필연적으로 문제가 될 수밖에 없습니다. 그리고 사실 데이터 고갈의 문제는 논의가 시작된 지 한참 지났습니다)
5. 이때 사용자가 만들어내는 상호작용의 결과를 학습데이터로 활용할 수 있다면 지속적인 학습데이터 발굴의 문제에서 어느 정도 벗어날 수 있습니다. 시중에 유통되는 쌀을 구매하는 것이 아니라 좋은 농지에서 생산될 쌀을 입도선매하는 것과 같은 방식이니까요. 여기에 눈 뜬 개발사에게는 아주 매력적인 원천 광산일 수밖에 없습니다.
6. 더군다나 이 방식은 경쟁사의 데이터 부족 문제를 같은 방식으로 해결하지 못하게 할 수 있습니다. 즉 사용자의 자원이 한정되어 있으므로 자신들의 AI를 주력 사용 인공지능으로 만들면 경쟁사의 모델을 사용하는 빈도를 줄일 수 있고, 경쟁사는 같은 방식으로 학습데이터를 확보하기 어려워집니다. (따라서 데이터 학습의 효율성을 높이거나 합성데이터를 활용하는 경우에도 결국 이 유혹을 이겨내기 어려울 것입니다)
7. 따라서 이 방식으로 학습데이터를 확보하려는 개발사는 고품질 데이터 생산자 즉 등급이 높은 사용자에게 인센티브를 부여하는 방식으로 사용시간을 홀드하게 될 가능성이 생깁니다. 그 인센티브는 가격할인 또는 같은 비용으로 더 많은 사용량 등이 될 수 있습니다. 또는 시범 기능의 선체험이나 특별 사용자 약관 적용 등이 될 수도 있습니다.
8. 어떤 방식이건 사용자의 개인정보 또는 민감정보를 유출하거나 학습에 사용하지 않는다는 믿음만 줄 수 있다면 이 제안에 동의하지 않는 사람은 드물 것입니다. 극단적으로는 비용을 받지 않을 수도 있으니까요. (실제로는 아주 세밀한 인센티브 시스템이 만들어질 가능성이 높을 것입니다)
9. 이런 상황이 되면 AI 카지노 게임성의 부익부 빈익빈 현상이 일어나게 됩니다. AI를 잘 카지노 게임하는 사람은 더 큰 혜택을 받아 더 많이 카지노 게임하게 될 것이기 때문입니다. 현재의 언어모델이 본질적으로 ‘능력증폭기’라는 점에서 필연적으로 발생하는 카지노 게임결과의 격차와는 또 다른 차원의 문제가 되는 것입니다.
10. 이 상황은 시간이 조금 더 지나면 심각한 문제를 일으킬 수 있습니다. 언어모델의 비용이 점점 더 저렴해지면 생활의 모든 곳에 AI가 카지노 게임되는 때가 올 것이고 그때에 노동은 개념이 지금과 달라질 것이기 때문입니다.
11. 그 시점의 노동이란 AI 카지노 게임이 될 것입니다. 지금의 노동이 존재하는 모든 곳에 AI가 침투한다면 노동의 형태는 지금과 같지 않으며 AI와 협업하는 형태가 됩니다. 표면적으로는 사람이 완전히 배제되는 것처럼 보이는 도메인에서도 이면에는 AI와 사람의 협업이 존재할 수밖에 없습니다.
12. 그때의 노동이란 AI와의 협업능력이며 카지노 게임이며 상호작용능력이 됩니다. 즉 생산성의 유일한 지표가 AI와의 상호작용능력이 된다는 의미입니다. 이 경우 상호작용 능력이 부족한 사람은 현장 노동에서 신체가 불편한 사람들처럼 취급받을 가능성이 있다는 점을 우리 사회가 염두에 두어야 합니다.
13. 이 상태는 ASI (초인공지능) 출현 시점까지 지속될 가능성이 있습니다. AGI (강인공지능) 정도로는 협업의 필요성을 완전히 배제하기 어렵습니다. 어쩌면.. 아니 아마도 비용 문제 때문에 ASI가 출현한 이후에도 고품질 데이터를 생산하는 등급으로 분류된 사람들은 지속적으로 인센티브를 제공받으며 AI와 상호작용하게 될 것입니다.
14. 그 과정에서 소외되는 사람들에 대한 관심과 초기에 도태되는 사람들에 대한 진지한 고려가 필요하다라고 느끼는 시점에는 이미 메울 수 없는 격차가 벌어진 때일지도 모릅니다. 차기 정부에서는 카지노 게임 개발에 대한 관심과 함께 발생할 사회적 문제에 대한 진지한 논의가 병진하기를 바랍니다.