요즘 '카지노 게임'라는 용어가 일상과 산업 전반에 걸쳐 빈번하게 언급되고 있습니다.
그러나 “카지노 게임가 뭐야?”라는 질문에 대해 “인공지능, 예를 들어 GPT 같은 모델!”이라고 단순히 답변하는 경우가 다반사입니다.
심지어, 공학 전공자나 연구자조차도 HW전문의 경우,대형 언어 모델(LLM)만을 인공지능의 전부로 인식하는 경향이 존재하니까요.
물론 LLM은 자연어 처리(Natural Language Processing, NLP) 분야에서 탁월한 성능을 보이며, 일반 인들에게 익숙한 것은 사실입니다.하지만 LLM은 인공지능의 전체 영역 중 한 축에 불과하며, 머신러닝, 딥러닝, 강화학습, 컴퓨터 비전, 로보틱스 등등 그 외 다양한 하위 분야들이 존재합니다.
사실 친구에게 이야기하니 "사회에서나 카지노 게임 카지노 게임하지, 우리 쪽이 그런 말 쓰면 무식하단 소리 들어 어떤 카지노 게임를 말하는 거야?"라는 이야기를 하더군요 각 분야마다 차이가 워낙 심하니 말이죠
실제로 보여드리자면 이런 형식으로 카지노 게임를 구분할 수 있습니다.
조금 더 기술적으로 말해보면딥러닝 분야에서는 심층 신경망(Deep Neural Networks)을 통한 비선형 데이터 표현 학습이 핵심 역할을 하며, 확률적 경사 하강법(Stochastic Gradient Descent, SGD)과 같은 최적화 알고리즘을 이용한 파라미터 학습이 필수적인반면, 강화학습(Reinforcement Learning)에서는 Markov 결정 과정(Markov Decision Process, MDP) 기반의 모델링과 정책 최적화를 통해 에이전트가 환경과 상호작용하며 최적의 행동 전략을 학습하기에 엄밀히 다르다.
뭐 복잡한 파트는 이후에 기회가 있으면 풀어보기로 하고 여기서 중요한 건,기술적 차원과 응용 분야의 다양성은 인공지능을 단순한 한 가지 모델로 한정 지어 이해하기에는,현대의 기술들은 워낙 다양하게 분화되어 있다는 것입니다.
쉽게 말해 카지노 게임는 GPT가 아니라는 겁니다 카지노 게임의 한 분야 중 극 세부분야가 GPT인 것이죠
그렇다면 의문이 듭니다, 사실 여기서 문제는 카지노 게임 하면 GPT라고 하는 것은 진짜 파리의 앞다리만을 이야기하고 있는 거예요, 근데 왜 카지노 게임 하면 GPT가 대명사가 된 것일까요?
핵심은 한 가지입니다.
실제로 카지노 게임를 활용하는 연구들은 많고 딥블루나 알파고 같은 녀석들도 전부 머신러닝을 활용한 것이지만, 오 대단하네 정도에서 멈췄었죠당시에는 카지노 게임 하면 알파고라는 인식이 있었지만 지금은 GPT가 대명사가 된 것처럼요.
물론 대표적으로 TTS(Text-to-Speech, 음성 합성) 같은 기술은 원래 머신러닝을 활용한 방식에서 시작되었으나, 최근에는 LLM(Large Language Model) 기반의 딥러닝 기법을 활용하여 더욱 자연스럽고 인간 같은 음성을 생성하는 방향으로 발전하고 있긴 합니다만 이것도 특정 분야 한정이죠
물론 저는 LLM의 발전에 따라 서서히 다른 분 야도 잠식해 나갈 거라 생각하지만 말이에요, 오늘은 이 이야기를 좀 더 해봅시다.
먼저 이야기해야 할 건 인공지능(카지노 게임)입니다. 뭐 워낙 많이 다룬 파트지만 컴퓨터가 인간의 지능을 모방하여 학습, 추론, 문제 해결 및 의사결정을 수행할 수 있도록 하는 모든 기술과 방법론을 포괄하는 최 상위 개념이죠.
카지노 게임는 단순히 한 가지 알고리즘이나 모델에 국한되지 않고, 다양한 접근법과 도메인을 포함합니다. 예를 들어, 규칙 기반의 전문가 시스템부터 최신 딥러닝 기술까지 모두 카지노 게임의 범주에 속하는 겁니다.
머신러닝은 카지노 게임의 하위 분야 중 하나로, 명시적으로 프로그래밍하지 않고도 컴퓨터가 데이터를 통해 패턴과 규칙을 스스로 학습하도록 하는 방법론입니다.
머신러닝은 실제로온라인 쇼핑몰의 추천 시스템, 스마트폰의 음성 인식 기능, 금융 기관의 사기 탐지 시스템 등이 모두 머신러닝의 응용파트죠 실제로 딥러닝하고 같은 거 아니야?라고 말씀하시지만 이게 맨 처음에는 머신러닝으로 만들어졌어요
원리 자체는 머신러닝은 주어진 데이터에서 통계적, 수학적 방법을 활용하여 모델을 학습시키고, 이를 바탕으로 새로운 데이터에 대해 예측이나 분류를 수행하는 것이죠,
어? 이거 LLM 하고 같은 거 아니에요? 그래서 상위개념인 겁니다.
실제로 선형 회귀, 로지스틱 회귀, 서포트 벡터 머신(SVM), 결정 트리 등 다양한 알고리즘이 존재하며,머신러닝의 강점은 데이터에서 직접 패턴을 찾아내어 모델에 반영할 수 있다는 점이며, 실제로 2020년도 이전 제가 학부생일 당시에도 꽤나 많이 사용했습니다.
위에서 설명드렸지만 여기서 분화된 것이 딥러닝으로, 딥러닝은 머신러닝의 한 세부 분야입니다.
사실 과거에는다층 인공 신경망(Deep Neural Networks)은 못써먹는다.라는 이야기가 많았지만
이 DNN을이용하여 데이터의 복잡한 구조와 패턴을 학습하는 것이 성공한 걸 증명한 사람이
제프리 힌턴이죠, 실제로딥러닝은 여러 층의 신경망을 통해 입력 데이터의 저차원부터 고차원까지의 특징을 점진적으로 추출하는 방식으로 자세한 이야기는 아래를 확인해 주세요
여기에 자연어처리 기반으로 누구나 잘 이해할 수 있도록 만든 것이죠이미지 분류, 음성 인식, 자연어 처리 등 에서 뛰어난 효율을 보이는 데다가 GEN알고리즘을 활용하며형식까지 오며 이미지 생성 영상생성까지 왔다 이해하시면 됩니다.
하위 응용 분야 및 모델의 분류
앞서 설명한 인공지능, 머신러닝, 딥러닝의 계층적 구조로 이루어져 있었죠? 문제는 여기서 이제 말하는 NLP(자연어 처리, Natural Language Processing)은 응용 분야이며, DL(딥러닝, Deep Learning)은 방법론입니다.
직관적으로 말하면, NLP는 특정 문제를 해결하는 도메인(domain)이고, 딥러닝(DL)은 머신러닝(ML)의 한 방법론(methodology)입니다.
조금 더 간단히말하면 DL ML기반 해석으로 NPL을 쓸 거냐 RL을 쓸꺼냐죠
NLP는 "텍스트와 언어"를 다루는 응용 분야
RL은 "의사결정과 행동"을 다루는 학습 방법론
정도의 차이로 이번에 이야기된 딥시크에서는 NPL기반으로 만들어진 모델에 RL을 적용해 극한의 효율화를 시킨 겁니다.