You can make anything
by writing

C.S.Lewis

by SPECAL Jan 29. 2025

카지노 게임 사이트 AI로 분석한 반도체와 산업

딥시크 마지막파트입니다. 오늘은 흥미로운 자료들이 있어 좀 들고 와 봤어요

이전 글에서도 설명드렸지만 DeepSeek의 핵심은 훈련 비용 이 절감된다는 점입니다.

이에 따라 컴퓨팅 전력 수요와 기기의 스펙이 낮아 지기에 온디바이스 카지노 게임 사이트로 가는 징점 다리 역할을 할 것이다. 이런 식으로 말씀드렸습니다.


하지만 X에 올라온 한 엔 지니어분이 해석하신 GPT의 과거사를 살펴보면 GPT4 또한 토큰 가격이 1년 반 만에 100~1,000배 하락한 기록을 확인할 수 있습니다. 물론 이것도 1년 6개월 만에 일어난 일이었죠

카지노 게임 사이트

당시에도 꽤나 이슈가 되었지만 엔비디아는 망할 거다라는 발언을 하는 사람들은 없었던 것으로 기억합니다.


그럼 잠시 딥시크의 스펙을 살펴볼까요?

카지노 게임 사이트


전문가 분이 쓰신 트위터 중에 아래와 같은 언급이 있었는데


카지노 게임 사이트


Deepseek 자체는 chatgpt o1처럼 테스트 시간 조정을 수행하지 않습니다. 훈련 후 카테고리에 속하며 chatgpt와 유사한 더 강력한 추론 능력을 얻고 토큰 가격을 추론하는 관점에서 카지노 게임 사이트가 o1보다 27배 낮은 것이 맞다는 정도의 발언입니다. 잘 이해가 안 가시죠 한번 풀어봅시다.


우선 이를 이해하기 위해서는 ChatGPT O1의 특성을 먼저 이해하셔야 합니다


O1은 테스트 시점에 추론 중 추가적인 사고 단계를 수행하는데 그 과정에서 "사고 단계"나 "검색 프로세스"를 확장하며 더 많은 계산을 통해 최적의 경로를 선택합니다. 과정이 문제인 거예요 사고와 검색프로세스에는굉장히 복잡한 과정으로 많은 연산이필요하다는 지점이 문제점으로 지적되는 것이죠


Generative Agents의 기억 아키텍처

실제로 Generative Agents의 기억 아키텍처를 활용하는 데 있어 굉장히 많은 피드백 루프를 활용하기에, 계산 비용이 증가한다 즉 토큰을 많이 쓴다 이해하시면 됩니다.


카지노 게임 사이트은 O1과 달리 훈련 후 단계(fine-tuning 결과물)에서 성능을 얻는 모델입니다.


즉, 추론 과정에서 추가적인 사고 단계나 복잡한 검색 프로세스를 수행하지 안 습기에 GPT처럼 피드백 루프를 안거 치는 것이죠. 대신, 이미 학습된 상태에서 더 간단하고 효율적인 방식으로 결과를 도출합니다. 이런 특성 때문에, DeepSeek의 추론 비용은 훨씬 낮아집니다. 다만 그만큼 양질의 데이터에서 COT추론과정을 많이 거쳐야겠죠


그래서 이전글에서 COLD 데이터를 구성하는 것이 중요하다고 설명드린 겁니다.


위 논리로 인하여 "DeepSeek의 추론 비용이 O1보다 27배 낮은 토큰을 사용한다."라는 주장은 이해가 되시죠?


그렇다면 이상하지 않나요? 이게 그만큼 효율적이라면 왜 RL 방법을 이전에 시도한 사람이 없었을까요?


흥미로운 점은 실제로 2년 전에도 시도됐지만(버클리) 당시 1세대 LLAMA 모델만 성능이 부족했다는 기록이 있다더군요, X에 따르면 GSM8 K 실행점수도 매우 낮았고, 추론과 수학적 능력도 너무 낮았다고 설명하고 있습니다.


뭐 이건 딱히 중요한 부분은 아니라 이런 게 있었구나 하고 추가조사는 않았습니다.


사실 제가 궁금한 부분은 이게 다른 곳에도 적용될 수 있느냐?


즉 DeepSeek-R1의 저비용 훈련 방법이 계속해서 모델 크기와 컴퓨팅 파워를 증가시킨다면

딥시크와유사한 RL 훈련 프로세스가 사용된 다면 기존 모델의 성능이 더 향상될 수 있느냐? 이 부분이핵심이니까요



이 절의 핵심은 RL 훈련을 통해 QwQ-32B-Preview 모델과 동등한 성능을 달성할 수 있습니다. 그러나 DeepSeek-R1-Distill-Qwen-32B는 DeepSeek-R1에서 증류된 모델로, 모든 벤치마크에서 DeepSeek-R1-Zero-Qwen-32B보다 훨씬 뛰어난 성능을 보입니다.


이 부분입니다 한마디로 RL 증류를 통하면 더 성능이 올라가니까 최고급 프런티어 모델(GPT O3) 같은 모델(teacher)에서 작은 모델(student)'을 훈련할 데이터셋을 구축하고 지식을 전달하는 과정을 거친다면 훨씬 더 좋은 성능을 발휘할 것이다를 추론할 수 있겠죠


O1 mini나 다른 mini 모델들의 성능이 치솟아 오를 수 있다는 말입니다.


이 말은 곧 새로운 이게 성능을 돌파할 새로운 돌파구를 찾았다는 것이고 프런티어모델 즉 현재 인공지능 연구에서 가장 앞선(카지노 게임 사이트 frontier) 모델의 가치는 더더욱 올라가고 AGI로 도달하기 위한 전쟁이 지속될 것이라는 말로 해석할 수 있겠네요


그럼?

젠슨황의 웃는 소리가 여기까지 들리는 것 같네요 이에 따라 몇 년 내로 삼성과 SK하닉스또한 낙수효과를 받을 수 있거 같다 정도로 저는 현 상황을 해석하고 있습니다.


결국 카지노 게임 사이트모델의 가격이 내려가기에 시장은 더 늘어나고? 신규사업자들이 들어가기 더 쉬워지는 데다가 활용이 더더욱 늘어날 것이라 생각합니다.

엔비디아를 다니시는 인플루언서 또한 비슷한 말을 했는데요

Machines will tr카지노 게임 사이트n machines. Never bet ag카지노 게임 사이트nst scaling. Never.

기존의 방식은 SFT는 사람이 필요했지만 RL모델은 결국 기계가 연산을 한다 즉? GPU는 더 팔릴 것이고 계속해서 시장이 더더욱 커질 거다라는 주장입니다.



X의 내용을 종합적으로 정리해 보자면 딥시크가 10분의 1을 사용한다는 것이 핵심 문제가 아니고, 컴퓨팅 성능으로도 동일한 결과를 얻었다고 할지라도 결정적인 요인은 카지노 게임 사이트의 방법이 확장 가능하고 확장 법칙의 수명을 연장할 수 있는지 여부가 중요한 겁니다.


무어의 법칙이 지속되는 한 칩 시장은 커질 것이고, 칩 제조 공정의 연구개발 비용은 계속해서 늘어날 것이고 그와 동시에 Deepseek의 비용 절감형 트레이닝 방식은 확장을성공했다는건 인정할만 결과다


다만 카지노 게임 사이트트렌드에서 딱히 압도적인 결과는 아니니 지켜보자


이렇게 정리할 수 있겠네요



참고문헌

[1] X FIN@fi56622380

[2] D. Guo, D. Yang, H. Zhang, et al., "카지노 게임 사이트-R1: Incentivizing Reasoning Capability in LLMs via Reinforcement Learning, " 카지노 게임 사이트-AI, Jan. 2025.


브런치는 최신 브라우저에 최적화 되어있습니다.