중국상하이뉴스

"DeepSeek, 세계적 돌풍: 중국 국내 인재로 만든 초거대 모델, 저비용 고효율의 신화"

나바오 2025. 1. 27. 21:12

출처 :蓝鲸财经2025-01-27 15:33

앱스토어에서 chatgpt를 앞선 deepseek

"DeepSeek, 국산 대규모 AI 모델로 세계를 놀라게 하다: 애플 중국·미국 앱스토어 무료 다운로드 순위 1위 등극"

DeepSeek, 애플 미국 앱스토어 무료 다운로드 1위 달성했습니다

1월 27일, 애플 앱스토어 중국 지역 무료 앱 순위에서 DeepSeek이 1위를 차지했습니다. 동시에 DeepSeek은 미국 애플 앱스토어에서도 무료 앱 순위가 전날 6위에서 1위로 급상승하며 ChatGPT, Meta의 소셜미디어 플랫폼 Threads, Google Gemini, Microsoft Copilot 등 주요 미국 IT 기업의 생성형 AI 제품들을 제쳤습니다.

DeepSeek 폭발적 인기 속 서버 장애가 발생했습니다

1월 26일, DeepSeek은 짧은 시간 동안 서버 장애를 겪었습니다. 이에 대해 DeepSeek 측은 같은 날 오후 일부 서비스에서 문제가 있었지만 몇 분 내에 해결되었다고 밝혔습니다. 이 문제는 새로운 모델 공개 이후 사용자 접속이 폭증하며 서버가 대규모 트래픽을 감당하지 못한 것이 원인으로 보입니다.

오늘 또 다른 소식에 따르면, DeepSeek 서비스 상태 페이지에 웹사이트 및 API가 이용 불가능하다는 메시지가 표시되었으며, 현재 문제가 조사 중이라고 합니다.

DeepSeek, 완전 중국 국내 인재로 만든 혁신적인 AI 모델입니다

DeepSeek은 중국 내 AI 기업들이 대형 인터넷 기업과 협력하는 것과는 달리, 양자 헤지펀드 회사인 ‘환방양화(幻方量化)’가 운영하는 프로젝트입니다. 2016년 환방양화는 첫 AI 모델을 발표했으며, 이를 활용한 딥러닝 기반 거래 전략을 실행하기 시작했습니다. 이후 2017년 말에는 거의 모든 양자 거래 전략이 AI 모델을 통해 계산되었습니다.

2023년, 환방양화는 혁신적 대규모 모델 회사인 DeepSeek을 설립했습니다. 그리고 2024년 12월에는 DeepSeek-V3 모델의 첫 버전을 출시하며 이를 오픈소스로 공개했습니다. 이 모델의 훈련 비용은 557만 6천 달러에 불과하며, 총 280만 GPU 시간이 소요되었습니다.

1월 20일에는 R1 추론 모델이 정식으로 오픈소스로 공개되었으며, 1월 24일 DeepSeek-R1은 Chatbot Arena 종합 순위에서 OpenAI의 최상위 추론 모델과 공동 3위를 기록했습니다.

실리콘밸리와 월가를 뒤흔든 DeepSeek입니다

DeepSeek은 그 영향력을 빠르게 태평양을 넘어 실리콘밸리로 확장했습니다. 페이스북 모회사 Meta는 DeepSeek의 원리를 연구하고 이를 통해 자체 대규모 모델인 Llama를 개선하기 위해 4개의 전문 연구팀을 설립했다고 전했습니다.

DeepSeek이 전 세계적으로 주목받는 주요 이유는 낮은 비용으로 OpenAI의 ChatGPT와 대적할 수 있는 AI 모델을 훈련했기 때문입니다.

보도에 따르면, DeepSeek의 R1 사전 훈련 비용은 557만 6천 달러로 OpenAI GPT-4의 훈련 비용의 10분의 1에 불과합니다. 또한 DeepSeek은 API 요금을 공개했는데, 백만 개 입력 토큰당 1위안(캐시 히트), 4위안(캐시 미스), 백만 개 출력 토큰당 16위안입니다. 이는 OpenAI의 o1 실행 비용의 30분의 1 수준입니다.

이 소식은 월가에도 큰 반향을 일으켰습니다.

미국 유명 투자자 “THE SHORT BEAR”는 소셜미디어를 통해 “DeepSeek은 AI 거대 기업들에게 치명적인 순간을 만들어냈으며, 투자자들은 이를 경계해야 한다”고 경고했습니다. 그는 “OpenAI를 능가하는 데 필요한 금액이 5500만 달러라면, AI 산업의 상업화는 사람들이 예상한 것보다 훨씬 빠르게 진행될 것”이라고 언급했습니다.

국산 AI 모델이 세계를 놀라게 했습니다: 완전 본토 팀의 성공 신화

DeepSeek은 중국 국내 인재들로만 구성된 팀이라는 점에서도 주목받고 있습니다. 팀원 대부분은 칭화대, 베이징대, 베이항 등 중국 최고 명문 대학 출신 석·박사 졸업생들로, “해외파”가 전혀 없는 완전 본토 인재로만 이뤄졌습니다.

DeepSeek 팀은 현재 인력을 적극적으로 채용 중이며, 주요 기술 직무는 대부분 석·박사급 인재들이 담당하고 있습니다. 특히, AI 대규모 모델 인턴에게는 하루 500-1000위안(한화 약9만~18만원)의 고임금을 지급하며 업계의 주목을 받고 있습니다.

AI 혁신의 시대, 모든 것이 가능합니다

OpenAI가 세계에 충격을 준 이후, DeepSeek은 블랙호스로 등장하며 세계를 다시 한 번 놀라게 했습니다. 빠르게 변하는 AI 시대, 모든 것이 가능해 보입니다.

 

DeepSeek CEO 량원펑

량원펑(梁文峰)은 중국의 AI 기업 딥시크(DeepSeek)의 창립자이자 CEO입니다. 1985년 중국 광둥성에서 태어나 저장대학교에서 머신 비전을 전공하였으며, 2015년 대학 동기들과 함께 퀀트 헤지펀드인 하이플라이어(High-Flyer)를 설립하였습니다. 하이플라이어는 중국에서 처음으로 딥러닝을 컴퓨터 거래에 도입한 회사로 알려져 있습니다.

2023년, 량원펑은 하이플라이어의 지원을 받아 딥시크를 설립하였으며, 딥시크는 혁신적인 AI 모델을 개발하여 주목받고 있습니다. 특히, 딥시크의 최신 모델은 엔비디아의 GPU 2,000개를 사용하여 개발되었으며, 이는 유사한 성능의 AI 모델 훈련에 통상 1만 개 이상의 GPU가 필요한 것과 비교하면 5분의 1 수준입니다. 개발 비용도 약 560만 달러로, 일반적인 AI 모델 개발 비용의 1% 수준에 그쳤습니다. 딥시크는 이러한 혁신을 통해 AI 업계에 큰 파장을 일으키고 있으며, 량원펑의 리더십 아래 지속적인 발전을 이루고 있습니다.