바이두, 쿤룬 칩 클러스터로 딥시크 훈련 가능하다고 밝혀
바이두가 자체 개발한 AI 반도체 쿤룬 칩 3만 개로 구성된 클러스터를 통해 딥시크 수준의 거대 언어 모델(LLM) 훈련이 가능하다고 발표했다. 이는 미국의 AI 반도체 수출 제한 속에서도 중국이 독자적인 기술력으로 초거대 AI 모델 훈련에 필요한 핵심 인프라를 구축할 수 있다는 점을 보여주는 중대한 이정표로 평가된다. 바이두는 해당 클러스터가 수천억 개의 파라미터를 가진 AI 모델 훈련은 물론, 동시에 수많은 맞춤형 모델 미세조정도 가능하다고 밝혔으며, AI 반도체 자립과 실용 중심 전략의 실현 가능성을 함께 제시했다.

AI 반도체 자립 가시화한 바이두, 자체 칩 기반 클러스터로 대규모 모델 훈련 역량 강화
바이두는 최근 개최된 개발자 컨퍼런스에서 자사의 자체 AI 반도체 쿤룬 칩을 활용한 대규모 클러스터를 공개하며, 첨단 AI 모델 훈련 능력을 대외적으로 과시했다. 바이두는 쿤룬 칩 클러스터가 딥시크와 유사한 수준의 모델도 훈련시킬 수 있는 역량을 갖추고 있다고 밝혔다. 딥시크는 중국 AI 스타트업이 개발한 오픈소스 LLM으로, 특히 프로그래밍과 언어 이해 능력에서 탁월한 성능을 보이며 글로벌 AI 업계에서 큰 관심을 받아온 모델이다.
딥시크와 같은 AI 모델을 훈련시키기 위해서는 수천억 개의 파라미터를 다룰 수 있는 막대한 연산 자원이 필요하다. 일반적으로 이와 같은 연산은 엔비디아의 A100이나 H100 같은 고성능 GPU 수천 개를 연결한 클러스터를 통해 수행된다. 하지만 미국 정부는 국가 안보를 이유로 첨단 AI 칩의 중국 수출을 강력히 제한하고 있어, 중국 기업들은 자체적으로 고성능 컴퓨팅 인프라를 구축해야 하는 상황에 처해 있다. 이에 따라 바이두를 비롯한 화웨이, 알리바바 등 중국의 주요 기술 기업들은 자체 AI 반도체 개발에 매진해왔다.
바이두가 공개한 쿤룬 클러스터는 3세대 쿤룬 P800 칩 3만 개를 연결해 구축된 것으로, 실제 AI 모델 훈련에 필요한 조건을 충족하는 '가동' 상태에 돌입했다. 해당 클러스터는 단일 대형 모델 훈련은 물론, 최대 수천 개의 소규모 모델을 동시에 미세조정(fine-tuning)할 수 있는 성능을 지닌 것으로 알려졌다. 바이두는 이와 같은 성능이 자사의 칩 기술력뿐 아니라, 클러스터 설계 및 운용 능력에서도 국제 경쟁력을 확보했음을 의미한다고 주장한다.
이번 발표는 미국의 수출 규제에도 불구하고 중국이 독자적으로 초거대 AI 훈련 인프라를 개발할 수 있다는 가능성을 보여준 중요한 성과로 받아들여지고 있다. 바이두는 쿤룬 P800 칩이 이미 중국 내 여러 은행과 인터넷 기업에서 실사용되고 있다고 밝혔으며, 이는 자사의 기술이 이론이 아닌 실제 산업 적용 단계에 이르렀다는 것을 의미한다. 바이두의 CEO 로빈 리는 기술보다는 실용 중심의 전략을 강조하며, "모델과 칩은 애플리케이션 없이는 무의미하다"는 메시지를 통해 실사용 사례 확대에 집중할 것임을 시사했다.
바이두는 하드웨어 역량뿐 아니라, 소프트웨어 측면에서도 경쟁력을 강화하고 있다. 이번 컨퍼런스에서는 새로운 AI 모델인 어니 4.5 터보와 어니 X1 터보를 함께 공개했다. 어니 4.5 터보는 코딩과 언어 이해 성능에서 최고 수준의 벤치마크 결과를 달성한 것으로 전해졌으며, 어니 X1 터보는 복잡한 논리적 추론 작업에 특화된 모델이다. 바이두는 이 모델들을 자사의 클라우드 플랫폼, 콘텐츠 서비스 등 다양한 분야에 통합할 예정이며, 이를 통해 실질적인 사용자 경험 향상을 꾀할 계획이다.
다만 바이두가 구축한 쿤룬 클러스터가 실제 대규모 AI 훈련 과정에서 엔비디아 기반 시스템만큼의 효율성과 안정성을 보여줄 수 있을지는 지속적인 검증이 필요하다. 또한, 엔비디아의 CUDA처럼 잘 구축된 소프트웨어 생태계가 부족하다는 점도 과제로 지적된다. 그럼에도 불구하고 바이두의 이번 발표는 AI 반도체 자립이라는 전략적 목표 달성과 함께, 글로벌 AI 반도체 시장에서의 새로운 경쟁 구도를 예고하는 신호탄으로 평가된다.

프론트엔드 개발자로 커리어를 시작해 다양한 웹 서비스의 구축과 유지보수 경험을 쌓아왔습니다. 사용자 경험과 인터페이스 구현에 대한 깊은 이해를 바탕으로, 웹 기술이 실제 서비스에 어떻게 적용되고 진화하는지에 주목하고 있습니다. React, Next.js, WebAssembly 등 최신 프레임워크와 브라우저 기술의 흐름에 민감하며, 개발 환경의 변화가 개발자 생태계와 산업 구조에 어떤 영향을 주는지 분석하는 데 집중하고 있습니다. 기술의 개념뿐 아니라 그 맥락과 파급력을 함께 전달하며, 실무 기반의 시각으로 IT 전반을 바라봅니다.