해선라이브

엔비디아, "DeepSeek의 발전, 자사 칩이 더 많이 필요하다는 것 입증"

1
홍콩
2025.01.28 추천 0 조회수 264 댓글 0
공유

엔비디아, "DeepSeek의 발전, 자사 칩이 더 많이 필요하다는 것 입증"

Nvidia는 월요일, 중국 AI 기업 DeepSeek의 발전이 자사 칩이 중국 시장에서 얼마나 유용한지 보여주며, DeepSeek의 서비스 수요를 충족하기 위해 향후 더 많은 칩이 필요할 것이라고 발표했습니다.

Nvidia는 월요일, 자사의 주가가 17% 하락한 후 성명을 발표했습니다. 이는 투자자들이 DeepSeek이 Nvidia 칩을 훨씬 적게 사용하면서 OpenAI와 같은 경쟁사들을 따라잡았다는 우려 때문이었습니다.

Nvidia는 성명에서 "DeepSeek의 연구는 널리 이용 가능한 모델과 수출 규제를 완전히 준수하는 컴퓨팅을 활용하여 새로운 모델을 어떻게 개발할 수 있는지 보여줍니다."라고 밝혔습니다.

DeepSeek의 연구 논문 중 하나는 Nvidia의 H800 칩 약 2,000개를 사용했다고 밝혔습니다. 이 칩은 2022년에 발표된 미국의 수출 규제를 준수하도록 설계되었지만, 전문가들은 로이터에 이러한 칩이 중국의 AI 발전을 거의 늦추지 않을 것이라고 전했습니다.

미국의 마이크로칩 수출 규제는 중국의 핵무기 개발 및 인공지능 시스템을 개발하는 데 사용되는 슈퍼컴퓨터의 발전을 억제하기 위해 설계되었습니다.

RAND 연구소의 기술 분석 고문인 지미 굿리치(Jimmy Goodrich)는 DeepSeek이 사용한 칩들이 합법적으로 구매된 시점에서 중국에는 Nvidia 칩을 상당히 많이 보유한 주요 슈퍼컴퓨터가 최소 12대 이상 있다고 말했습니다. 미국 AI 기업들 또한 컴퓨팅 효율성을 주요 초점으로 삼고 있다고 덧붙였습니다.

굿리치는 "DeepSeek은 갑자기 나타난 것이 아닙니다. 이들은 수년간 모델 개발에 매진해왔습니다. DeepSeek이 더 많은 컴퓨팅 자원에 접근할 수 있었다면 얼마나 강력해졌을지 상상할 수 없을 정도입니다."라고 말했습니다.

월요일, DeepSeek은 새로운 사용자 유입을 처리하기 위해 애를 먹고 있었습니다. 새로운 사용자를 서비스하는 과정은 AI 기업들이 "추론(inference)"이라고 부르는 것으로, Nvidia는 자사의 칩이 계속해서 수요가 있을 것임을 보여주는 사례라고 전했습니다.

Nvidia는 성명에서 "추론은 상당한 수의 Nvidia GPU와 고성능 네트워킹을 요구합니다."라고 밝혔습니다.

현재 Nvidia는 최근 수출 규제를 충족하도록 설계된 H20 칩을 판매 중입니다. 이러한 규제는 해당 칩의 AI 훈련 용도를 제한하지만, 굿리치는 이 칩이 "추론용으로는 아마 세계 최고의 칩"이라고 평가했습니다.

 

Nvidia는 DeepSeek의 돌파구가 자사의 GPU(Graphics Processing Unit)에 대한 더 많은 작업 수요를 창출할 것이라고 보고 있습니다.

Nvidia 대변인은 “추론(inference)은 상당한 수의 Nvidia GPU와 고성능 네트워킹이 필요합니다. 우리는 현재 사전 훈련(pre-training), 사후 훈련(post-training), 새로운 Test Time Scaling이라는 세 가지 스케일링 법칙을 가지고 있습니다.”라고 덧붙였습니다.

Test Time Scaling 법칙의 부상
Nvidia CEO 젠슨 황, OpenAI CEO 샘 알트만, Microsoft CEO 사티아 나델라는 최근 몇 달 동안 AI 개발의 새로운 주제를 논의하고 있습니다.

AI 붐과 Nvidia GPU 수요의 상당 부분은 2020년 OpenAI 연구자들이 제안한 "스케일링 법칙"이라는 개념에 의해 촉진되었습니다. 이 개념은 새로운 모델을 구축하는 데 들어가는 계산과 데이터를 크게 확장하면 더 나은 AI 시스템을 개발할 수 있다는 내용을 담고 있으며, 이는 더 많은 칩을 필요로 합니다.

하지만 작년 11월 이후, 젠슨황과 알트만은 이 스케일링 법칙의 새로운 변형인 "Test Time Scaling"에 집중하고 있습니다.

이 개념은 훈련된 AI 모델이 예측을 하거나 텍스트나 이미지를 생성할 때 추가 컴퓨팅 자원을 사용해 "추론"을 수행하는 데 더 많은 시간을 할애하면, 짧은 시간 동안 실행한 경우보다 더 나은 결과를 제공할 것이라는 내용을 담고 있습니다.

Test Time Scaling 법칙의 형태는 OpenAI의 일부 모델(O1)과 DeepSeek의 R1 모델에서도 사용되고 있습니다.

 

댓글

해외선물 정보

공지

해선 라이브 포인트 제도

M
관리자
조회수 91197
추천 0
2024.09.27

2024년 12월 12일 신문을 통해 알게된 것들

1
박종호
조회수 1045
추천 0
2024.12.12

★★12월 12일 주요신문 헤드라인★★

1
박종호
조회수 926
추천 0
2024.12.12

12월 12일 목요일 간추린 아침뉴스입니다.

1
박종호
조회수 840
추천 0
2024.12.12

국내외 주요 증시 일정 (2024-12-12)

1
박종호
조회수 865
추천 0
2024.12.12

경제신문읽기(Routine)

1
홍콩
조회수 850
추천 0
2024.12.12

(2024.12.12) U.S. & EU Market Closing / 유안타증권 해외투자전략팀

1
홍콩
조회수 1011
추천 0
2024.12.12

[12/12, 장 시작 전 생각: 폐활량과 체력, 키움 한지영]

1
홍콩
조회수 781
추천 0
2024.12.12

[12월 12일 마케팅 뉴스클리핑] 카카오톡 쇼핑탭 개편 외

1
홍콩
조회수 796
추천 0
2024.12.12

2024년 12월 12일 이세철의 출근길 뉴스 브리핑

1
홍콩
조회수 928
추천 0
2024.12.12

24-12-11 해외선물 나스닥 차트VIEW

1
박종호
조회수 1260
추천 0
2024.12.11
24-12-11 해외선물 나스닥 차트VIEW

12/11 미 증시, 소비자물가지수 발표 앞두고 종목 차별화 속 차익 매물 확대되며 하락

1
홍콩
조회수 840
추천 0
2024.12.11

(12/11) AI 데일리 글로벌 마켓 브리핑

1
홍콩
조회수 931
추천 0
2024.12.11

[12/11, 장 시작 전 생각: 재생력 테스트, 키움 한지영]

1
홍콩
조회수 631
추천 0
2024.12.11

짧은사설 5개로☕세상읽기

1
홍콩
조회수 699
추천 0
2024.12.11

[241211 Macro daily]

1
홍콩
조회수 725
추천 0
2024.12.11
20 21 22 23 24
/upload/d164900544c84ec3b4438add16e3c8ca.webp
/upload/6433ceeaf2c14bdf9f179d8fdf59467f.webp
공지사항 해외선물 정보 자유게시판 먹튀업체 제보