핵심 요약
- 구글은 7세대 TPU ‘아이언우드’를 정식 출시하고, 학습과 추론에 각각 최적화된 두 종류의 8세대 TPU(Sunfish, Zebrafish) 아키텍처를 공개하며 하드웨어 설계 철학의 변화를 선언했습니다.
상세 분석
아이언우드(TPU v7)의 압도적 성능 지표
구글 클라우드 넥스트 2026에서 정식 출시(GA)된 7세대 TPU ‘아이언우드(Ironwood)‘는 에이전틱 시대의 거대 모델 처리를 위한 핵심 인프라다. 각 칩은 4.6 페타플롭스(petaFLOPS)의 성능을 제공하며, 9,216개의 칩을 연결한 슈퍼포드(Superpod) 구성 시 42.5 엑사플롭스(exaFLOPS)라는 경이로운 연산 능력을 발휘한다. 이는 현존하는 AI 가속기 중 최고 수준의 집적도와 효율성을 자랑한다.
TPU v8 아키텍처: 설계 철학의 분화 (Training vs. Inference)
구글은 8세대 TPU에 이르러 ‘범용 칩’의 시대를 끝내고 워크로드별 전문화라는 새로운 설계 철학을 도입했다. 이는 AI 모델이 거대화됨에 따라 학습 단계와 서비스(추론) 단계에서 요구되는 하드웨어 특성이 완전히 달라졌기 때문이다.
| 구분 | TPU 8t (Sunfish) | TPU 8i (Zebrafish) |
| :— | :— | :— |
| 주요 역할 | 거대 모델 학습 (Training) | 고효율 실시간 추론 (Inference) |
| 설계 파트너 | 브로드컴 (Broadcom) | 미디어텍 (MediaTek) |
| 공정 기술 | TSMC 2nm 공정 | TSMC 2nm 공정 |
| 출시 목표 | 2027년 하반기 | 2027년 하반기 |
이러한 이원화 전략은 학습 시의 대역폭 최적화와 추론 시의 전력 효율성 및 비용 절감을 동시에 달성하여, 에이전틱 AI의 운영 비용을 혁신적으로 낮추는 데 목적이 있다.
시사점
TPU v8을 학습용(Sunfish)과 추론용(Zebrafish)으로 분리한 것은 AI 하드웨어 시장이 ‘성능 경쟁’을 넘어 ‘경제성 경쟁’으로 진입했음을 보여줍니다. 미디어텍과 브로드컴이라는 서로 다른 파트너를 기용한 것은 공급망 리스크를 분산하는 동시에, 각 분야의 설계 전문성을 극대화하여 엔비디아(NVIDIA)에 대한 의존도를 낮추고 자사 클라우드의 수익성을 제고하려는 치밀한 계산이 깔려 있습니다.



