📚 반도체 용어 사전 시리즈
- 시리즈 #1 — 반도체 핵심 용어 10가지
- 시리즈 #2 — 반도체 제품 완전 지도
- 시리즈 #3 — DRAM 완전 정복
- 시리즈 #4 — NAND Flash 완전 정복
- 시리즈 #5 — HBM 완전 정복
- ▶ 시리즈 #6 — CPU 완전 정복 (현재 글)
"코어 수가 많으면 무조건 빠른가?", "클럭이 높을수록 좋은 건가?", "인텔 vs AMD 뭐가 다른가?" — CPU를 살 때마다 헷갈렸던 모든 개념을 이 글 하나로 정리해드립니다.
1️⃣ CPU란 무엇인가
CPU(Central Processing Unit, 중앙처리장치)는 컴퓨터의 모든 연산을 총괄하는 핵심 칩입니다. 프로그램의 명령어를 해석하고 실행하는 역할로, "컴퓨터의 두뇌"라고 불립니다.
2️⃣ CPU의 핵심 구성 요소
ALU+FPU+CU
ALU+FPU+CU
ALU+FPU+CU
ALU+FPU+CU
~64KB/core
~64KB/core
~64KB/core
~64KB/core
🔢 ALU (산술논리장치)
더하기, 빼기, 비교 등 모든 수학적·논리적 연산을 담당. CPU 성능의 근본적 토대.
🎛️ CU (제어장치)
명령어를 해석하고 ALU, 레지스터, 메모리 등에 작업 순서를 지시하는 "교통 지휘자".
💾 레지스터 (Register)
CPU 내부의 초고속 임시 저장 공간. 용량은 수백 바이트에 불과하지만 접근 속도는 캐시보다 10배 이상 빠름.
📦 캐시 (Cache)
자주 쓰는 데이터를 미리 가져다 두는 빠른 메모리. L1→L2→L3 계층별로 크기↑ 속도↓.
🔌 메모리 컨트롤러
CPU와 DRAM 사이의 데이터 흐름을 관리. 최신 CPU는 이를 CPU 다이 내부에 통합(온다이).
🚌 버스 인터페이스
PCIe, DMI 등 외부 장치와의 통신 통로. GPU·SSD·네트워크 카드 연결을 담당.
3️⃣ 클럭과 IPC — 진짜 성능 지표
⏱️ 클럭 속도 (Clock Speed)
🧠 IPC (클럭당 명령어 수)
단순히 클럭이 높다고 빠른 게 아닙니다. 예를 들어 Apple M4는 클럭이 상대적으로 낮아도 IPC가 높아 인텔 고클럭 CPU를 성능에서 앞서는 경우가 많습니다.
부스트 클럭이란?
CPU는 기본(베이스) 클럭 외에, 발열·전력이 허용되는 범위 내에서 자동으로 속도를 높이는 터보 부스트(Turbo Boost) 기능이 있습니다. 모든 코어가 동시에 최대 부스트 클럭을 유지하는 것은 불가능하며, 보통 1~2개 코어가 부스트 될 때 가장 높은 클럭을 냅니다.
4️⃣ 캐시 메모리 완전 이해
CPU가 연산하려면 데이터를 메모리에서 가져와야 합니다. 그런데 DRAM은 CPU에 비해 너무 느립니다. 이 속도 차이를 줄이는 것이 캐시입니다.
| 구분 | L1 캐시 | L2 캐시 | L3 캐시 | DRAM |
|---|---|---|---|---|
| 접근 속도 | ~1ns (최고속) | ~3ns | ~10ns | ~60~100ns |
| 용량 | 32~64 KB/코어 | 256KB~1MB/코어 | 8~96 MB (공유) | 8~128 GB |
| 공유 방식 | 코어 전용 | 코어 전용 | 전체 코어 공유 | 시스템 공유 |
| 역할 | 명령어·데이터 즉시 처리 | L1 미스 시 보완 | 코어 간 데이터 공유 | 메인 메모리 |
5️⃣ CPU 명령어 처리 과정
CPU가 하나의 명령을 처리하는 과정은 다음 단계를 거칩니다. 이를 파이프라인(Pipeline)이라고 합니다.
인출
(Fetch)
해독
(Decode)
실행
(Execute)
접근
(Memory)
저장
(Write Back)
⚡ 파이프라인의 원리
공장 컨베이어 벨트처럼, 한 명령어가 EX 단계일 때 다음 명령어는 ID 단계를 수행합니다. 동시에 여러 명령어를 처리해 효율을 극대화합니다.
🔀 비순서 실행 (OoOE)
앞 명령어가 느린 메모리 접근을 기다리는 동안, 뒤에 있는 독립적인 명령어를 먼저 처리합니다. 현대 CPU의 핵심 기술입니다.
🎯 분기 예측 (Branch Prediction)
if/else 분기가 어느 쪽으로 갈지 미리 예측해 파이프라인을 채워 놓는 기술. 예측 실패 시 파이프라인을 비워야 해 성능이 저하됩니다.
🔁 슈퍼스칼라
한 클럭에 여러 개의 명령어를 동시에 처리하는 기술. 현대 CPU는 클럭당 4~8개 명령어를 병렬 처리합니다.
6️⃣ 인텔 vs AMD vs ARM
| 구분 | Intel | AMD | ARM |
|---|---|---|---|
| 아키텍처 | x86-64 | x86-64 | ARM (RISC) |
| 제조 | 자사 팹 (Intel 18A 등) | TSMC 외주 (5nm, 4nm) | 팹리스 (설계만 판매) |
| 주력 시장 | PC, 서버, 노트북 | PC, 서버, 워크스테이션 | 모바일, 임베디드, Apple Mac |
| 강점 | 소프트웨어 호환성, 단일 코어 | 멀티 코어 가성비, 3D V-Cache | 전력 효율, 발열↓ |
| 대표 제품 | Core Ultra 200, Xeon | Ryzen 9000, EPYC | Apple M4, Snapdragon X Elite |
🍎 Apple Silicon의 충격
2020년 Apple이 자체 설계한 M1 칩을 공개했을 때 업계는 충격을 받았습니다. ARM 기반임에도 인텔 x86 칩을 성능으로 압도하면서, 전력 소비는 절반 이하였습니다. CPU·GPU·NPU·메모리를 하나의 칩에 통합한 SoC(System on Chip) 설계가 핵심이었습니다.
GPU Core ×10
NPU (40 TOPS)
Unified Memory
3nm (TSMC)
7️⃣ CPU 세대별 진화 타임라인
4bit, 2,300 트랜지스터
60~66MHz
온다이 메모리 컨트롤러
65nm 공정
멀티코어 경쟁 재점화
x86 생태계 도전
온디바이스 AI 가속
8️⃣ AI 시대의 CPU — 미래 전망
🤖 NPU 통합 (AI PC)
Intel Core Ultra, AMD Ryzen AI, Qualcomm Snapdragon X 등 최신 CPU는 AI 전용 처리 장치 NPU(Neural Processing Unit)를 내장합니다. Microsoft Copilot+ PC의 요구 사양이 40 TOPS 이상입니다.
🧩 타일/칩렛 설계
하나의 거대한 CPU 대신 작은 칩렛(Chiplet)들을 연결하는 방식이 대세입니다. AMD EPYC, Intel Core Ultra 모두 칩렛 설계를 채택해 수율과 비용을 개선했습니다.
⚡ 이종 코어 (Hybrid Architecture)
고성능 P코어와 전력 효율 E코어를 혼합하는 설계(Intel의 방식)가 보편화됐습니다. 무거운 작업은 P코어, 백그라운드 작업은 E코어가 담당합니다.
🔗 CPU-GPU 통합 (APU)
AMD의 APU, Apple의 M시리즈처럼 CPU와 GPU가 같은 다이에 통합되는 흐름이 강해지고 있습니다. 메모리 대역폭 공유로 AI 추론에 유리합니다.
9️⃣ 핵심 용어 정리
| 용어 | 영문 | 설명 |
|---|---|---|
| CPU | Central Processing Unit | 중앙처리장치. 컴퓨터의 두뇌 역할 |
| 코어 | Core | 독립적으로 명령어를 처리하는 연산 유닛 |
| 클럭 | Clock Speed (GHz) | 초당 연산 사이클 수 |
| IPC | Instructions Per Clock | 클럭당 처리 명령어 수. 아키텍처 효율 지표 |
| 캐시 | Cache Memory | CPU 내 초고속 임시 메모리 (L1/L2/L3) |
| 파이프라인 | Pipeline | 명령어 처리를 단계별로 나눠 병렬 수행하는 기법 |
| TDP | Thermal Design Power | CPU 최대 지속 전력 소비량 (W) |
| OoOE | Out-of-Order Execution | 명령어를 순서 무관하게 최적 처리하는 기술 |
| 칩렛 | Chiplet | 기능별로 분리된 소형 다이를 연결하는 설계 방식 |
| NPU | Neural Processing Unit | AI 연산 전용 처리 장치 |
| SoC | System on Chip | CPU·GPU·메모리 등을 하나의 칩에 통합한 것 |
| x86 | x86 Architecture | Intel이 설계하고 AMD도 사용하는 PC 표준 명령어 집합 |
🛒 CPU 구매 시 체크포인트
(게임/작업/AI)
vs 단일 성능
냉각 계획
보드 호환성
(AI PC 여부)
🎮 게이밍
단일 코어 성능 + 클럭이 가장 중요합니다. 게임은 멀티코어 활용도가 낮아 코어 수보다 IPC와 부스트 클럭이 프레임에 직결됩니다. AMD Ryzen 7 9800X3D, Intel Core i7-14700K 등이 현세대 게이밍 왕좌를 다투고 있습니다.
🎬 영상 편집·렌더링
멀티코어 성능이 핵심입니다. 코어 수가 많을수록 렌더링 시간이 단축됩니다. AMD Ryzen 9 7950X, Intel Core i9-14900K처럼 고코어 제품이 유리합니다.
📝 핵심 요약
- CPU는 컴퓨터의 두뇌 — ALU, CU, 레지스터, 캐시로 구성
- 성능은 클럭 × IPC × 코어 수로 결정, 클럭만 높다고 빠른 게 아님
- 캐시(L1→L2→L3)는 DRAM의 속도 병목을 완화하는 고속 버퍼
- 파이프라인·비순서 실행·분기 예측으로 명령어를 효율적으로 처리
- x86(Intel/AMD) vs ARM(Apple/Qualcomm) 아키텍처 전쟁이 심화 중
- AI PC 시대 — NPU 내장, 칩렛 설계, 이종 코어가 새 표준으로 자리잡는 중
📢 다음 시리즈 예고
다음 편은 GPU 완전 정복입니다. 쿠다 코어, VRAM, 렌더링 파이프라인, 그리고 AI 시대에 GPU가 왜 핵심이 됐는지 완벽하게 정리해드립니다!
ⓒ Semiconductor Insight | semi-insight.tistory.com
본 콘텐츠는 반도체 기술 교육 목적으로 작성되었습니다.