RTX3060의 후속 모델이자 RTX 40 시리즈의 미들레인지 모델인 RTX 4060이 제 메인 그래픽 카드입니다.
저는 이전 포스팅에서 엔비디아 미국 주식 분석을 하는 만큼, 그래픽 카드에도 관심이 있는데요.
2023년 6월 28일에 출시되었는데, 처음에는 영상 편집 목적으로 맞췄다가 지금은 카이로소프트 게임이나 하고 있죠..
저도 처음에는 고고익선이라고 생각해서 4060으로 갔는데 여전히 RTX 3060, 3060Ti 모델들로도 맞출 수가 있기에, 어떤 제품을 선택해야 할지 고민이 많은 분들도 계실 거라고 봅니다.
따라서 이번 포스팅에서는 GeForce RTX 4060 StormX 8GB를 기준으로 RTX 4060의 성능을 자세히 살펴봅니다.
RTX 4060 스펙 확인
RTX 4060 | RTX 3060 | RTX 3060 Ti | |
아키텍처 | Ada Lovelace | Ampere | Ampere |
제조 공정 | TSMC 4N | Samsung 8nm 커스텀 | Samsung 8nm 커스텀 |
셰이더수(CUDA코어수) | 3,072 | 3,584 | 4864 |
RT 코어수 | 24기(3세대) | 28 (2세대) | 38 (2세대) |
텐서 코어수 | 96기(4세대) | 112 (3세대) | 152 (3세대) |
베이스 클럭 | 1,830MHz | 1,320MHz | 1,410MHz |
부스트 클럭 | 2,460MHz | 1,780MHz | 1,665MHz |
VRAM 용량 | 8GB(GDDR6) | 12GB(GDDR6) | 8GB(GDDR6) |
메모리 전송 속도 | 17Gbps | 15Gbps | 14Gbps |
메모리 버스 폭 | 128bit | 192bit | 256bit |
메모리 버스 대역폭 | 272GB/s | 360GB/s | 448GB/s |
PCI-Express | Pcie 4.0 ×8 | Gen4.0×16 | Pcie 4.0 ×16 |
보조 전원 | 8pin×1 | 8pin×1 | 8pin×1 |
L2캐시 | 24MB | 2.25MB | 4MB |
소비전력(TGP) | 115W | 150W | 200W |
NVENC | 제8 세대 | 제7세대 | 제7세대 |
AV1 | 인코딩/디코드 | 디코드 | 디코드 |
초해상도 기술 | DLSS3 | DLSS2 | DLSS2 |
RTX 4060은 셰이더 수가 3072개로, 메모리 버스 폭은 128bit, 메모리 대역폭은 272GB/s입니다. 이는 선대 모델인 RTX 3060과 RTX 3060 Ti와 비교했을 때 스펙상으로 다소 다운그레이드된 부분이 있습니다.
하지만, RTX 4060은 L2 캐시가 24MB로 대용량화되어 있어, 실질적인 메모리 대역폭은 453GB/s에 달합니다. 이 거대한 L2 캐시 덕분에 VRAM에 대한 액세스 빈도를 크게 줄일 수 있어, 소비 전력(TGP)은 115W로 크게 절감되었습니다.
또한, RTX 4060의 RT 코어, Tensor 코어, NVENC는 모두 새롭게 개선되어 이전 세대보다 성능이 향상되었습니다.
RTX 4060은 DLSS 3 기술을 지원합니다. DLSS 3는 인공지능(AI)을 활용해 프레임을 생성하는 기술로, 이를 DLSS Frame Generation(DLSSFG)이라고도 부릅니다. 이 기술은 기존의 DLSS 2보다 훨씬 더 큰 성능 향상을 가능하게 하여, 게임에서 프레임 레이트를 극적으로 끌어올릴 수 있습니다. 단, DLSS 3을 지원하는 게임에서만 이 기능을 사용할 수 있다는 점은 유의해야 합니다.
또한, RTX 4060은 AV1 인코딩을 지원하여, 약 40% 향상된 인코딩 효율을 제공합니다. AV1 코덱을 활용하면, 저비트레이트로도 고품질 비디오 스트리밍을 구현할 수 있어, 특히 스트리밍이나 비디오 인코딩 작업에서 큰 장점을 제공합니다.
RTX 4060 게임 성능
검증 환경 | |
---|---|
CPU | AMD Ryzen 7 7800X3D |
메모리 | FURY Renegade DDR5 RGB 32GB |
다음과 같은 환경에서 3D Mark의 신세대 테스트인 「Steel Nomad」, 「Steel Nomad」, 「Speed way」를 실행했습니다.
종합 성능 비교 결과, RTX 4060은 RTX 3060에 비해 각 게임에서 성능 향상을 보였습니다. 구체적으로, Steel Nomad에서는 약 13% 향상되었고, Steel Nomad Light에서는 14%, Speed Way에서는 17% 더 높은 성능을 기록했습니다.
반면, RTX 3060 Ti와 비교했을 때는 RTX 4060이 일부 게임에서 뒤처지는 경향을 보였습니다. Steel Nomad에서는 약 11% 낮았고, Steel Nomad Light에서는 9%, Speed Way에서는 7% 성능이 낮았습니다.
NVIDIA DLSS 기능 벤치마크, 즉 NVIDIA DLSS Feature Test에서 RTX 4060은 DLSS 3(DLSS Frame Generation, DLSS FG)를 지원하는 반면, RTX 3060과 RTX 3060 Ti는 DLSS 2를 사용합니다.
RTX 4060은 DLSS 활성화 상태에서 RTX 3060보다 약 46% 더 높은 성능을 보였으며, RTX 3060 Ti에 대해서도 약 21% 더 높은 성능을 기록했습니다. 이는 RTX 4060이 DLSS 3과 DLSS FG를 지원하기 때문에, DLSS 2만 지원하는 RTX 3060과 RTX 3060 Ti와 비교해 큰 성능 차이를 보이는 결과입니다.
DLSS FG는 프레임 생성을 통해 성능을 대폭 향상시키기 때문에, RTX 3060 Ti와 RTX 3060이 지원하지 않는 기능에서 큰 격차가 발생하게 됩니다.
벤치마크 테스트 : 사이버펑크 2077
그러나 실제로 게임을 하는 일은 별로 없었네요.
RTX 4060 크리에이티브 성능
블렌더
Stable Diffusion(AI 이미지 생성)
제가 엔비디아에 투자하는 만큼, 관심을 가지고 있는 AI 생성 성능에 대해서입니다.
Stable Diffusion을 사용하여 화상 10매를 생성하는 데 걸린 시간을 계측한 결과, 두 가지 이미지 크기(512×512, 512×768)에 대해 다음과 같은 성능 차이가 나타났습니다.
1. 이미지 크기 512×512:
- RTX 4060은 RTX 3060에 비해 약 6초 더 빨리 처리 완료되었습니다.
- 반면, RTX 3060 Ti와는 거의 동등한 처리 시간을 기록했습니다.
2. 이미지 크기 512×768 (Hirez.fix로 1024×1536 업스케일링 포함):
- RTX 4060은 RTX 3060에 비해 약 29초 더 빠르게 처리 완료되었습니다.
- 그러나 RTX 3060 Ti에 대해서는 약 9초 더 느린 결과를 보였습니다.
결과적으로, RTX 4060은 RTX 3060에 비해 전반적으로 더 빠른 성능을 보였으나, RTX 3060 Ti와는 상황에 따라 약간의 차이가 발생했습니다.
인코딩
HandBrake를 사용해 동영상 인코딩 성능을 계측한 결과, H.265 NVENC 1080P 프리셋을 기준으로 RTX 4060은 RTX 3060과 RTX 3060 Ti에 비해 약 16% 더 높은 성능을 보였습니다.
RTX 4060의 NVENC는 이전 세대인 RTX 3060과 RTX 3060 Ti보다 더 최신 기술을 적용하고 있어, 인코딩 성능에서 압도적인 우위를 나타냈습니다. 이로 인해 RTX 4060은 두 모델보다 월등히 빠른 인코딩 속도를 기록했습니다.
コメント