GPU — Không chỉ cho game, còn là engine của AI

NVIDIA trở thành công ty nghìn tỷ đô không phải vì game — mà vì AI cần GPU. Tại sao GPU phù hợp với AI hơn CPU?

CPU vs GPU — Triết lý khác nhau

CPU được thiết kế cho tác vụ đơn lẻ phức tạp, phản hồi nhanh: 8-24 core mạnh, cache lớn, branch prediction phức tạp. GPU được thiết kế cho xử lý song song hàng loạt: 5,000-20,000 core đơn giản hơn. RTX 4090 có 16,384 CUDA cores.

Tại sao AI cần GPU?

Training neural network về cơ bản là: nhân ma trận lớn, cộng, áp dụng hàm activation — lặp lại hàng tỷ lần. Đây là tác vụ song song hoàn hảo: mỗi CUDA core xử lý một phần nhỏ ma trận cùng lúc. GPT-4 train trên ~25,000 GPU A100 trong nhiều tháng.

VRAM — Yếu tố quyết định cho AI

VRAM (Video RAM) chứa model AI đang chạy. GPT-2 (1.5B params): ~3GB VRAM. Llama 3 8B: ~16GB VRAM. GPT-4 (ước tính 1.7T params): cần hàng nghìn GB VRAM chia trên nhiều GPU. RTX 4090 có 24GB VRAM — đủ để chạy model AI 7-13B locally.

NVIDIA thống trị AI vì CUDA

CUDA là ngôn ngữ/framework lập trình GPU của NVIDIA, ra mắt 2006. Trong 18 năm, hầu hết AI framework (TensorFlow, PyTorch) được xây dựng và tối ưu cho CUDA. AMD có ROCm là alternative nhưng ecosystem nhỏ hơn nhiều — đây là “moat” thực sự của NVIDIA, không phải phần cứng.

Consumer GPU cho AI năm 2026

RTX 5070 Ti (24GB VRAM, ~25 triệu): đủ mạnh để fine-tune model nhỏ và chạy inference model 13B+. RTX 5090 (32GB VRAM, ~60 triệu): đủ để làm AI development nghiêm túc. AMD RX 9900 XT: giá tốt hơn cho gaming, nhưng software AI vẫn ưu tiên NVIDIA.