NUMA 시스템은 둘 이상의 시스템 버스가 있는 고급 서버 플랫폼으로, 단일 시스템 이미지에 다수의 프로세서를 장착할 수 있으므로 가격 대비 성능 면에서 우수합니다.
지난 10년 동안 프로세서 클럭 속도는 크게 향상되었습니다. 그러나 몇 기가헤르츠 단위 CPU의 경우 처리 능력을 효율적으로 사용하려면 많은 양의 메모리 대역폭이 제공되어야 합니다. 과학적 계산 애플리케이션과 같이 메모리 소모가 많은 워크로드를 실행하는 단일 CPU에서도 메모리 대역폭의 제한을 받을 수 있습니다.
여러 프로세서가 동일한 시스템 버스의 대역폭을 두고 경쟁해야 하는 SMP(대칭적 다중 처리) 시스템에서는 이 문제가 더욱 심각해집니다. 일부 고급 시스템에서는 고속 데이터 버스를 구축하여 이 문제를 해결하려고 합니다. 그러나 이러한 해결 방법은 비용이 많이 들며 확장성에 제한이 있습니다.
NUMA는 고성능 연결을 사용하여 비용 효율적인 여러 개의 작은 노드를 연결하는 대체 방법입니다. 각 노드에는 작은 SMP 시스템과 같이 프로세서 및 메모리가 포함되어 있습니다. 그러나 고급 메모리 컨트롤러를 사용하면 한 노드에서 다른 모든 노드의 메모리를 사용하여 단일 시스템 이미지를 만들 수 있습니다. 프로세서가 자체 노드 내에 있지 않은 메모리(원격 메모리)에 액세스할 경우에는 NUMA 연결을 통해 데이터를 전송해야 하며, 이 경우 로컬 메모리에 액세스할 때보다 속도가 느립니다. 기술 이름이 내포하듯이 메모리 액세스 횟수는 일정하지 않으며 메모리의 위치와 메모리에 액세스하는 노드에 따라 달라집니다.