NUMA-Systeme sind erweiterte Serverplattformen mit mehr als einem Systembus. Sie können eine große Anzahl an Prozessoren in einem einzigen System-Image nutzen und bieten dabei ein attraktives Preis-Leistungs-Verhältnis.
Innerhalb der letzten zehn Jahre ist die Prozessortaktfrequenz deutlich angestiegen. Eine CPU mit mehreren Gigahertz muss jedoch mit einer sehr umfangreichen Arbeitsspeicherbandbreite ausgestattet sein, um seine Prozessorleistung effektiv nutzen zu können. Selbst eine einzelne CPU, die eine arbeitsspeicherintensive Arbeitslast ausführt (z. B. eine wissenschaftliche Rechenanwendung), kann durch die Arbeitsspeicherbandbreite eingeschränkt werden.
Dieses Problem tritt bei symmetrischen Multiprozessorsystemen (SMP) verstärkt auf, da zahlreiche Prozessoren auf demselben Systembus um die verfügbare Bandbreite konkurrieren müssen. Einige High-End-Systeme versuchen häufig dieses Problem durch das Erstellen eines Hochgeschwindigkeits-Datenbusses zu lösen. So eine Lösung ist jedoch teuer und in ihrer Skalierbarkeit beschränkt.
NUMA ist ein alternativer Ansatz, der kleine kostengünstige Knoten über eine Hochleistungsverbindung verknüpft. In jedem Knoten sind sowohl Prozessoren als auch Arbeitsspeicher enthalten, ähnlich wie in einem kleinen SMP-System. Mithilfe eines erweiterten Arbeitsspeicher-Controllers kann ein Knoten jedoch den Arbeitsspeicher aller anderen Knoten nutzen und ein einziges System-Image erstellen. Greift ein Prozessor auf Arbeitsspeicher zu, der sich nicht innerhalb seines eigenen Knoten befindet (Remotearbeitsspeicher), müssen die Daten über die NUMA-Verbindung übertragen werden. Dieser Vorgang ist langsamer als der Zugriff auf lokalen Arbeitsspeicher. Abhängig davon, wo sich der Arbeitsspeicher befindet, sind die Arbeitsspeicherzugriffszeiten nicht einheitlich, wie der Name der Technologie bereits sagt.