NUMA-Systeme sind erweiterte Serverplattformen mit mehr als einem Systembus. Sie können eine große Anzahl von Prozessoren in einem einzelnen System-Image mit ausgezeichnetem Preis-Leistungs-Verhältnis nutzen.
Eine CPU mit mehreren GHz muss mit einer großen Menge an Arbeitsspeicherbandbreite bereitgestellt werden, um ihre Verarbeitungsleistung effektiv nutzen zu können. Selbst eine einzelne CPU, auf der eine arbeitsspeicherintensive Arbeitslast ausgeführt wird, wie z. B. eine Computing-Anwendung, kann durch die Arbeitsspeicherbandbreite eingeschränkt werden.
Dieses Problem verschärft sich bei symmetrischen Multiprozessorsystemen (SMP), bei denen viele Prozessoren um die Bandbreite auf demselben Systembus konkurrieren müssen. Einige High-End-Systeme versuchen oft, dieses Problem zu lösen, indem sie einen Hochgeschwindigkeits-Datenbus erstellen. Eine solche Lösung ist jedoch teuer und in ihrer Skalierbarkeit begrenzt.
NUMA ist ein alternativer Ansatz, der mehrere kleine, kostengünstige Knoten mithilfe einer Hochleistungsverbindung verbindet. Jeder Knoten enthält Prozessoren und Arbeitsspeicher, ähnlich wie ein kleines SMP-System. Ein erweiterter Arbeitsspeicher-Controller ermöglicht einem Knoten jedoch die Verwendung von Arbeitsspeicher auf allen anderen Knoten, wodurch ein einzelnes System-Image erstellt wird. Wenn ein Prozessor auf Arbeitsspeicher zugreift, der nicht innerhalb seines eigenen Knotens (Remotearbeitsspeicher) liegt, müssen die Daten über die NUMA-Verbindung übertragen werden, die langsamer ist als der Zugriff auf lokalen Arbeitsspeicher. Die Zugriffszeiten auf den Arbeitsspeicher sind nicht einheitlich und hängen, wie der Name der Technologie schon sagt, vom Speicherort und dem Knoten ab, von dem aus der Zugriff erfolgt.