Gerade Forschungseinrichtungen haben häufig keinen vollwertigen Zugriff auf Super-Computing-Systeme. Hinzu kommt der Trend, dass immer mehr High-Performance-Computing-Technologien benötigt werden, um rechenintensive Anwendungen wie Deep Learning, Simulationen oder Virtual Reality auszubauen und so die Forschung im Bereich künstlicher Intelligenz zu fördern.
Mit dem Tesla P100 will der Hersteller die gestiegenen Rechenanforderungen mit der hohen Performance der Nividia-Pascal-GPU-Architektur erfüllen. So ermöglicht die neue Technologie die Entwicklung von „Superknoten“, die laut Testangaben von Nvidia den Durchsatz von mehr als 32 herkömmlichen CPU-basierten Rechenknoten bei bis zu 70 Prozent geringeren Kosten erlauben.
Der Tesla P100 wird im PCIe-Standardformat angeboten und ist mit aktuellen GPU-beschleunigten Servern kompatibel. Diese wurde optimiert, um die rechenintensivsten Anwendungen für künstliche Intelligenz und HPC-Rechenzentren weiterentwickeln zu können. Ein einziger mit dem Tesla P100 beschleunigter Server liefert eine höhere Leistung als 50 einzelne CPU-Serverknoten bei Ausführung des Molekular-Dynamik-Codes von Amber (gemäß Simulations on SDSU Comet Supercomputer) und ist laut Testangaben schneller als 32 CPU-Knoten bei Ausführung der VASP-Materialwissenschaftsanwendung.
Noch in diesem Jahr sollen die Tesla-P100-Beschleuniger für PCIe, die die Tesla Accelerated Computing Platform von Nvidia erweitern, im Rahmen eines Upgrades in Europas schnellstem Supercomputer, dem Piz-Daint-System im Swiss National Supercomputing Center in Lugano, zum Einsatz kommen.
„Tesla-P100-Beschleuniger bieten neue Ebenen an Leistung und Effizienz, um einige der wichtigsten Rechenherausforderungen unserer Zeit meistern zu können“, erklärt Thomas Schulthess, Professor für Computational Physics an der ETH Zürich und Direktor des Swiss National Supercomputing Center. Er ist überzeugt, dass das Upgrade von 4.500 GPU-beschleunigten Rechenknoten in dem Piz-Daint-System zu den Tesla-P100-GPUs die Leistung des Systems mehr als verdoppeln werde und somit Durchbrüche in Anwendungsbereichen wie Kosmologie, Materialwissenschaften, Seismologie und Klimawissenschaften ermöglichen werde.
NVIDIA Tesla GPU-Beschleuniger
Hohe Anwendungs-Performance für gemischte HPC-Workloads: Sie bietet 4,7 Teraflops Double-Precision- beziehungsweise 9,3 Teraflops Single-Precision-Peak-Performance. Ein einziger Pascal-basierter Tesla-P100-Rechenknoten bietet die Leistung von mehr als 32 herkömmlichen CPU-Servern.
Die Tesla P100 für PCIe-basierte Systeme ist in zwei Konfigurationen erhältlich: mit 16 GB CoWoS HBM2 Stacked Memory für 720GB/Sek Memory-Bandbreite und mit 12GB CoWoS HBM2 Stacked Memory, für 540GB/Sek Memory-Bandbreite. Laut Nvidia wird der Tesla P100 voraussichtlich zu Beginn des vierten Quartals 2016 verfügbar sein.