Die beiden neuen Engines, gemeinsam mit leistungsfähigerem Computing für die Simulation und verbesserter Rasterung, stellen die Basis für eine neue Generation von Hybrid-Rendering für die Visual-Effects-Branche mit einem Jahresumsatz von 250 Milliarden US-Dollar. Hybrid-Rendering ermöglicht interaktive Erlebnisse in Kinoqualität und erstaunliche neue Effekte auf Basis neuronaler Netze und durchgängige Interaktivität in hochkomplexen Modellen. Auf der Siggraph wurden die ersten auf Turing basierenden Grafikprozessoren vorgestellt, wie Quadro RTX 8000, Quadro RTX 6000 und Quadro RTX 5000.
"Turing ist die wichtigste Innovation von Nvidia seit mehr als zehn Jahren", erklärte Jensen Huang, Gründer und CEO von Nvidia, auf der Siggraph-Konferenz in Vancouver. "Hybrid-Rendering wird die Branche verändern und erstaunliche Möglichkeiten eröffnen, die unser Leben mit schöneren Designs, besserer Unterhaltung und mehr interaktiven Erlebnissen bereichern. Die Einführung von Echtzeit-Raytracing ist der Heilige Gral unserer Branche."
Turing ist die achte GPU-Architektur-Generation von Nvidia, mit der die weltweit erste Raytracing-GPU entwickelt wurde. Sie ist das Ergebnis von einer Arbeitszeit von mehr als 10.000 in der Entwicklungsarbeit. Durch die Verwendung der Hybrid-Rendering-Funktionen von Turing können Anwendungen die physikalische Welt mit der 6-fachen Geschwindigkeit der vorherigen Pascal-Generation simulieren.
Um Entwicklern zu helfen, die Möglichkeiten der neuen Architektur voll auszuschöpfen, hat der Hersteller seine RTX-Entwicklungsplattorm um neue KI-, Raytracing- und Simulations-SDKs erweitert. Zudem wurde bekannt, dass eine Vielzahl wichtiger Grafikanwendungen für Designer, Künstler und Wissenschaftler die Vorteile der Funktionen von Turing über die RTX-Entwicklungsplattorm nutzen wollen. „Dies ist ein bedeutender Moment in der Geschichte der Computergrafik“, erklärte Jon Peddie, CEO des Analystenhauses JPR. So würde Nvidia Echtzeit-Raytracing fünf Jahre früher liefern, als wir Analysten es für möglich gehalten hätten.
Die Turing-Architektur ist mit speziellen Raytracing-Prozessoren (RT-Cores) ausgestattet, die die Berechnung der Wege von Licht und Ton in 3D-Umgebungen mit bis zu 10 Giga-Rays pro Sekunde beschleunigen. Turing beschleunigt Echtzeit-Raytracing mit der bis zu 25-fachen Geschwindigkeit der vorherigen Pascal-Generation. Zudem können GPU-Nodes für das finale Frame-Rendering von Filmeffekten mit mehr als der 30-fachen Geschwindigkeit von CPU-Nodes verwendet werden.
"Cinesite arbeitet mit Freude mit Autodesk und Nvidia zusammen, um Arnold auf die GPU zu bringen, aber wir hätten nie erwartet, dass die Ergebnisse so tiefgreifend sind", sagte Michele Sciolette, CTO von Cinesite. "Das bedeutet, dass wir schneller, häufiger und mit höherer Qualität iterieren können. Das wird die Arbeitsweise unserer Künstler völlig verändern."
Die Turing-Architektur verfügt auch über Tensor-Cores. Das sind Prozessoren, die Deep Learning und Inferencing beschleunigen und bis zu 500 Billionen Tensor-Operationen pro Sekunde umsetzen können. Dieses Leistungsniveau ermöglicht KI-erweiterte Funktionen, mit denen sich Anwendungen mit neuen Funktionalitäten erstellen lassen. Dazu gehören Deep Learning Anti-Aliasing (DLAA) das einen Durchbruch bei der Erzeugung hochwertiger Bewegtbilder darstellt und Rauschunterdrückung, Auflösungsskalierung und Video-Re-Timing ermöglicht.
Die genannten Funktionen sind Bestandteil des Nvidia NGX Software Development Kits, einem neuen Technologie-Stack, mit der Entwickler beschleunigte, verbesserte Grafik-, Foto- und Videoverarbeitung mühelos in Anwendungen mit vortrainierten Netzwerken integrieren können.
Turing-basierte GPUs verfügen über eine neue Streaming-Multiprozessor-Architektur, die eine Integer-Ausführungseinheit ergänzt, die parallel zum Fließkomma-Datenpfad ausgeführt wird. Darüber hinaus bietet sie eine neue einheitliche Cache-Architektur mit der doppelten Bandbreite der vorherigen Generation. Kombiniert mit neuen Grafiktechnologien wie Shading mit variabler Rate erreicht der Turing SM eine bisher unerreichte Leistung pro Core. Mit bis zu 4.608 Cuda-Cores unterstützt Turing bis zu 16 Billionen Gleitkommaoperationen parallel zu 16 Billionen ganzzahligen Operationen pro Sekunde.
Entwickler können die Vorteile von Cuda 10-, FleX- und PhysX-SDKs nutzen, um komplexe Simulationen wie Partikel oder Fluid-Dynamiken zu erstellen, wie sie bei der wissenschaftlichen Visualisierung und für virtuelle Umgebungen und Spezialeffekte benötigt werden.
Autor: Stefan Girschner