RENDER ZONE

http://www.ontmoeting.nl/renderzone/

homepage

andere Benchmarks

nov. 2017

 

Op deze pagina

 

Stelling

V-Ray hybride renderen
 
GP100
 
NVLink
 
V-Ray Benchmark in de praktijk
 
Voorlopige conclusie
 
Documentatie
 
Dealers en misinformatie

 

Stelling

The Industry standard

https://www.chaosgroup.com/vray/sketchup

Deze stelling wordt op geen enkele manier ondersteund door enig bewijs. We zien dergelijke reclame kreten bij concurrende render programma's ook regelmatig terugkomen. Indien we ze naast elkaar zetten krijgen we een hele lijst van merken die allemaal het meest door architecten worden gebruikt . . .

 
 

V-Ray CPU-GPU Hybride renderen nader bekeken

 
Link Understanding V-Ray Hybrid rendering
 
 
 
Op bovenstaande onderzoekspagina gaan de V-Ray ontwerpers in op het probleem, dat het programmeren met CUDA GPU een tijdrovende kwestie is. Dat hadden ze op voorhand al kunnen weten. We slaan eenvoudig de geschiedenis van Octane er op na (en evt. Iray), om er achter te komen dat de eerste jaren er geen geld kan worden verdiend, omdat er geen goed werkend en compleet CUDA programma kan worden getoond!
 
V-Ray vervolgd op de internetpagina: "indien in de testfase het programma crashed, dan komt er alleen een Kernel dump in beeld, zonder enige andere indicatie waar in welke CUDA programmeer regel een mogelijke fout schuil gaat."
 
Hoofd GPU-ontwerper bij Chaos Group Blago Taskov had het idee om de CUDA code over te brengen, te transporteren naar de CPU. Om de CUDA programmeercode in de CPU te draaien zijn veel betere debug gereedschappen beschikbaar om direct aan te geven waar evt. problemen zich in de code bevindt. Maar daar bleef het niet bij, hij bedacht dat als het mogelijk was om CUDA programma's op een CPU te laten draaien middels emuluatie, moest het ook mogelijk zijn om zowel de CPU als de GPU met dezelfde CUDA code aan het renderwerk te zetten. Met als voordeel dat de CUDA code in de CPU exact gelijk was aan dat van de GPU, waardoor dezelfde eindresultaten kunnen worden bereikt. Daarmee werd V-Ray Hybrid rendering officieel geboren.
 
Het is hip om GPU rendering aan te bieden. Een hype, met in het achterhoofd dat ECHT GPU renderen met OpenCL of CUDA nog vele malen sneller zal gaan in de toekomst, dan we nu al zien. De potentie in de grafische processoren is aanwezig en wordt elk halfjaar nog beter en sneller.
 
Naar de gebruikers toe, maar ook voor de ontwerpers is het opzetten van een Benchmark test een interessante bron van informatie. Vandaar dat V-Ray (in navolging van bv. Corona en anderen) dat nu ook heeft gedaan.
 
Daarmee wordt duidelijk:
 
a) welke computer configuraties er zoal in de markt worden gebruikt
 
b) welke van die configuraties beter of minder presteren dan andere
 
c) waar het accent van GPU en CPU versus ligt
 
d) welke variaties er allemaal zouden kunnen worden gevonden met een bepaalde hardwareconfiguratie, ten opzichte van de overige componenten van de computer. Zoals hoeveelheid RAM geheugen, bussnelheid van het moederbord, controlers intern of extern, PCI Express configuraties en last but no least de grote range van NVIDIA GPU's.
 
 
Om de Benchmark te kunnen uitvoeren moest het mogelijk zijn om twee maal een rendering van een scene uit te voeren. Eénmaal met de CPU alleen (CPU Render Engine, de oude vertrouwde manier). En éénmaal met een andere speciaal daarvoor uitgezochte scene met de GPU en de CPU om de tweede Hybrid render Engine te kunnen testen.
Er is ook nog een derde manier, die op de V-Ray website wordt gebruikt: met de GPU CUDA alleen, deze is echter niet voor de gebruikers uit te voeren, omdat het aantal Engines in het renderprogramma tot 2 beperkt is.
 
 
 

Ondermeer in gebruik bij Chaos Group:

2 x Intel Xeon CPU E5-2687W v3 3.10 GHz,
total of 40 logical CPU cores
RAM: 128 GB
GPU's: 2 x NVIDIA Quadro GP100 with 16 GB each,
total of 7,168 GPU cores
Geschatte prijs werkstation 21.000,- Euro
 
 
schermafdruk van scene rendering (Dabarti Studio) met V-Ray Hybrid op 2 High-end grafische kaarten en meerdere Xeon processoren bij Chaos Group.
 
 
 
  
High-End componenten in dit werkstation, aan de hand van de specificaties van Intel en NVIDIA
 
Voor onderzoek van willekeurige CPU raadplegen we zoals steeds eerst de ark.intel.com site voor een gedegen eerste overzicht
 
E5-2687WV3 (2 stuks)
E5 familie, voor speciale 2-socket server workstations
daarvoor als codenaam meegekregen Haswell
in het derde kwartaal van 2014 gełØntroduceerd.
volgens 22 nm lithografie uitgevoerd
prijs ca. $ 2.141,- / stuk
 
10 Cores, 20 Threads
Basis kloksnelheid 3.10 GHz
Max. Turbo kloksnelheid 3.50 GHz
Cache 25 MB Smart Cache
Bus Speed intern 9.6 GT/s QPI
aantal QPI Links 2
opgenomen vermogen 160 Watt
Max. aan te sturen RAM geheugen 768 GB, type DDR4 1600 / 1866 / 2133
Max. aantal geheugen kanalen 4
Max. geheugen bandbreedte 68 GB/s
ECC geheugen ondersteuning
PCI Express versie 3.0 met configuraties van x4, x8 en x16 (uit te voeren op het moederbord)
Max. aantal PCI Express Lanes 40
Max. aantal CPU's in combinatie 2 stuks
 
Haal de product gegevens van deze Intel familie op:
https://www.intel.com/content/dam/www/public/us/en/documents/product-briefs/xeon-e5-brief.pdf
 

NVIDIA chip
 
 
2 stuks NVIDIA Quadro GP100 grafische kaarten
 
GP100 bij PNY
http://www.pny.com/nvidia-quadro-gp100
 
Datasheet NVIDIA GP100 PDF
 
3584 CUDA Cores
NVLINK 2 GP100 boards ondersteund
Form Factor Dual slot
GPU geheugen 16 GB HBM2
4096 bit geheugen interface
max. 717 GB/s geheugen bandbreedte
 
 
* Dubbele precisie FP64 5.3 TFLOPS (veel bij HPC toepassingen. Sporadisch gebruikt bij renderen, wordt door renderfabrikant bijna nooit opgegeven)
GP100 is speciaal voor dit zware lineaire rekenwerk ontwikkeld.
 
* Enkele precisie FP32 10.6 TFLOPS (veel gebruikt bij renderen)
Halve precisie FP16 21.2 TFLOPS (veel gebruikt bij Deep Learning algoritmes)
 
* Niet helemaal, maar bijna het dubbele bij eenvoudiger drijvende komma berekeningen zoals veelvuldig tijdens het maken van de rendering wordt toegepast.
Daarmee scoort de GP100 duidelijk beter, dan alle voorgaande kaarten, alleen of het reël is om dat allemaal in ogenschouw te nemen gezien de High-End prijs van ruim $ 7.000,- per stuk (bij Bol voor 8.000,- en een beetje), in wezen NIET.

Als we het van de technische kant beoordelen en naar de geschiedenis kijken, dan zien we dat nieuwe technologiën bij NVIDIA al vrij snel ook bij lagere meer gangbare prijsklassen wordt toegepast, waarbij prijsdalingen van 50% en meer niet ongebruikelijk zijn. Er is nu al sprake van een "goedkopere" variant van de GP100 met duizenden CUDA cores die zal worden uitgebracht.
 
 
 
Hier zien we GP100 in de acceleratiekaart Tesla P100. De Tesla P100 is uitgebracht als rekenkaart, die in NVIDIA's supercomputers DGX-1 zijn geïnstalleerd. Om na enkele maanden na de introductie met een PCI Express uitvoering op de markt te verschijnen, die met 12 of 16 GB HBM2 geheugen overweg kan. Wordt ook al ingezet om intelligente beslissingen over ruisvermindering na het maken van de rendering uit te voeren.
 
  
Speedup Haswell ten opzichte van grafische reken eenheden. NVIDIA onderzoek.
 
 

White paper NVIDIA PDF over Tesla: puur techniek

Hier zien we de blauwe stippellijn de snelheid van een standaard 2 x Haswell Intel CPU.
De diverse grijze en groene staven geven de configuratiesnelheid aan van 2 stuks P100 (licht groen).
Met deze grafiek in gedachten gaan we later berekeningen maken. Waarbij we het gemiddelde uitvoeren van 4.5, 10, 6, 7, 13 en 19 = 59,5 / 6 = 9,9
ronden we naar boven af naar 10 x hogere rekensnelheid ten opzichte van een dual Intel CPU Haswell. Aangezien Haswell al weer op leeftijd is (vierde generatie, opvolger van de Ivy Bridge 22 nm microarchitectuur) kiezen we hier geen 10 maar 8 als kengetal. Haswell officiële introductiedatum was 4 juni 2013. We herkennen de vierde generatie consumenten Intel processoren aan het eerste getal van het typenummer, bij Core i7 dus bv. 4770K. Bij Xeon processoren is dat heel anders opgezet. Een 10 Core/ 20 Thread 2660v3 Xeon is ook volgens Haswell architectuur opgebouwd, hier zien we de v3 van de 3de generatie Xeon series. De introductie datum van de Xeon processoren is altijd later dan de consumenten uitvoeringen, we zien typen in derde kwartaal 2014, eerste kwartaal en tweede kwartaal 2015 uitkomen.
http://ark.intel.com/products/series/78583/Intel-Xeon-Processor-E5-v3-Family
 
 
Pascal GP100
scherm afdruk Pascal GP100 Full GPU met 60 SM Units.
SM = Streaming Multiprocessors
 

 
 

NVLink

 
NVIDIA biedt twee mogelijke configuraties:
 
* GPU-naar-GPU NVLink verbinding
 
* CPU-naar-GPU NVLink verbinding
 
De eerste optie is voor het koppelen van 2 GPU's met elkaar, waardoor het geheugen kan worden opgeteld. De CUDA cores konden al worden opgeteld, waardoor we met de GP100 uitkomen op:
 
NVIDIA Powers New Class of Supercomputing Workstations with Breakthrough Capabilities for Design and Engineering Sunday, February 5, 2017
 
 
 
De CPU NVLink configuratie is wellicht in dit V-Ray super werkstation toegepast, gegevens ontbreken echter. Indien deze actief zou zijn, dan is er een veel betere doorstroom en uitwisseling van de geheugen data mogelijk tussen GPU en CPU. Waardoor de Hybride test veel sneller uit de verf zou komen.
Naar alle waarschijnlijkheid is de eerste configuratie gebruikt voor de koppeling van de 2 GP100 geheugens om één groot VRAM geheugen te maken van 32 GB ! Waardoor ook de fors grotere 3D modellen met alle materialen gemakkelijk een plaatsje kunnen krijgen, zonder dat de veel langzamer manier naar RAM geheugen behoeft te worden aangesproken. Het uitwisselen van de gegevens met het veel langzamer RAM zal dan nauwelijks voorkomen.
Allemaal ideale bijna theoretische omstandigheden, die geen enkele relatie hebben met bv. de door Chaos Group opgegeven minimale technische gegevens, waarbij uit wordt gegaan van een Pentium IV processor (vanaf $ 5,-) bij de opgave van de minimale hardware vereisten.
 
 
 
Pascal Lineup
http://www.nvidia.com/object/quadro-desktop-gpus.html
 
De techniek van NVIDIA om meerdere nieuwe High-End GPU's met elkaar te koppelen wat geheugen betreft, zodat er één groot VRAM werkgeheugen ontstaat. Waardoor de bottleneck van "te weinig video geheugen bij scenes" voor een groot deel komt te vervallen.
 
De CPU koppeling met de GPU zou interessant zijn voor Hybride render toepassingen, aangezien voor High-End toepassingen de grens van de huidige PCI E 3 wel in zicht komt. Maar we hoeven niet meer zo lang te wachten tot de volgende versie van PCI E 4 uit zal komen, met bijna de dubbele doorvoersnelheid, de processoren moeten daar dan wel geschikt voor gemaakt worden.
En de volgende generatie, daar wordt ook al aan gedacht met wederom een versnelling van 2 x.
 
Terug naar de huidige PCI Express Generatie 3 mogelijkheden. Met de speciale NVLink configuratie is het mogelijk om de CPU tot 5 x snellere bandbreedte te laten werken, ten opzichte van de bestaande PCI E configuratie. Hetgeen hybride renderen nog aantrekkelijker zou kunnen maken. Mits de gebruiker de mogelijkheid heeft om veel in een werkstation te investeren.
Op dit moment hebben we vergelijkbare terugeschaalde uitvoeringen van d.e GPU's uit de Pascal serie de P1000 voor ca. 470 euro, P2000 670 euro, P4000 1.300 euro en de P6000 met 5000,- euro.
 
Waarbij de P2000 en P4000 aantrekkelijke mogelijkheden zijn om toch over veel CUDA cores en rekenkracht te beschikken, maar tegen een normaal prijsniveau, in overeenstemming met de rest van de configuratie en het doel. We kunnen het maken van een rendering wel in de wetenschappenlijke en onderzoekswereld halen, maar in de praktijk blijkt dat bij architecten in de meeste gevallen gewone goede grafische computers staan. Een groter architecten bureau kan kiezen om renderingen uit te besteden, of zelf in een of meerdere werkstations te investeren. Waarbij de grens van de Windows investering op max. 4.000 Euro komt te liggen per werkstation.
De reden van de Chaos Group om met behulp van zo"n Ferrari / McLaren achtig werkstation te werken en te demonstreren (YouTube) is onduidelijk. We vergeten al gauw dat 95% van de klantenkring over een computer / werkstation beschikt dat 1 / 7 van deze prijs bedraagt.
 
 
* NVLink GPU naar CPU verbinding
 
* NVLINK GPU naar CPU met 2 NVLinks van CPU naar elke GPU. De overblijvende twee links op elke GPU wordt hierbij als peer-to-peer communicatie kanaal toegepast.
 

 
Chaos Group publiceert deze twee rendertesten, gemaakt met dit superwerkstation. De uitkomst daarvan vertalen naar normale werkstations of gewone computers is minder eenvoudig dan gedacht. Dat komt zowel door de Xeon dual processor als door de koppeling van de 2 super grafische kaarten. Deze combinatie maakt het lastig om voor de eigen hardware combinatie een goede inschatting te kunnen maken.
 
https://labs.chaosgroup.com/index.php/rendering-rd/understanding-v-ray-hybrid-rendering/
 
 
Mars Rover scene
 
Engine: V-Ray 3.6 CUDA
Resolution: 1920x1080
Noise threshold: 0.01
 
GPU's + CPUs
Time: 4:27 (267s)
 
GPU's only
Time: 5:03 (303s)
13% longer than GPU + CPU
 
CPU's only
Time: 26:25 (1585s)
520% longer than GPUs alone
 
 
Salt and Pepper scene
 
Engine: V-Ray 3.6 CUDA
Resolution: 1920x1080
Noise threshold: 0.01
 
GPU's + CPUs
Time: 9:11 (551s)
 
GPU's only
Time: 11:33 (693s)
25% longer than GPU+CPU.
 
CPU's only
Time: 40:52 (2452s)
354% longer than GPU alone.
 
Nemen we het gemiddelde van allebei de scenes en vergelijk de CPU rendering (Engine) met die van de hybride dan komen we aan 4,9 x sneller, dankzij de grafische kaart combi. Maar de regel eronder "For these scenes, the addition of CPUs helped reduce render times by 13% and 25%. It's a welcome speed boost, rather than leaving these powerful CPUs idle." zet deze veronderstelling geheel op losse schroeven.
 
De uitkomst is op geen enkele wijze te controleren of te herleiden in de GPU lijst met rendertijden. Ze zijn door "niemand" te verifiëren door de enorme prijs van de gebruikte computerhardware: meer dan 21.000 euro, en de Quadro M4000 (die er ook nog in zit) hebben we nog niet opgeteld.
De test met de GPU (alleen CUDA renderen) kunnen zelf niet uitvoeren, omdat de CUDA Engine alleen bij de ontwikkelafdeling van V-Ray aanwezig is.
 
In YouTube video's van derden vernemen we dat de Hybride tijdwinst ca. 20% bedraagt, ten opzichte van renderen met de CPU alleen. Dat lijkt een redelijk gemiddelde tijdwinst met deze methode en met de normale gangbare hardware.
 
Chaos Group stelt dat het eenvoudig aantrekkelijk is om ook de mogelijkheid van Hybride renderen te hebben, "dan kunt u de CPU+ de GPU aan het werk zetten". Dat is juist. Alleen de snelheidswinst die op dit moment behaald kan worden met een "super high-end" NVIDIA CUDA kaart is LAAG bij deze V-Ray versie van de Engine software (aug. 2017). Dat zal in de loop van de tijd aanzienlijk verbeterd kunnen worden.

 

 

V-Ray Benchmark in de praktijk

 
Op de tweede plaats zien we (niet) verrassend de GeForce GTX 1080 Ti kaart
 
Intel Core i7-6900K CPU @ 3.20GHz x16, GeForce GTX 1080 Ti 11264MB x7 (introductie tweede kwartaal 2016, Broadwell E serie)
Allemaal met Windows 10 en zelfde driver versie. Waarbij de GPU tijd schommelt tussen de 00:16.091 en 00:16.422 ( gemiddelde 16.256 )
De toegepaste CPU komt op ca. 1.100 euro met 8 Cores en 16 Threads en 3.2 GHz snelheid.
 
We zien in de lijst de 1080 Ti regelmatig terugkomen, op de 109 plaats met 00:31 en verder, op de 414-475 plaats met aanvangstijd 1:04 en ook op de 601 plaats met 01:24.
 

Nemen we als steekproef de 601 plaats in de Benchmark

 
601 01:24.173 Intel(R) Xeon CPU E5-2670 0 @ 2.60GHz x32, GeForce GTX 1080 Ti 11264MB
Dit is een processor (Sandy Bridge) die uit het programma is gehaald. Introductie was eerste kwartaal 2012, expected discontinuance tweede kwartaal 2015. 8 Cores en 16 Threads. Hier staat vermeld dat het om x32 gaat, dus kennelijk twee processoren (elk ca. 1.500 euro).
 
Vergeleken met de nummer 2 met 00:16.091 levert dat een versnelling op van 5 x, allebei met dezelfde grafische kaart. Maar met verschillende processoren en jaartallen.
 
De eerste Maxwell (inmiddels vervangen) M4000 kaart komt op nummer 18, maar daar zit ook een GP100 bij, de M4000 wordt voor de schermafwikkeling gebruikt. Tijd 00:19.
De tweede M4000 alleen in de PC komt op plek 248 met 00:44.949 rendertijd.


Belangrijke ENGINE verschillen

 
V-Ray Hybrid and V-Ray Production renderer
 
It's important to note that the V-Ray Hybrid (GPU–CPU CUDA) renderer is not the same as the V-Ray Production (CPU) renderer, and the two engines will continue to remain separate.
 
 
GPU cores vs. CPU cores
 
While V-Ray Hybrid can render on CPUs and GPUs simultaneously, CPU cores and GPU cores are not the same. For example, a GPU with 2560 cores is not simply 320 times faster than an 8 core CPU. To determine the actual speed difference, real-world benchmark tests are required.
Tags: 3ds max, GPU, V-Ray, V-Ray 3.6, V-Ray RT.
 
https://labs.chaosgroup.com/index.php/rendering-rd/understanding-v-ray-hybrid-rendering/
  
But really, if you're interested in going GPU-rendering, you should at least check their F.A.Q on website (Redshift, Octane, Arion, iRay, Thea, VrayRT-GPU....).

 

GPU Benchmark V-Ray

 
We zeiden het al in de V-Ray CPU Benchmark: de lijst voor GPU (CUDA) gebruik is een eye-opener.
 
Bij deze test wordt de afbeelding met Ray tracing toegepast met een andere scene dan bij de CPU Benchmark test, waarbij de NVIDIA CUDA technologie wordt gebruikt, dus geen OpenGL, OpenCL of DirectX van de grafische kaart. Maar de GPU wordt niet alleen gebruikt, ook de processor doet mee. De Chaos Group noemt dat Hybride renderen, waarbij alle (motor) kracht van zowel de computer als de GPU worden benut.
In het algemeen zal met de GPU de rendering sneller gaan, maar dat is uiteraard sterk afhankelijk van de gebruikte scene en software versie.
Chaos Group noteerd ergens anders dat de GP 100 (het huidige topmodel van NVIDIA) ongeveer 30 % sneller werkt dan de voorgaande Titan X (Pascal arch.)
 
De nieuwe NVIDIA P6000 blijkt ongeveer gelijk op te gaan met de Titan X, maar de P6000 heeft het dubbele VRAM geheugen en mogelijkheid om het geheugen te koppelen (bij de P6000 nog niet uitgeprobeerd, Chaos Group heeft het wel voor de GP 100 gedaan).
 
 
Snelste rendertijd uit de GPU Benchmark ooit
 
00:14.359
Intel Core i7-6950X @ 3.00 GHz x 20, Quadro GP100 16384 MB x 4
de corresponderende CPU tijd van deze computer bedraagt 1:02.890 of te wel 62.890 De GP 100 van NVIDIA komt op een gemiddelde straatprijs van ca. 8.000 euro (PNY)
Deze superkaart doet bij NIVDIA 3584 CUDA Parallel processing Cores, 16 GB HBM2 geheugen en de volgende floating point berekeningen
FP64 = 5.2 TFLOPS
FP32 = 10.3 TFLOPS
FP16 = 20.7 TFLOPS
Opgenomen vermogen is 235 W.
Dual PCI Express 3.0 x 16 slot
 
We hebben sterk het vermoeden dat deze computer en de grafische kaart in een van de werkstations van de Chaos Group zelf te vinden is, waar ook de YouTube films mee worden gemaakt.
 
 
De langste rendertijd
1918 47:16.911 Intel Core i7-3720QM CPU @ 2.60 GHz x8, Quadro K1000M 2048 MB
2836.911, of te wel 198 x zo langzaam, dit is dus het dynamisch bereik dat met gebruikmaking van goede GPU's kan worden gemaakt.
 
 
Bezien we de nummer 1 uit de lijst
1 00:14.359 Intel Core i7-6950X CPU @ 3.00 GHz x20, Quadro GP100 16384 MB x4 1
Dan merken we op dat de processor i7-6950X @ 3.00 GHz in het tweede kwartaal van 2016 is geïntroduceerd met 14 nm lithografie en 10 Cores en 20 Threads.. De prijs komt op $ 1.723,-.
De Quadro GP100 is een van de beste grafische kaarten van dit moment NVIDIA en ook een van de meest kostbare.
 
http://www.nvidia.com/object/quadro-graphics-with-pascal.html
 
 
 
============================================================================

Voorlopige conclusie

============================================================================
 
We kunnen voorlopig concluderen, dat de aanschaf van 2 stuks GP100 (14.000 euro) in het geheel niet zinvol is. Sterker nog het is voor het gebruik van V-Ray totaal overbodig. Met als ondersteuning van deze bewering de GPU Benchmark lijst. Een ieder die er andere en zelfs tegenstelde mening op na houdt wordt van harte aanbevolen om te reageren, wij ruimen gaarne plaats in voor andere meningen.
 
In deze uitvoeringen (V-Ray versies 3.5 en 3.6 met de diverse 3D programma's) wordt gemiddeld 20% verbetering geconstateerd met Hybride renderen en dat is vrijwel onafhankelijk van de gebruikte grafische kaart!
 
Dat betekent dat de grafische kaart weliswaar met CUDA wordt aangestuurd, maar waarbij de CPU toch nog steeds veel van de workload op zich neemt. We mogen dan ook voorzichtig verwachten dat in de toekomst het render programma (Engine) nog verder zal evalueren tot nog meer CUDA snelheid.
 
Dan komen we op het aantal beperkingen van Hybride renderen (die zijn er altijd en bij elk merk). In eerste instantie de CUDA kaart (AMD met OpenCL werkt hierbij niet), dan het nog niet ondersteunde geheugen koppeling tussen de kaarten onderling (bij V-Ray alleen nog met de GP100). SLI is uiteraard mogelijk, waarbij we de CUDA Cores kunnen optellen, soms doet de software dat al automatisch. Maar in deze opzet is die investering (afgezien van andere behoeften) eigenlijk overbodig. Indien het toch op een 2-GPU kaarten uitdraaid, dan is het handig om de snelste met de meeste CUDA cores te laten rekenen en de langzamer (enkele honderden euro's) te gebruiken voor het aansturen van het scherm. Nogmaals het is niet nodig met deze opzet.
 
Investeren in een (veel) meer dan 4-cores processor met redelijke snelheid in GHz (belangrijk voor het tekenprogramma) kan direct worden omgezet in veel meer snelheidswinst, dan met welke GPU investering dan ook in deze situatie. De bewering gaat niet op voor een NVIDIA kaartje van 200 euro, maar voor de (op dit moment) nieuwe Pascal serie, waarbij we zelf de ondergrens bij de P1000 zouden willen leggen. De bovengrens ligt aan het budget, bv. de P2000, P4000 of P6000.
 
http://www.ontmoeting.nl/renderzone/106-quadro29mrt.html#lijn
 

 

HET IS HIP OM MEE TE GAAN OP DE WEG VAN echt goede 100% GPU render programma's. Maar dan dient het wèl zó te gebeuren dat de gebruiker een TRANSPARANT beeld krijgt van de mogelijkheden. Of dat nu Hybride is of CUDA (of OpenCL) gebaseerd.
 
Ook bij de introductie van V-RAY voor SketchUp versie 3.6 (compatibel met SketchUp Pro 2018) wordt er alles aan gedaan om de gebruiker in dit opzicht op het verkeerde been te zetten op de website van de Chaos Group. Mede door de al jaren gekopieerde systeemeisen die geen relatie meer met de markt hebben.
 
 
powerful GPU Rendering
Terwijl het bij V-Ray slechts 10 -15 % UITMAAKT van wat de GPU werkelijk zou moeten doen.
 
 
CPU & GPU Rendering modes
Ook zien we hier dat alle kracht in de computer (dus inclusief de grafische kaart) aan de gang kan worden gezet. En dat is natuurlijk fantastisch nieuws voor elke gebruiker.
Maar indien we de Benchmarks goed bestuderen, dan blijkt dat de GPU maar heel weinig bijdraagt aan het hele renderproces op dit moment (eind 2017).
 
Waarom is dat zo belangrijk?
 
Het is belangrijk omdat de gebruiker van een willekeurig render programma GOED VOORAF MOET KUNNEN AFWEGEN hoe zijn nieuwe computer (hardware) er uit moet komen te zien om er zo goed en snel mogelijk mee te kunnen werken.
 
 
De gras- en stoffen functie in V-Ray is een bijzonder prettige uitbreiding van de mogelijkheden. Hou er als gebruiker echter wel terdege rekening mee dat bijna elke computer tot stilstand wordt gebracht. Behalve dan de 21.000 euro computers met 2 Xeon processoren, die en pasant door de Chaosgroup zelf worden gebruikt voor de vlotte YouTube filmpjes. Dat het een zware toepassing is, is geen geheim, ook bij andere renderprogramma's is het ronduit een hele klus om het te handelen.
 
* Stappen we af van het idee dat we echt een NVIDIA Quadro kaart nodig (zouden) hebben, dan kunnen we een nog véél aantrekkelijker CPU gebaseerde configuratie samenstellen voor een fractie van de prijs. En dat is een goed alternatief.
Maar een NVIDIA kaart is wel aantrekkelijk ook voor SketchUp Pro gebruik:
De GTX 1080 Ti is zo'n superkaart met 3.584 CUDA cores en 11 GB VRAM geheugen.
Loop de V-Ray GPU Benchmark lijst maar door, u zult daar heel willekeurig dezelfde typen grafische kaart typenummers tegenkomen, het is een soort Random Walk. Dat komt omdat de CPU nog steeds (ook bij Hyrbride renderen) de hoofdmoot voor zijn rekening neemt. Dat zal wellicht in de loop van de tijd nog verder worden verbeterd. We tekenen dit op, eind 2017.
 
 
* Stappen we ook nog van het idee van Hybride renderen in deze vorm af en we vergeten de sales en advertentie teksten op veel websites inclusief van de fabrikant gekopieerde teksten bij importeur(s) en dealer(s). We investeren in een goede i7-, i9- of Xeon processor met 6 - 12 of meer Cores, waarbij de GHz snelheid ook lekker hoog komt te liggen.
We hebben dan het voordeel van alle opties uit de V-Ray CPU ENGINE. En tevens passen we meer RAM geheugen toe, dan u gewend bent. Zie de huidige Benchmark's maar.
De ENGINE van V-Ray wordt nu ook als SDK op de markt gebracht, voor een ieder die daaromheen zijn eigen renderprogramma wil bouwen.
 
* We kunnen ook nog een stap verder gaan, we vergeten Intel CPU's en oriënteren ons op AMD met de nieuwe, prijsgunstiger CPU's met meerdere Cores en interessante snelheden. In de GPU Benchmark lijst komen we ze al in de bovenste regionen tegen.
 
* Systeem gegevens bij Chaos Group
 
System Requirements versie 2.0 staat nog steeds op de website
https://docs.chaosgroup.com/display/VRAY2SKETCHUP/System+Requirements
De teksten over Support zijn niet bijgewerkt, 2018 is nog vergeten.
Geen woord over de nieuwe 3.x versies of over de benodigde grafische kaart.
 
Op deze pagina wordt helemaal geen V-Ray versie genoemd, de gebruiker moet er dan maar naar raden.
https://docs.chaosgroup.com/display/VRAYSKETCHUP/System+Requirements
 

Helemaal onderaan bij de gevaren driehoek:

"CUDA rendering is available only for Fermi-, Kepler-, Maxwell- and Pascal- based NVIDIA cards as well as CPUs. Interactive GPU OpenCL rendering mode is currently not supported."
Onduidelijker kan een GPU (Hybride) render programma niet worden aangekondigd.
En hier zien we dat V-Ray wordt ondersteund op de versies 2015, 2016 of later, dat zegt wellicht genoeg over de onzorgvuldigheid.
Terwijl naast alle retoriek van de nieuwe features (en dat zijn er nog al wat) de technische eisen (waar moet de computer aan voldoen om lekker te kunnen werken) EVEN BELANGRIJK ZIJN.
 
* Realiseer u wel dat onder aanvoering van AMD zowel de GPU- als de CPU markt danig wordt opgeschud. Waarbij Intel toch nog onverwacht met een snel soort van antwoord op de huidige CPU-lijn kwam. Bedenk met uw huidige investeringsplannen dat de markt volop in beweging is en de typennummers (Intel maar ook NVIDIA) over elkaar heen buitelen en elk half jaar of nog korter meer te bieden hebben voor een lagere prijs. Intel heeft ineens een inhaalspurt gemaakt door meer dan 4-cores processoren in de gangbare consumenten CPU-lijn uit te brengen.
* Deze GPU Benchmark van V-Ray loopt al enige tijd en is dus gebaseerd op deels oudere versies 2.x van V-Ray en nieuwere versie 3.x uitvoeringen. Vandaar dat wellicht het beeld van gebrek aan volgorde te verklaren zou moeten zijn. In een nieuwe Benchmark zou de versie ook als gegeven vermeld moeten worden.
Het is heel vreemd dat de Chaos Group op deze manier voor de Benchmark heeft gekozen. Een opsplitsing in 3D programma en vermelding van Windows /Macintosh en nog belangrijker het versie nummer van V-Ray is een gemiste kans. Waardoor wederom een soort mist ontstaat over de echt achterliggende gedachten en kenmerken van dit goede render programma.

Wat gebeurt er als de grafische kaart te weinig VRAM geheugen heeft om de hele (grote) V-Ray 3D scene onderdelen in op te nemen?

 
In eerste instantie heeft V-Ray allerlei optimalisaties doorgevoerd om de materialen binnen zekere grenzen heel sterk in aantal bytes terug te brengen door middel van allerlei compressie technieken.
cg_labs van V-Ray antwoord daar op 15 juni 2017 5:41 uur
De CPU gebruikt de standaard RAM en de GPU gebruikt de VRAM. Out of Core in de ware aard legt een te grote wissel op de snelheid van het geheel. Maar er zijn twee punten om te maken.
V-Ray 3.5 heeft al veel minder VRAM geheugen nodig, dan daarvoor (Mip-Map textures on demand). Ten tweede als dat nog niet genoeg is dan is het nog steeds mogelijk om met de CPU Engine te renderen, waarbij wel voldoende RAM geheugen aanwezig is (moet zijn). Dit heet de CPU fallback bij V-Ray en dus iets afwijkend van wat andere mensen ‚"Out of Core" renderen noemen.
 
https://labs.chaosgroup.com/index.php/rendering-rd/understanding-v-ray-hybrid-rendering/
 
Bedenk daarbij wel dat het VRAM GPU geheugen vele malen sneller werkt, dan welke CPU RAM dan ook, waardoor bij het terugschakelen we ineens een stap terug moeten doen.
 
Iets dergelijks deed zich vroeger ook voor bij computers, waarbij het RAM geheugen bijzonder kostbaar was. Men ontwikkelde het operating systeem zodanig dat als de grens van het RAM geheugen werd bereikt, de harde schijf als tijdelijk RAM opslag werd ingezet. Waarbij een dergelijk verschil in snelheid direct duidelijk werd in de verwerkingssnelheid. Maar de computer voerde zijn taak wel uit, ook met te weinig RAM geheugen.
 
 
 
• Wij pleiten voor een voortzetting van Benchmark testen bij alle render programma's.
 
• Een duidelijker en meer op de praktijk gerichte "System Requirements" bij alle render software.
 
Laat deze maar even staan en concentreer u op uw eigen toepassing en budget
 
Bentley Bentayga
Mercedes AMG S65 coupe
Ferrari 488GTB
Lamborghini Huracan LP610-4 Spyder
McLaren 650S
Aston Martin Vanquish
Rolls-Roys Wraith
Ferari F12 Berlinetta
 
Indien een renderprogramma wil laten zien hoe snel haar software werkt (met behulp van een High-End werkstation), dan dienen altijd de volledige technische gegevens van het werkstation bij de YouTube video's te worden vermeld. Het terugvertalen tot een gangbaar computer type is helaas niet altijd mogelijk.
 
Het is dus praktijk gerichter om een "goed werkstation" te kiezen dat overeenkomt met het gemiddelde in de markt liggen computer en daar te laten zien wat de sofware in zo'n geval presteerd tijdens een live video.
 
Maar wat is live video? We hebben nu al diverse malen gezien dat bij een live-demonstratie van een renderprogramma, heel behendig een filmpje werd gestart, waarbij de snelheid kan zijn aangepast. Het wordt het kip en het ei probleem.
 

 
 
 
Quadro P4000 grafische kaart met 1792 CUDA cores en 8 GB GDDR5 geheugen. Formfactor 1 slot, 105 Watt opgenomen vermogen.
 
 
Understanding V-Ray Hybrid rendering
https://labs.chaosgroup.com/index.php/rendering-rd/understanding-v-ray-hybrid-rendering/
 
Chaosgroup Laboratories
Understanding V-Ray Benchmark
https://labs.chaosgroup.com/index.php/rendering-rd/understanding-v-ray-benchmark/
 
NVIDIA White Paper Tesla P100
https://images.nvidia.com/content/pdf/tesla/whitepaper/pascal-architecture-whitepaper.pdf
 
 
Tweakers
Link tweakers nieuws
 
 
Anandtech
http://www.anandtech.com/show/11102/nvidia-announces-quadro-gp100
 
Hardware info
 
link 1 GP100
link 2 quadro GP100
link 3 GP201 in games
 
 
https://docs.chaosgroup.com/display/VRAYBENCH/V-Ray+Benchmark+Help
 
Linux en Apple OSX "Coming very soon‚" aldus V-Ray ontwerpers (11 aug. 2016)
 
Link 1 Labs Chaosgroup
 
Link2 Labs Chaosgroup
 
Link 3 Labs Chaosgroup
 
Link 4 Labs Chaosgroup
 
 
 
V-Ray 3ds Max 3.6 met Cryptomatte en Hybrid rendering
 
 
 
AWN
Animation World Network
Chaos Group to Showcase Advances in V-Ray GPU Rendering at GTC 2017. Met Blagovest Taskov.
https://www.awn.com/news/chaos-group-showcase-advances-v-ray-gpu-rendering-gtc-2017
 
 
The Angry Video guy
ChaosGroup Release V-Ray 3.6 for 3ds Max with Hybrid Rendering
 
 
 
SketchUcation
Rendering plugins (SketchUp) uit 2011
https://sketchucation.com/forums/viewtopic.php?f=80&t=35972
 
fxguide
The Art of Rendering
10 april 2012 door Mike Seymour
https://www.fxguide.com/featured/the-art-of-rendering/
 
 
CUDA kaarten
https://developer.nvidia.com/cuda-gpus
 

Frequently Asked CUDA Questions

 
1) How can I find out which GPU is in my computer?
Answer:
 
On Windows computers:
 
Right-click on desktop
If you see "NVIDIA Control Panel" or "NVIDIA Display" in the pop-up window, you have an NVIDIA GPU
Click on "NVIDIA Control Panel" or "NVIDIA Display" in the pop-up window
Look at "Graphics Card Information"
You will see the name of your NVIDIA GPU
 
On Apple computers:
 
Click on "Apple Menu"
Click on "About this Mac"
Click on "More Info"
Select "Graphics/Displays" under Contents list
 
2) Do I have a CUDA-enabled GPU in my computer?
Answer: Check the list above to see if your GPU is on it. If it is, it means your computer has a modern GPU that can take advantage of CUDA-accelerated applications.
 
3) How do I know if I have the latest drivers?
Answer: Go to http://www.nvidia.com/drivers
 
4) How can I obtain a CUDA-enabled GPU or system?
Answer:
For Tesla for HPC and supercomputing applications, go to www.nvidia.com/object/tesla_wtb.html
For GeForce for entertainment, go to www.nvidia.com/object/geforce_family.html
For Quadro for professional visualization, go to
 
http://www.nvidia.com/object/workstation_wheretobuy.html
 
5) How can I download the CUDA Toolkit?
Answer: Go to CUDA Toolkit Downloads.
 
 
Slechts een kleine greep uit de "Overschrijvende knippen en plakkende" verkooppunten / dealers / vertegenwoordigers met dezelfde halve technische gegevens:
 
 
http://www.nosco.com.sg/v-ray_for_sketchup_system_requirements
Bijgewerkt voor 2013, 2014 en 2015.
Nosco Consultancy
186 Woodlands Ind Pk E5, #04-01 K,
Singapore 757515
 
https://www.vray.com/vray-for-sketchup/buy-vray-for-sketchup.html
Visual Dynamics LLC (US)
helemaal onderaan de pagina System Requirements, waarbij 4 GB RAM ook nog zou kunnen, geen woord over de goede versies (2015, 2016) en geen woord over een mogelijk grafische kaart.
Wel een banner met SketchUp 2017 compatibel, dus eind 2017 niet echt bij de tijd.
Visual Dynamics LLC
1458 Plaza PL, Suite 104A
Springdale AR 72764-5279 (USA)
 
http://www.3dv.com/Buy-VRay-for-SketchUp
geen goede versie nummer vermelding
helemaal geen technische gegevens vermeld.
3DV Corporation
740 SW 21st. Ave. Suite 310
Portland, Oregon 97205
 
https://novedge.com/chaos-group/vray-for-sketchup/products/9366/tab/1
Zelfs met een 1 GHz processor zou het moeten kunnen, indien die nog ergens te koop zou zijn.
En 1 GB RAM geheugen of iets meer zou kunnen, geen woord over grafische kaart. Wel een regeltje overgenomen van Chaos Group over "GPU CUDA".
Bekijk het bedrijf https://novedge.com/company
NOVEDGE LLC
260 Kearny Street, Suite 300
San Francisco, CA 94108
866-362-8970 — info@novedge.com
 
http://www.see-it-3d.co.uk/chaos-group-launch-v-ray-3-sketchup/
SEE-IT-3D in Londen en Edingburgh Engeland.
Geen technische vereisten vermeld.
 

meetdatum nov. 2017


naar boven