Nvidia Tesla P40 e Tesla P4, nate per il deep learning
Nvidia amplia la linea di schede acceleratrici Tesla con le nuove Tesla P40 e Tesla P4, sostitute delle soluzioni M4 e M40 basate su architettura Maxwell.
Le due proposte seguono la Tesla P100, basata su GPU GP100, adottando però due GPU differenti, rispettivamente GP102 e GP104. Il primo è il core grafico che in ambito gaming è alla base della scheda video Titan X, mentre il secondo lo ritroviamo nelle GTX 1080 e 1070.
A bordo della Tesla P40 ci sono 3840 unità shader, un numero maggiore rispetto alla Tesla P100 che ne offre 3584, tuttavia le GPU sono architetturalmente diverse: solo il GP100 può sfruttare la più veloce memoria HBM2 ed eseguire calcoli a piena velocità con operazioni full-precision (FP64) e half-precision (FP16).
La Tesla P40 ha una potenza di picco con calcoli in virgola mobile a singola precisione (FP32) di circa 12 TFLOPs. La memoria, ben 24 GB di tipo GDDR5, assicura un bandwidth di 346 GB/s. Il TDP della scheda è di 250 watt.
La Tesla P4 è basata sulla massima configurazione del core grafico GP104, quindi ha 2560 unità shader e può raggiungere una potenza di calcolo di 5,5 TFLOPs a singola precisione.
La GPU opera a quasi 1,1 GHz, una frequenza non molto elevata, ma Nvidia ha voluto fare della Tesla P4 una scheda efficiente con un TDP massimo dichiarato di 75 watt. Il GP104 è affiancato da 8 GB di memoria GDDR5 per un bandwidth di 192 GB/s.
Tesla P40 | Tesla P4 | Tesla M40 | Tesla M4 | |
---|---|---|---|---|
CUDA Core | 3840 | 2560 | 3072 | 1024 |
Freq. Base | 1303 MHz | 810 MHz | 948 MHz | 872 MHz |
Freq. Boost | 1531 MHz | 1063 MHz | 1114 MHz | 1072 MHz |
Freq. memoria | 7,2 Gbps GDDR5 | 6 Gbps GDDR5 | 6 Gbps GDDR5 | 5,5 Gbps GDDR5 |
Bus memoria | 384-bit | 256-bit | 384 bit | 128 bit |
VRAM | 24GB | 8GB | 12GB/24GB | 4GB |
Single Precision (FP32) | 12 TFLOPS | 5,5 TFLOPS | 7 TFLOPS | 2,2 TFLOPS |
INT8 | 47 TOPS | 22 TOPS | ? | ? |
TDP | 250W | 50W-75W | 250W | 50W-75W |
GPU | GP102 | GP104 | GM200 | GM206 |
Secondo Nvidia le prestazioni rispetto alle soluzioni precedenti, nei tipici carichi dell'analisi dati e del deep learning, sono nettamente superiori, con una differenza fino a quattro volte a favore della Tesla P40 rispetto alla M40.
Le due nuove schede arriveranno sui server di Dell, Hewlett Packard Enterprise, Lenovo, Quanta, Wistron, Inventec e Inspur, con la Tesla P40 disponibile da ottobre e la P4 da novembre.
![]() | GeForce GTX 1060 3GB | |
![]() | GeForce GTX 1060 6GB | |
![]() | GeForce GTX 1070 |