A NVIDIA anunciou recentemente uma nova versão da GPU Tesla V100 para datacenters com formato PCI Express. Ela é baseada na arquitetura Volta e utiliza o chip GV100 produzido com o processo de fabricação de 12nm.
Antes desta versão com formato PCI Express, a GPU tinha uma versão compatível com interconexão NVLink, que possui largura de banda bidirecional de 300GB/s. A versão com formato PCI Express oferece largura de banda bidirecional de 32GB/s.
De acordo com a NVIDIA, a nova versão da GPU Tesla V100 para datacenters possui interface PCI Express 3.0 x16, 5120 núcleos CUDA, 640 núcleos Tensor (núcleos CUDA especializados que aceleram a criação de redes neurais, útil para sistemas com foco em inteligência artificial), clock de 1370MHz, 16GB de HBM2 (High Bandwidth Memory 2) com interface 4096 bits e largura de banda de 900GB/s, e suporte para OpenCL, DirectCompute e OpenACC.
A versão com formato PCI Express oferece um desempenho de até 7 teraflops em modo double-precision, 14 teraflops em modo single-precision e 112 teraflops em Deep Learning.
Para efeito de comparação, a versão baseada em NVLink oferece um desempenho de até 7.5 teraflops em modo double-precision, 15 teraflops em modo single-precision e 120 teraflops em Deep Learning.