NVIDIA GeForce GTX 750 Ti

leitura de 8 minutos

APRESENTAÇÃO

A NVIDIA apresenta-nos a sua mais recente placa gráfica de baixo custo, baseada na nova arquitetura “Maxwell”, a NVIDIA GeForce GTX 750 Ti, esta provavelmente será a arquitetura que vai equipar a nova série de placas gráficas deste fabricante.

Quer seja para ver os efeitos especiais incríveis do mais recente filme de Hollywood, ambientes quase foto realistas, jogos em 3D com personagens que parecem reais, ou um site com imagens de alta resolução e vídeo.

A exigência dos consumidores para gráficos mais impressionantes continua a aumentar a cada ano que passa. Para enfrentar esta exigência, os processadores gráficos (GPU) da NVIDIA continuaram a evoluir, a cada geração que se segue são adicionados novos recursos, tornando-os assim mais poderosos.

A arquitetura anterior denominada “Kepler” pela NVIDIA, foi lançada no início de 2012, proporcionando um desempenho inovador e grande eficiência energética, os GPUs Kepler fizeram parte dos melhores PC’s de jogos e estações de trabalho. Esta arquitetura também foram implementadas na família Tegra K1 system-on-a-chip para ativar os recursos de computação visual. Líderes de mercado em smartphones , tablets e até mesmo os sistemas de informativos e de entretenimento, encontrados nos automóveis.

A primeira geração de arquitetura da NVIDIA “Maxwell” implementa uma série de melhorias arquitetónicas projetadas para aumentar ainda mais o desempenho e a eficiência de energética por watt consumido. À primeira GPU baseada no chip “Maxwell” foi-lhe dado o codename “GM107” e foi projetada para uso em ambientes de potência limitada, como notebooks e computadores Small Form Factor (SFF). Estes sistemas SFF são frequentemente usados em jogos e em entretenimento em casa.

A primeira placa de vídeo baseada na GPU GM107 é a GTX750Ti. Devido a uma eficiência notável desta arquitetura, com resolução de 1080p a GTX750Ti, tem um desempenho muito idêntico a uma GTX480 na maioria do testes, com um TDP de apenas 60W, consome um quarto da energia da GTX480.

O novo GPU Maxwell introduz um design totalmente novo para a Transmissão Multiprocessor (SM), que melhora drasticamente o desempenho por watt e desempenho por área. Embora o projeto Kepler SMX tenha sido extremamente eficiente para a sua geração, através do seu desenvolvimento, a NVIDIA viu uma oportunidade para mais um grande salto em frente em termos de eficiência na arquitetura das suas GPU’s, o Maxwell SM é a realização desse trabalho.
Melhorias para controlar o particionamento lógico, balanceamento de carga de trabalho, granularidade, etc, programação baseada em compilador, número de instruções emitidas por ciclo de clock, e muitas outras melhorias permitem ao Maxwell SM (também chamado de “SMM”) excederem em muito a eficiência do Kepler SMX.
A nova arquitetura Maxwell SM permitiu à NVIDIA aumentar o número de SMS por cinco no GM107, em comparação com dois em GK107, com um aumento de apenas 25 % na área do GPU.
O Maxwell apresenta também um design dramaticamente superior de cache L2; 2048KB em GM107 versus 256KB no GK107. Com mais cache localizada no chip, são necessários menos pedidos para a DRAM da placa gráfica, reduzindo assim o nível de energia na placa gráfica e melhorando assim o desempenho.

Por fim, concluímos assim, que a NVIDIA conseguiu apresentar um GPU que tem o dobro do desempenho/watt do que o seu antecessor, o “Kepler”, usando o mesmo processo de fabrico de 28nm.

A ARQUITETURA GM107
A partir de uma perspectiva gráfica, a NVIDIA apresenta a sua primeira geração de GPUs Maxwell. Estes, oferecem a mesma funcionalidade API que os GPUs Kepler. Ao mais alto nível, a nova plataforma Maxwell também implementa várias unidades SM dentro de um GPC (Graphics Processing Cluster), e cada SM inclui um Motor Polimorfo e Unidades de Textura, enquanto cada GPC inclui um Raster Engine. Os ROPs continuam alinhados com faixas de cache L2 e Controladores de memória.
Internamente, todas as unidades e estruturas crossbar foram redesenhados, os fluxos de dados otimizado, a gestão de energia melhorada significativamente, e assim por diante.

O GPU GM107 contém um GPC, cinco Maxwell Streaming Multiprocessors (SMM), e dois controladores de memória de 64 bits (128 bits no total). Esta é a plena implementação do chip, e é a mesma configuração que equipa a GeForce GTX 750 Ti.

DIAGRAMA DE BLOCOS DO MAXWELL

PRINCIPAIS DIFERENÇAS KEPLER/MAXWELL

GPU	GK107 (Kepler)	GM107 (Maxwell)
CUDA Cores	384	640
Base Clock	1058 MHz	1020 MHz
GPU Boost Clock	N/A	1085 MHz
GFLOPs	812.5	1305.6
Texture Units	32	40
Texel fill-rate	33.9 Gigatexels/sec	40.8 Gigatexels/sec
Memory Clock	5000 MHz	5400 MHz
Memory Bandwidth	80 GB/sec	86.4 GB/sec
ROPs	16	16
L2 Cache Size	256KB	2048KB
TDP	64W	60W
Transistors	1.3 Billion	1.87 Billion
Die Size	118 mm²	148 mm²
Manufacturing Process	28-nm	28-nm

NOVA GERAÇÃO – Maxwell SM

O principal contribuinte para a melhoria da eficiência de Maxwell é a nova arquitetura Maxwell SM, ( SMM). Esta nova arquitetura SM atinge muito maior eficiência energética e proporciona 35% mais desempenho por núcleo CUDA em cargas de trabalho “shader-limited” para alcançar estes resultados foram feitas uma série de mudanças importantes. A arquitetura e algoritmos do programador SM, foram reescritos para serem mais inteligentes e evitar problemas desnecessários, reduzindo ainda mais o consumo energético por instrução necessária para o agendamento.
A organização do SM também mudou. Cada SM está agora dividida em quatro blocos de processamento separadas, cada uma com seu próprio buffer de instrução, scheduler e 32 núcleos CUDA. A abordagem Kepler de ter um número de núcleos CUDA “non-power-of-two”, com outros que são partilhados, foi eliminado. Esse particionamento simplifica o desenho e a lógica de programação, a área de economia e de energia, e reduz a latência.

Os pares de blocos de processamento partilham quatro unidades de filtragem de textura e uma cache de textura. A função de cache L1, foi combinada com a função de cache de texturas e memória partilhada e é um unidade separada (semelhante à abordagem utilizada no G80 , a primeira GPU capaz CUDA ), que é partilhado pelos quatro blocos.

Em geral , com esta nova concepção , cada ” SM ” é significativamente menor quando proporciona cerca de 90 % do desempenho de um Kepler SM, e a área mais pequena permite implementar muitos mais SMS por GPU. Comparando o GK107 vs GM107 no total SM de métricas relacionadas, GM107 tem cinco contra dois SMs, 25% a mais performance nas texturas, 1,7 vezes mais núcleos CUDA, e cerca de 2,3 vezes mais desempenho nos shaders .

MEMÓRIA DO SISTEMA

Para o GM107, alcançar um desempenho significativamente superior com a mesma largura de memória que o GK107, foi também importante investir em melhorias no sistema de memória. A largura de banda de memória do sistema interno foi aumentado, juntamente com melhorias na eficiência do projeto. Além disso, a configuração de grande cache L2 2MB (maior do que qualquer desenho GPU anterior) é altamente eficaz na redução da exigência de largura de banda de memória DRAM e assegurar que a largura de banda não é um ponto de estrangulamento.

NOVAS CAPACIDADES DE VÍDEO

Uma das principais inovações do Kepler, foi o seu codificador de vídeo H.264 baseados em hardware, NVENC. Ao integrar os circuitos de hardware dedicado para vídeo de codificação/decodificação (ao invés de usar CUDA Cores do GeForce GPU) NVENC proporcionou um aumento de desempenho dramático para codificação H.264, diminuindo o consumo de energia.
Aproveitando o codificador NVENC do Kepler a Nvidia introduziu o Shadowplay, tal como nas séries GeForce GTX 600 e GTX 700 para gamers no ano passado, o que lhes permite gravar os seus momentos favoritos de jogos para qualquer um ver.

Desde o lançamento do Shadowplay, mais de 3 milhões de vídeos foram capturados, e publicados pelos jogadores no YouTube.
Para melhorar o desempenho de vídeo, o Maxwell apresenta um bloco NVENC melhorado que permite codificar mais rápido (6 e 8 vezes em tempo real para H.264 vs 4x em tempo real para Kepler) e 8 -10x mais rápido a descodificar. Graças à nova cache local, permite uma maior eficiência de memória por fluxo para descodificação de vídeo, resultando menos dispêndio de energia na descodificação de vídeo .
O Maxwell apresenta também um novo estado de energia GC5, que foi adaptado para reduzir o consumo de energia do GPU especificamente para casos de cargas leves, como por exemplo a navegação na Internet e a reprodução de vídeo.