Este slide é também muito interessante. Guardem-no na memória, pois penso que na apresentação é a única vez que eles comparam as suas gráficas com série 5X0 da nVidia, o que me deixa a pensar que a AMD não está tão confiante que esta nova geração faça frente às novas gráficas na nVidia. Alias, pelo slide, podemos ver que colocam a 6970 entre a 570 e a 580 e voltam a recordar que a 5970 é a gráfica mais rápida do mercado.
Espero pelo menos que o preço esteja também em concordância.
Temos neste slide uma visão gerar dos objectivos que a AMD quer cumprir com esta nova geração. Mais eficiente. Mais poder de geometria (tesselation). Melhor qualidade de imagem. Melhor gestão de energia.
Indo ao primeiro ponto e o que mais surpreende.
A AMD mudou a arquitectura interna do GPU, o que não estava à espera de um refresh. Estou-me a referir ao VLIW4. Temos também dois motores de geometria, que vai melhorar a performance em tesselation. Explico estes e outros pormenores mais à frente.
Mais alguns detalhes neste slide. Temos os dois motores gráficos. Arquitectura VLIW4. 24 SIMD engines (20 na 5870). 96 unidades de textura (80 na 5870 e 40 na 4870). Updates para melhorar a performance com Anti Aliasing. Chips de memória a 5.5 Gbps ( 4.8 na 5870). Novas funcionalidades para GPGPU.
Vamos então à grande surpresa deste GPU. A mudança dos Stream processors.
Pelo que me lembro, desde a 4870 que a AMD usa uma arquitectura VLIW5. O que isto quer dizer? Cada stream processor era composto por 5 unidades. 4 “simples” e 1 “complexa” chamada de t-unit ou trancendental unit.
Esta arquitectura ainda pode ser vista na recente série 6800, mas a AMD muda por completo a composição dos stream processors nesta geração 6900. Explicando melhor. Das 5 unidades, ficaram 4 unidades simples e desapareceu a t-unit. O que era feito anteriormente pela t-unit, pode ser feito, nesta nova arquitectura, com a soma de 3 das unidades simples.
É difícil avaliar, sem testes mais específicos, onde está a vantagem e se existe vantagem, mas pelo que me parece a vantagem está em reduzir o tamanho de cada stream processor, sem que isso afecte muito a performance. É uma mudança para melhorar a eficiência e ter mais SIMD engines, visto que as unidades são mais pequenas, até porque a t-unit era a unidade mais complexa, anteriormente.
É da minha opinião e apenas uma opinião pessoal, que esta mudança será para ser continuada em futuros produtos, aumentando a performance, aumentando o número de stream processors (ou diminuindo em produtos mais baratos).
Aqui vemos de forma quantitativa a melhoria no back-end, que devem melhorar a performance com Anti Aliasing.
Dois pontos principais neste slide, que está mais relacionado com GPGPU do que com jogos.
A possibilidade de correr vários kernels ao mesmo tempo, algo que nos gpus da nVidia é possível desde a 480.
A melhoria de performance em double precision, algo que é interessante e que a nível de números vão ver nos próximos slides, que impressiona.
O rácio é de 1/4 de performance double precision para single precision, o que é pior que nos actuais GPUs da nVidia, que na Tesla é de 1/2 e está “limitado” artificialmente nas GeForces a 1/8. Mesmo com esta diferença o poder computacional em single precision é tão grande nestas 6900, que mesmo com 1/4 o valor em double precision continua a ser muito bom (teoricamente melhor que o Tesla).