NVIDIA GeForce GTX 980, GTX 970, una mirada al gran regreso de Maxwell

NVIDIA GeForce GTX 980, GTX 970, una mirada al gran regreso de Maxwell
4 comentarios Facebook Twitter Flipboard E-mail

En la actualidad resulta casi imposible guardar un secreto, pero aún así, no fue sino hasta hace unas horas que NVIDIA finalmente dio luz verde para anunciar oficialmente sus nuevas tarjetas de video de siguiente generación. Y que mejor escenario para llevarlo a cabo que durante la celebración de su evento masivo #GAME24.

Estas tarjetas son las muy esperadas GeForce GTX 980 y GeForce GTX 970 que hacen su aparición en tiempos bastante emocionantes para el PC Gaming, pero también como una interesante alternativa a los retrasos que se han experimentado para dar el salto al nodo de 20nm.

Por su puesto, lo más llamativo del caso, es que se tratan de las primeras tarjetas de NVIDIA basadas en la segunda generación de la arquitectura Maxwell, con la que no solo prometen entregar mayor rendimiento y menor consumo de energía sino también seducir bolsillos con precios realmente tentativos.

Mayor eficiencia sin dar el salto a 20nm

Tradicionalmente, los jugadores más importantes en la industria de GPUs nos han vendido la idea de que cada año (a veces un poco más) podemos esperar nuevas tarjetas de video que nos permitan correr nuestros videojuegos de manera más fluida, con mejores detalles y a mayores resoluciones.

Si bien no podemos negar que lo han conseguido hasta ahora. En las últimas generaciones de tarjetas de video se ha tenido la impresión de que la tecnología se ha estancado al no ser posible hacer la transición a un proceso de manufactura más pequeño.

Lo cierto es que, independientemente de los problemas asociados para dar el salto al nodo de 20nm, durante los últimos años, NVIDIA ha demostrado que no forzosamente se necesita una nueva tecnología para entregar mayor rendimiento con menor consumo de energía.

La prueba más contundente de que todavía puede alcanzarse nuevos niveles en consumo de energía refinando el proceso a 28nm ocurrió a principios del año con la arquitectura Maxwell que hizo su debut con el GPU GM107 para el segmento de gama media.

Hoy, la siguiente evolución de este diseño pensado en bajo consumo de energía, continúa en el segmento de gama alta con la segunda generación de Maxwell, o GM204, que hace su debut con dos nuevas tarjetas: la GeForce GTX 980 y GTX 970.

El secreto de Maxwell GM204

En tanto se define qué tanto hay que esperar o si realmente se necesita apresurar la transición a un nodo más pequeño, el GPU GM204, es más propiamente, el hermano mayor del GM107 con algunas optimizaciones en diseño.

Para ser más precisos, el GM204 está catalogado como el GPU más avanzado creado por NVIDIA hasta la fecha ya que cuenta con 5.2 mil millones de transistores que están reunidos en un die de 398mm2.

nvidia_maxwell_gm204_gpu_die.jpg

A modo comparación, el GK104 que fue lanzado como chip "de gama media" con 3.5 mil millones de transistores tiene un área de 294mm2, mientras que al lado del GK110 "Big Kepler" ocupa el 80% de su área y eso tomando en cuenta que tiene 7.1 mil millones de transistores en un área de 551mm2.

Analizando la estructura interna del nuevo GM204 vamos a encontrar que luce muy similar al GPU GM107. La diferencia radica en que está organizado entre cuatro GPC (Graphics Processing Cluster) y no solo uno. Además, cada uno, se compone de cuatro SMM (Streaming Maxwell Multiprocessors) y no de cinco. En los cuales también vamos a encontrar 64 ROPs que representan cuatro veces más que en el GM107 y cuatro controladores de memoria de 64-bits que dan al doble de bus de memoria.

nvidia_maxwell_gm204_gpu_diagram.png

Sin embargo, el cambio más importante que vamos a encontrar en el diseño de Maxwell es que cada SMM es mucho más pequeño, esto con la finalidad de ocupar menos espacio en el die y conseguir que el chip fuera más eficiente en consumo de energía pero fuera capaz mayor rendimiento.

Para conseguirlo se dividió la estructura de los SMM en cuatro sub-unidades lógicas para que fueran capaces de ejecutar 32 operaciones vectoriales y tuvieran sus propios buffer de instrucciones, archivos de registro, unidades dispatch y schedulers. Cabe mencionar que cada SMM dispone de un cache de textura y L1 que se ha combinado y se ha duplicado la memoria compartida a 96KB comparado a los 64KB que utiliza el GM107.

nvidia_maxwell_gm204_smm-1.png

Evidentemente, este reacomodo significó tener que mover aquí y allá para conseguir que los SMMs fueron más pequeños pero eficientes. Esto significa que ahora cada SMM solo cuenta con 128 CUDA Cores comparado a los 192 núcleos que se vieron en GK110 y la cantidad Texture Units se redujo de 16 a 8.

Al final tenemos que la variante más completa del GM204 que utiliza la GeForce GTX 980 tiene 16 SMMs habilitados, en los cuales están distribuidos 2048 CUDA, 512 unidades almacenamiento, 128 Texture Units y 16 motores PolyMorph de tercera generación. Todo ello conectado a un caché L2 compartido. En el caso de la GTX 970 solo están habilitados 13 SMM que dan como resultado a 1664 CUDA cores, 416 unidades almacenamiento, 104 Texture Units y 13 motores PolyMorph de tercera generación.

Lo interesante del caso es aunque de esta manera se sacrificó capacidad de texturización comparado a Kepler, al duplicar la cantidad de ROPs de 32 a 64 se consiguió que el GM204 ganara capacidad de renderizado para manejar resoluciones más altas y ser capaz de entregar una mejor calidad de imagen.

Por lo anterior es que el GM204 puede entregar un poder de cómputo de simple precisión de 4.6 TFLOPs lo cual es solo 9.8% menos que los 5.1 TFLOPs que entrega el GK110. Mientras que si bien su capacidad de texturización es de 1144 GT/s, su nivel de renderizado es de 72.1 GP/s, o bien, 35% mayor que la GeForce GTX 780 Ti.

A modo comparación, la siguiente tabla incluye las especificaciones generales de las nuevas GeForce GTX 980 y GTX 970 incluyendo las de la GTX 780 Ti y GTX 780 que serían los modelos que van a reemplazar:

NVIDIA GeForce GTX 980 NVIDIA GeForce GTX 970 NVIDIA GeForce GTX 780 Ti NVIDIA GeForce GTX 780
GPU GM204 (Maxwell) GM204 (Maxwell) GK110 (Kepler) GK110 (Kepler)
Proceso de manufactura 28nm 28nm 28nm 28nm
Transistores 5.2 mil millones 5.2 mil millones 7.1 mil millones 3.5 mil millones
CUDA Cores 2048 1664 2880 2304
Texture Units 104 104 240 192
ROPs 64 64 48 48
Frecuencia GPU (Base) 1126 MHz 1050 MHz 875 MHz 863 MHz
Frecuencia GPU (Boost) 1216 MHz 1178 MHz 928 Mhz 1085 MHz
Frecuencia Memoria 7GHz GDDR5 7GHz GDDR5 7GHz GDDR5 7GHz GDDR5
Bus de memoria 256 bits 256 bits 384 bits 384 bits
TDP 165 W 145 W 250 W 250 W
Precio (sugerido) $549 dólares $329 dólares $699 dólares $399 dólares

Hasta aquí hemos hablado que el GM204 "Maxwell" es un chip mucho más eficiente que Kepler, ¿pero qué tanto? En el caso de la GTX 980 hablamos que tiene un TDP de 165W lo cual es bastante impresionante si tomamos en cuenta que se sigue usando el nodo de 28nm y es alrededor de 100W menor a la GeForce GTX 780 Ti que utiliza el GK110 "Kepler". Para la GeForce GTX 970 hablamos que tiene un consumo máximo de 145W.

Para hacerlo posible también es importante mencionar que se sacrificó ancho de banda de memoria en GM204 comparado a la GeForce GTX 780 Ti al usarse un bus de 256-bits. La buena noticia es que que NVIDIA encontró que era posible compensarlo al implementar la tercera generación de un modo de compresión de color delta.

nvidia_maxwell_tercera_generacion_arquitectura_memoria.jpg

A lo que se refiere es que se pudo reducir el tamaño de la información almacenada en la memoria para ocupar hasta 25% menos ancho de banda. De esta manera se reduce el tiempo de cómputo, el consumo de energía pero sin impactar dramáticamente en el rendimiento.

nvidia_maxwell_arquitectura_memoria-3.png

Si lo vemos con más detenimiento, la compresión de color delta determina cuántas regiones de 4x2-pixeles comparten el mismo color. En caso de ser la misma, se comprime en una relación 8:1. Por este motivo se dice que usar un bus tan pequeño de 256-bits para tarjetas de gama alta no es una desventaja. De hecho, NVIDIA asegura que la GTX 980 es capaz de entregar un ancho de banda de memoria efectivo de más de 300 GB/s.

nvidia_maxwell_compresion_memoria.png

Nuevas tecnologías

Si todo lo anterior fue muy complicado de entender, la mejor forma para visualizar sus beneficios es a través de las características especiales que le dan valor a las tarjetas y con las cuales podemos sacar provecho como usuarios.

nvidia-maxwell-gm204-gpu-features2.jpg

VXGI – Voxel Global Illumination

La iluminación realista está entre los problemas más difíciles para los gráficos en tiempo real. La simulación de luz directa e indirecta, como los reflejos en escenas dinámicas, hasta ahora ha exigido demasiada potencia de procesamiento para las GPU, más allá de las que están disponibles para los profesionales. Los desarrolladores de juegos se veían obligados a usar trucos de iluminación que comprometían el realismo de las escenas.

nvidia_maxwell_iluminacion.png

Maxwell supera estas limitaciones al combinar el rendimiento y la capacidad de programación necesarios para modelar fuentes de luz directas e indirectas. Lo logra mediante VXGI, una nueva técnica de NVIDIA que presenta con fidelidad la iluminación indirecta, incluso la luz difusa, la luz especular y los reflejos.

nvidia_maxwell_iluminacion_voxel.png

VXGI se sumará a NVIDIA GameWorks, la biblioteca de gráficos de juegos más avanzada del mundo, de forma que los desarrolladores puedan crear juegos con entornos dinámicos repletos de fantástica iluminación natural y un realismo asombroso. Se está integrando en motores de juegos populares como Unreal Engine 4 y estará a disposición de los desarrolladores antes de fin de año.

MFAA: Antialiasing de muestreo en múltiples cuadros

Los ingenieros de NVIDIA les han dado a las GPU GTX 980 y 970 un mayor rendimiento con una nueva técnica llamada antialiasing de muestreo en múltiples cuadros (MFAA), que aprovecha los nuevos recursos de las GPU Maxwell. NVIDIA revela todo el poder de la arquitectura de GPU Maxwell

nvidia_maxwell-dynamic_super_resolution_dsr.png

El MFAA varía los patrones de muestreo de antialiasing en los píxeles dentro de un cuadro individual y entre múltiples cuadros. Luego, utiliza un filtro de síntesis recién desarrollado para producir la mejor calidad de imagen y lo hace más rápido que el antialiasing convencional. Para los jugadores, el MFAA produce una calidad de imagen cercana a la de 4xMSAA al costo de 2xMSAA, de forma que los juegos funcionan más rápido manteniendo los altos niveles de calidad de imagen.

nvidia_maxwell_mfaa_performance-2.jpg

DSR: Super resolución dinámica

Las GPU GeForce GTX 980 y GTX 970 pueden brindar juegos con mayor fidelidad incluso para quienes juegan en pantallas 1080p estándar. Con la tecnología de super resolución dinámica de Maxwell, los juegos se pueden renderizar a 4K o a otras resoluciones de alto nivel y luego reducirse a la resolución nativa en la pantalla del usuario mediante un filtro gaussiano de 13 taps. La imagen resultante presenta calidad superior a la de la renderización directa en 1080p.

nvidia_maxwell_dsr_feature.png

La DSR se habilita automáticamente mediante GeForce Experience, una aplicación de NVIDIA que optimiza la configuración de los juegos para obtener el máximo rendimiento, descarga los últimos controladores y permite la transmisión de juegos y la captura de acción dentro del juego. Los jugadores pueden activar la DSR y disfrutar de juegos de alta fidelidad con sólo presionar un botón, sin necesidad de actualizar su monitor.

nvidia_maxwell-dynamic_super_resolution_dsr.png

VR Direct

Para aprovechar el potencial envolvente de la realidad virtual, los juegos requieren más velocidad de cuadros y menos latencia. La tecnología VR Direct incorpora una serie de nuevos recursos para aumentar el rendimiento, bajar la latencia e incrementar la compatibilidad con sets de realidad virtual (VR), como Oculus Rift.

nvidia_maxwell_vr_direct.jpg

Estos recursos incluyen:

  • VR SLI: brinda mejor mayor rendimiento en dispositivos de realidad virtual donde se puede asignar un ojo específico a varias GPU para renderizar más rápido las imágenes estéreo. NVIDIA revela todo el poder de la arquitectura de GPU Maxwell

  • Distorsión asincrónica: reduce a la mitad la latencia y ajusta rápidamente las imágenes cuando el jugador mueve la cabeza, sin necesidad de volver a renderizar nuevos cuadros.

  • Estéreo automático: mejora la compatibilidad de los juegos con dispositivos de VR, como Oculus Rift, y permite a los usuarios jugar con algunos sets que no se diseñaron originalmente para la VR.

GeForce GTX 980, GTX 970: Diseño de referencia

El diseño de referencia de las GeForce GTX 980 y GeForce GTX 970 es de tipo dual-slot y muy similar al que hemos visto desde la GTX 690 y que se consolidó en la última generación con tarjetas basadas en el GK110: GTX 780, GTX 780 Ti, y GTX 770.

nvidia_geforce_gtx_980_referencia.jpg

Estamos hablando que vienen equipada con el sofisticado disipador estilo industrial hecho de magnesio que utiliza un ventilador tipo radial que se encarga de mover el aire caliente hacia afuera del gabinete. Algo importante a notar es que NVIDIA nos señaló que no veremos el diseño de referencia en la GeForce GTX 970. La mayoría vendrán con diseños personalizados de la mano de los fabricantes.

nvidia_geforce_gtx_980_vista_frontal.jpg

Si quitamos el disipador encontramos que la GeForce GeForce GTX 980 tiene una longitud de 26.67cm que es muy similar a las tarjetas con este mismo diseño. La adición importante que llama la atención en esta tarjeta es un backplate que cubre en su totalidad el PCB de la tarjeta.

Aunque realmente no parece tener objeto siendo que la tarjeta es mucho más eficiente en consumo de energía, de acuerdo de NVIDIA, su finalidad es dar la posibilidad de instalar sistemas de enfriamiento líquido. Quisiera pensar que esto significa que veremos mas sistemas watercooling en un futuro cercano.

nvidia_geforce_gtx_980_vista_frontal_backplate.jpg

Si nos detenemos a observar el PCB al desnudo notaremos que el circuito de alimentación ha sido rediseñado comparado a la GeForce GTX 780 Ti cubriendo la mayor parte. Adicionalmente, la GeForce GTX 980 viene con cuatro fases de alimentación para el GPU y uno para la memoria, los cuales reciben su alimentación de dos conectores PCIe de 6-pines.

nvidia_geforce_gtx_980_circuito_alimentacion.jpg

En la parte trasera de la tarjeta también se localiza un backplate que no solo sirve para añadir mayor rigidez al PCB sino también ayudar a mejorar la temperatura de los componentes. Lo llamativo de todo es que es la primera vez que NVIDIA lo implementa en un diseño de referencia. Aquí mismo también se aprecian dos conectores SLI.

nvidia_geforce_gtx_980_backplate_sli.jpg

Y para terminar con este recorrido, en el panel I/O frontal encontraremos que NVIDIA ha añadido cinco salidas de video, entre las cuales se encuentra: un HDMI 2.0, el primero que se ve en una tarjeta para consumidor con soporte a pantallas 4K @60FPS; también tres DisplayPort 1.2 y un DVI dual-link. En otras palabras se trata de una tarjeta preparada para altas resoluciones y configuraciones multi-monitor.

nvidia_geforce_gtx_980_panel_frontal-2.jpg

Posicionamiento en el mercado

De acuerdo a NVIDIA, la GeForce GTX 980 y GTX 970 vienen a ocupar el espacio de la GeForce GTX 780/780Ti y la GTX 770. Así, las únicas tarjetas GeForce 700 Series que quedarán son la GeForce GTX 760 y las GTX 750 Series.

Por otra parte, NVIDIA señaló que las tarjetas están orientadas para usuarios que tengan tarjetas de entre dos y tres años, como son las GeForce GTX 600 Series y las GeForce GTX 500 Series, ofreciendo una mejora de hasta 70% mayor rendimiento. Eso sin mencionar el juego de características adicionales.

nvidia_gtx_980_gtx_970_posicionamiento.jpg

Sin embargo, quien recibe el golpe más duro es sin duda AMD, ya que sus Radeon R9 290 Series se han vuelto el blanco de las GeForce GTX 980 y GTX 970. Y no solamente entregando un rendimiento de entre 10-20% superior sino también un menor consumo, y precio sumamente agresivo.

Disponibilidad, precio

Las nuevas tarjetas GeForce GTX 980 y GTX 970 estarán disponibles a un precio recomendado de 549 dólares y 329 dólares, respectivamente. En México lo más seguro es que las encontraremos disponibles de fabricantes como ASUS, EVGA, Gigabyte, MSI, PNY y Zotac.

Más información | NVIDIA

Comentarios cerrados
Inicio