AMD Ryzen Threadripper a fondo

AMD Ryzen Threadripper a fondo

Si hay algo que no se le puede reprochar a AMD es su ánimo de experimentar con nuevos métodos y tecnologías con el afán de conseguir que lleguen a manos de sus usuarios lo antes posible, ejemplos de ello son su exitosa controladora de memoria integrada en los procesadores Athlon 64 junto a su potente APU en el 2003 con los que consiguió superar a los Pentium 4 de la época (Intel no la introdujo hasta el 2009 en sus procesadores con los primeros Core i), el soporte para la creación y posterior adopción de nuevas APIs de primera mano, tecnologías desarrolladas por ellos mismos sin costo alguno para el consumidor final por disfrutar de ellas como es FreeSync o los efectos Pure Air de código libre de los que incluso puede aprovecharse la competencia.

Aunque arriesgar con tecnologías tan tempranas compromete un riesgo que hay que asumir, y del que AMD algunas veces no ha salido bien parada, como fueron los AMD FX que a pesar de ser procesadores muy competentes no consiguieron estar a la altura en comparación con lo que ofrecía Intel a lo largo de sus generaciones, o más reciente tenemos el caso de las AMD Radeon Vega, tarjetas gráficas que a pesar de conseguir acercar la exclusiva memoria HBM2 de alta velocidad al sector doméstico no han logrado superar a su competidor Nvidia en cuanto a máximo rendimiento, a pesar de contar este último con memoria GDDR5X.

Pero por suerte para nosotros y gracias al buen hacer de AMD, actualmente estamos disfrutando de una batalla campal en el sector de los procesadores como hace años que no se veía, gracias a su nueva arquitectura Ryzen y a su reciente familia de procesadores Threadripper para la gama HEDP, con los que recientemente a puesto entre las cuerdas a su rival Intel aumentando su cuota de procesadores en el mercado un 6% este trimestre, un marguen de crecimiento récord en la historia de la empresa, y es que como ellos mismo ya nos avisaron en su presentación, solo acababan de empezar.

 

HISTORIA DE DESARROLLO

Hace unos días gracias a una entrevista realizada por Anthony Leather para Forbes hacia los vicepresidentes y directores generales de AMD, Jim Anderson, el Vicepresidente Corporativo de Marketing Mundial John Taylor, Sarah Youngbauer del equipo de comunicaciones de AMD y James Prior, Gerente Senior de los productos de AMD, nos llega información sobre el diario de desarrollo de sus nuevos procesadores Threadripper en la gama HEDP, los cuales en un principio ni siquiera formaban parte en su plan de lanzamiento donde solo tenían previsto que llegaran al mercado los modelos Ryzen para el sector doméstico y EPYC para el sector profesional.

Su lanzamiento inicial estaba previsto para el 2018, nacidos tres años después de que AMD comenzase a trabajar en el diseño de sus procesadores ZEN y después de un año de trabajo y dedicación hasta que comenzó su producción en Junio del 2016, donde un reducido equipo de entre 20 y 30 empleados de AMD durante sus ratos libres diseñaron lo que se podría calificar como uno de los mejores productos que existen actualmente en el sector de los procesadores de alto rendimiento.

 

ARQUITECTURA

Uno de los principales puntos a favor de la arquitectura Ryzen es su buena escalabilidad con respecto a la cantidad de núcleos que pueden llegar a soportar sus procesadores sin casi necesidad de realizar importantes modificaciones dentro de los mismos, minimizando costes de producción con ello, pero antes de explicar los procesadores Ryzen Threadripper conviene repasar también las características de los procesadores Ryzen Summit Ridge y AMD EPYC, pues están estrechamente relacionados en cuanto a su fabricación.

El pase de diapositivas requiere JavaScript.

RYZEN SUMMIT RIDGE

Los procesadores Ryzen están construidos bajo un proceso de 14nm “Summit Ridge” fabricados por GlobalFoundries, en el interior de los procesadores Ryzen, dentro de su DIE, se encuentran 2 módulos con 4 núcleos (8 hilos mediante SMT) en su interior cada uno, cada modulo se conoce como CCX (quad-core complex), cada núcleo de los 4 disponibles dentro de un CCX puede ser deshabilitado y trabaja de manera independiente al resto de núcleos compartiendo únicamente un bloque de 8Mb de memoria Cache L3, donde cada núcleo también tiene su propia memoria cache L2 de 512Kb.

Estos módulos CCX están unidos mediante una interconexión de alto ancho de banda Flexible Infinity Fabric, vinculada a la frecuencia de la memoria RAM, donde la frecuencia de dicha interconexión funciona a la misma velocidad que la IMC (controladora interna de memoria) de doble canal (dual channel), o lo que es lo mismo, a la mitad de la frecuencia efectiva de la memoria RAM, por lo que una memoria RAM mas rápida hará que tengamos un mejor ancho de banda entre la comunicación de los módulos CCX y con ello una menor latencia en la comunicación entre los núcleos, un problema que acarreaba la arquitectura Ryzen en sus inicios debido a la poca compatibilidad con los modelos de memoria RAM existentes en el mercado en ese momento y que actualmente ha solventado en mayor parte mediante actualizaciones del código AGESA en sus BIOS.

AMD EPYC

El diseño de Threadripper también se basa en la gama EPYC para servidores y datacenters, procesadores con arquitectura Naples donde en un modulo multi-chip (MCM) conviven 4 matrices Summit Ridge de 2 módulos CCX (8 núcleos), cada una de ellas con IMC de doble canal y controladora PCI-Express de 32 raíles, lo que nos da hasta un total de 32 núcleos / 64 hilos, 8 canales de memoria (512 bits) alcanzando un ancho de banda de 171 GB/s con memorias DDR4 a una velocidad de 2666 MHz y 128 raíles PCI-Express, casi nada.

RYZEN THREADRIPPER

Los procesadores Threadripper también están construidos en un MCM (multi-chip module) al igual que EPYC, con 4 matrices Summit Ridge de 8 núcleos (2 CCX) cada una, unidas por el interior del procesador, pero en este caso AMD deshabilita 2 matrices dejando a los procesadores Threadripper con un máximo de 16 núcleos y 32 hilos por SMT, cada matriz también cuenta con su propia IMC de doble canal e interfaz PCI-Express, AMD ha trabajado para solventar los problemas de latencia que puedan producirse entre la comunicación de los nucleos como es su innovación tecnológica nUMA.

Esto difiere de la arquitectura Skylake-X de Intel, donde nos encontramos con procesadores monolíticos de hasta 18 núcleos con una IMC DDR4 de cuatro canales y 44 lineas PCI-Express dentro del mismo DIE sin que existan problemas de latencia entre los núcleos, aunque como la propia AMD a admitido el método de integrar distintas matrices dentro del mismo procesador conlleva un ahorro en costes de I+D y producción en comparación con los sistemas monolíticos que utiliza Intel, algo que repercute directamente en el precio final del producto.

Los Threadripper también soportan cuatro canales de memoria RAM (Quad-Channel), esto se consigue mediante la IMC de cada matriz controlando dos canales, por ejemplo cuando utilizamos los 4 canales de una placa base Threadripper con 4 módulos de memoria RAM de 8Gb cada uno (32Gb en total), para cada matriz Summit Ridge solo son 16Gb, pero el software puede utilizar los 32Gb sin problemas, conseguir esto mediante distintas IMCs funcionando a la vez no es tarea fácil debido a los ya mencionados problemas de latencia, un hilo que esta siendo procesado por un núcleo en el DIE-A, y que tiene la mitad de la asignación de su memoria controlada por la IMC del DIE-B, sufriría problemas de latencia.

AMD solventa este problema tratando cada IMC de doble canal (Dual-Channel) dentro de cada matriz como si de un único zócalo se tratase, controlando su propia memoria de manera interna y contando con dos modos de asignación:

  • Modo distribuido: Los cuatro canales de memoria se entrelazan dándole prioridad al ancho de banda mas alto para la aplicación, penalizando la latencia, aunque no por mucho.
  • Modo local: La aplicación se carga primero en la memoria del DIE-A y después se comienza a cargar en la del DIE-B, optimizando las latencias pero penalizando el ancho de banda.

La interconexión InfinityFabric mantiene la latencia de la memoria en 133ns para que un núcleo pueda alcanzar la memoria mas lejana situada en el IMC del DIE vecino, alcanzando un ancho de banda en la conexión entre sus DIEs de 102,22 GB/s.

El pase de diapositivas requiere JavaScript.

Cada procesador Threadripper cuenta con nada menos que 64 raíles PCI-Express 3.0 (32 raíles por matriz):

  • 4 de estos raíles se reservan como interconexión entre el chipset X399 y el procesador.
  • 32 raíles se reservan para conexiones PEG (PCI-Ex Graphics), pudiendo controlar hasta dos tarjetas gráficas con 16 raíles o cuatro tarjetas gráficas con 8 raíles para cada una.
  • Los 28 raíles restantes pueden utilizarse para añadir mas conexiones PEG (una de 16 o dos de 8 raíles), o hasta tres puertos M.2 de 4 raíles cada uno, dejando el resto para otros controladores como pueden ser dispositivos de red integrados.

El pase de diapositivas requiere JavaScript.

 

ESPECIFICACIONES

Dentro de la familia de procesadores Threadripper de AMD tenemos 3 modelos disponibles:

AMD Threadripper 1950X

El buque insignia de esta familia, donde nos encontramos con 16 núcleos y 32 hilos mediante SMT, funcionando a una frecuencia base de 3,4 GHz, elevándose hasta los 4 GHz en 2 núcleos de cada matriz (4 núcleos) con Boost, dejando 200 MHz libres para llegar hasta los 4,2 GHz mediante su sistema de overclock automático XFR si las condiciones de temperatura son optimas para ello, contando con 32 MB de caché L3, 8 MB de caché L2 y 1,5 MB de caché L1 y un TDP de 180W.

AMD Threadripper 1920X

Con 12 núcleos y 24 hilos, a una frecuencia base ligeramente superior de 3,5 GHz también sitúa su frecuencia máxima a 4 GHz con el Boost dejando 200 MHz de marguen para XFR, cuenta con el mismo TDP y cantidad de memoria caché L3 que el 1950X, reduciendo su caché L2 hasta los 6 MB y su caché L1 hasta 1.125 MB.

AMD Threadripper 1900X

El modelo para la gama de acceso, cuenta con 8 nucleos y 16 hilos a una frecuencia base de 3,8 GHz, alcanza la misma frecuencia máxima de 4 GHz que sus hermanos mayores con 200 MHz de marguen para XFR, también comparte TDP y tamaño de memoria caché L3, reduciendo su caché L2 hasta los 4 MB y su caché L1 a los 768 KB.

A pesar del distinto numero de núcleos entre ellos, todos mantienen los 64 raíles PCI-Express y la controladora de memoria RAM DDR4 de 4 canales (Quad-Channel), además los DIEs de los módulos CCX están soldados al IHS, logrando una mejor difusión térmica y con ello unas mejores temperaturas, a diferencia de todos los actuales procesadores de Intel, donde se utiliza una pasta termo-conductora TIM de baja calidad entre el DIE y el IHS.

Se supone que el hecho de deshabilitar núcleos en comparación con EPYC se debe a que estos no son módulos operativos, contando con problemas y fallos de algún tipo, por lo que todavía hay que esperar para ver si pueden ser habilitados como sucedió con los procesadores Phenom II X2/X3, los cuales eran realmente procesadores de 4 núcleos con algunos de sus núcleos desactivados y que podían ser habilitados en algunos modelos de placas base de manera no oficial, presentándose en algunos casos problemas debido al mismo hecho de que no eran núcleos operativos.

 

RENDIMIENTO

Durante su presentación AMD mostró unas diapositivas donde se mostraba como el 1950X superaba al i9 7900X (10 núcleos /20 hilos) con un 31% mas de rendimiento en la prueba POVRay 3.7 con todos sus hilos activos, igualando al procesador de Intel con solo 24 de sus hilos funcionando, en la prueba Cinebench R15 se muestra como también sale vencedor el 1950X con una diferencia del 38% en rendimiento bruto multi-hilo mientras que en la prueba mono-hilo pierde por un 15% menos de rendimiento.

El pase de diapositivas requiere JavaScript.

En las pruebas en juegos se puede ver como el 1950X es superado en la mayoría de escenarios bajo resolución 1080p por el i9 7900X, aunque no por mucho, mientras que a resolución 1440p (lo que de manera errónea comúnmente se conoce como resolución 2K), las diferencias se acortan.

El pase de diapositivas requiere JavaScript.

Otra característica de Threadripper que AMD revelo durante su presentación es el modo “Juego” con el que cuentan estos procesadores, alcanzando hasta un 17% mas de rendimiento en el mejor de los casos.

El pase de diapositivas requiere JavaScript.

En otra diapositiva AMD mostró al 1950X ejecutando el juego Hitman a resolución 1080p, grabando la partida, retransmitiendola y codificando un vídeo, todo a la vez, comparando el resultado obtenido con un i9 7900X ejecutando las mismas tareas a la vez, donde el modelo de AMD se postula con el triunfo sobre su competidor con importantes diferencias de rendimiento.

También se destacó la eficiencia energética de Threadripper en comparación con el mismo procesador i9 7900X, el cual cuenta con un TDP de 140W contra los 180W de los modelos de AMD, algo curioso.

El pase de diapositivas requiere JavaScript.

 

CHIPSET X399 Y SOCKET TR4

El socket que aloja los procesadores Threadripper es el TR4, idéntico en forma y numero de pines que el socket SP3 de EPYC con 4094 contactos, pero incompatibles entre ellos.

El chipset que acompaña a estos nuevos modelos durante su lanzamiento es el X399, con una amplia lista de soporte:

  • 8 railes PCI-Express 2.0 para que puedan ser utilizados por dispositivos de Red, WLAN, Bluetooth u otros dispositivos de expansión.
  • Multi-gpu AMD CrossFire y Nvidia SLI.
  • 2 puertos nativos USB 3.1 Gen2.
  • 14 puertos nativos USB 3.1 Gen1.
  • 12 puertos SATA 3 con soporte Raid 0, 1 y 10.
  • Además de los 64 raíles PCI-Express 3.0 (4 reservados) que aportan los procesadores Threadripper, el chipset X399 añade otros 2 raíles para que los fabricantes puedan aportar hasta 4 conexiones SATA o 2 conexiones SATA Express adicionales.

Unos de los defectos que tiene la plataforma Threadripper es la falta de soporte para el arranque del sistema desde dispositivos NVMe montados en RAID, aunque AMD esta trabajando para darle solución mediante una actualización vía software por BIOS, programa para el 25 de Septiembre.

Esta actualización traerá actualizaciones en los drivers, con un controlador de instalación F6, permitiendo que los chipset X399 puedan arrancar desde unidades RAID 0, 1 y 10 con hasta diez dispositivos NVMe, AMD también ha confirmado que no tiene planes de brindar compatibilidad RAID NVMe con las plataformas X370 o B350.

 

PRECIO

Hasta aquí queríamos llegar cuando al principio del articulo hablábamos del buen hacer de AMD, que gracias al diseño modular de sus procesadores ha conseguido abaratar costes de manera exponencial en la producción de los mismo, ofreciendo una relación precio / rendimiento imbatible hasta el momento por la competencia, tanto es así que el buque insignia 1950X de Threadripper, es 50€ mas barato que el procesador i9 7900X de Intel, superándolo en la mayoría de pruebas por un amplio margen donde se requiere de gran potencia de proceso multi-hilo y que tan necesaria es en el mercado profesional hacia el que están destinados estos procesadores, además de ofrecer un rendimiento mas que aceptable en las pruebas mono-hilo donde queda por solo un 15% por debajo de su rival en precio.

Para encontrar un modelo similar al 1950X en su numero de núcleos en Intel tenemos que irnos al i9 7960X que todavía esta por llegar al mercado con un precio estimado superior a los 1700€, demostrando así que no tiene rival en el rango de precios en el que se sitúa.

A continuación os dejamos con la presentación completa de Threadripper junto a otras novedades de AMD que tuvo lugar en la Computex de este año, esperamos que la disfrutéis:

Noticias Recientes