Intel avanza en la arquitectura para centros de datos, HPC-AI y computación para clientes

Intel presentó nuevas arquitecturas para dos núcleos de CPU x86, dos SoC para centros de datos, dos GPU discretas y una revolucionaria arquitectura híbrida de rendimiento multinúcleo para cliente. Escribe Raja Koduri

La arquitectura es una alquimia de hardware y software. Reúne los mejores transistores para un motor determinado, los conecta a través de un empaquetado avanzado, integra cachés de alto ancho de banda y bajo consumo de energía y los equipa con memorias de alta capacidad e interconexión de baja latencia para clústeres de computación híbrida en un paquete, garantizando que todo el software se acelere sin problemas. Revelar las últimas innovaciones arquitectónicas en las que se trabaja para el desarrollo de productos inminentes es algo que los arquitectos de Intel esperan cada año en el Architecture Day de Intel, el evento de este año -la tercera edición- ha sido el más emocionante hasta ahora.

Presentamos nuestros mayores cambios en las arquitecturas de Intel en una generación. Esto incluye el primer análisis a profundidad de Alder Lake, nuestra primera arquitectura híbrida de rendimiento con dos nuevas generaciones de núcleos x86 y el programador de carga de trabajo inteligente Intel® Thread Director; Sapphire Rapids, la nueva arquitectura de centro de datos que establece los estándares de Intel con nuestro nuevo núcleo de rendimiento y varios motores de aceleración; nuestra nueva arquitectura de unidad de procesamiento gráfico (GPU, por sus siglas en inglés) para gaming; nuevas unidades de procesamiento de infraestructura (IPU, por sus siglas en inglés); y Ponte Vecchio, nuestra audaz arquitectura de GPU de centro de datos con la densidad de cómputo más alta de Intel.



Estos avances arquitectónicos prepararon el escenario para nuestra próxima era de productos de liderazgo que comenzará pronto con Alder Lake. Los avances que anunciamos también demuestran cómo la arquitectura satisfará la aplastante demanda de contar con más rendimiento computacional a medida que las cargas de trabajo desde la computadora hasta el centro de datos se vuelven mayores y más complejas y diversas que nunca.

Nuestros arquitectos trabajan arduamente y combinan la exclusiva y rica selección de motores de computación a escala, vectorial, matricial y espacial de Intel, para crear arquitecturas de computación híbrida que ofrezcan ganancias no lineales para las cargas de trabajo más exigentes de nuestros clientes.

Te invito a visitar nuestra sala de prensa para ver las presentaciones, pero primero permíteme explicarte los aspectos más destacados:

Núcleo eficiente: Una microarquitectura x86 altamente escalable para cumplir con los requisitos de cómputo en todos los espectros de necesidades de nuestros clientes, desde aplicaciones móviles de bajo consumo hasta microservicios multinúcleo. En comparación con Skylake, la microarquitectura de CPU más prolífica de Intel, la tecnología del núcleo eficiente ofrecer un 40% más de rendimiento con la misma potencia y ofrece el mismo rendimiento mientras consume menos del 40% de potencia1. En cuanto al comportamiento de rendimiento, cuatro núcleos eficientes ofrecen un 80% más de rendimiento con un consumo inferior al de dos núcleos Skylake que ejecutan cuatro hilos o el mismo comportamiento de rendimiento con un consumo inferior al 80%.

Núcleo de rendimiento: Este núcleo x86 no solo es el núcleo de CPU de mayor rendimiento que ha construido Intel, sino que también brinda una función escalonada en el rendimiento de la arquitectura de la CPU que impulsará la próxima década de computación. Se diseñó como una arquitectura más amplia, profunda e inteligente para exponer más paralelismo, aumentar el paralelismo de ejecución, reducir la latencia y aumentar el rendimiento de propósito general. También ayuda a soportar aplicaciones de grandes datos y de gran huella de código. El núcleo de rendimiento brinda una mejora de aproximadamente 19% de Geomean en una amplia gama de cargas de trabajo con respecto a nuestra arquitectura actual Intel Core de 11a generación (Cypress Cove) en la misma frecuencia.

Dirigido a los procesadores de los centros de datos y a las tendencias en evolución del aprendizaje automático, el núcleo de rendimiento aporta un hardware dedicado, que incluye las nuevas extensiones matriciales avanzadas (AMX) de Intel, para realizar operaciones de multiplicación de matrices con un rendimiento de un orden de magnitud, lo que supone un aumento de casi 8 veces en la aceleración de la inteligencia artificial (IA).1 Está diseñado para facilitar el uso del software, aprovechando el modelo de programación x86.

Intel Thread Director: El enfoque exclusivo de Intel para la programación fue desarrollada para garantizar que los núcleos eficientes y los núcleos de rendimiento funcionen juntos perfectamente, asignen cargas de trabajo de manera dinámica e inteligente desde el principio y optimicen el sistema para obtener el máximo rendimiento y eficiencia en el mundo real. Con la inteligencia integrada directamente en el núcleo, Intel Thread Director trabaja perfectamente con el sistema operativo para que éste último coloque el hilo correcto en el núcleo correcto en el momento adecuado.

Alder Lake: Al redefinir la arquitectura multinúcleo, Alder Lake será la primera arquitectura híbrida de rendimiento de Intel con el nuevo Intel Thread Director. Esta es la arquitectura de sistema en chip (SoC, por sus siglas en inglés) de cliente más inteligente de Intel que presenta una combinación de núcleos eficientes y núcleos de rendimiento, escalando de ultramóvil a escritorio y liderando la transición de la industria con múltiples E/S y memoria líderes en la industria. Los productos basados en Alder Lake saldrán al mercado a enviar este año.

SoC Xe HPG y Alchemist: Una nueva microarquitectura de gráficos discretos diseñada para escalar al rendimiento de clase entusiasta para cargas de trabajo de gaming y de creación de contenido. La microarquitectura Xe HPG presenta un nuevo núcleo Xe, un elemento escalable, programable y enfocado en la computación y compatibilidad total con DirectX 12 Ultimate. Los nuevos motores de matriz dentro de los núcleos Xe (conocidos como Xe Matrix eXtensions, XMX) aceleran las cargas de trabajo de inteligencia artificial como XeSS, una nueva tecnología de escalado que permite gaming de alto rendimiento y alta fidelidad. Los SoC Alchemist basados en HPG Xe (cuyo nombre código era DG2) llegarán al mercado en el primer trimestre de 2022 bajo la nueva marca Intel Arc.

Sapphire Rapids: Al combinar los núcleos de rendimiento de Intel con nuevos motores de aceleradores, Sapphire Rapids establece el estándar para los procesadores de centros de datos de próxima generación. En el corazón de Sapphire Rapids se encuentra una arquitectura SoC modular en mosaico que ofrece una escalabilidad considerable a la vez que mantiene los beneficios de una interfaz de CPU monolítica, gracias a la tecnología de empaquetado de interconexión multidisco EMIB de Intel y la avanzada arquitectura de rejilla de Intel.

Unidad de procesamiento de infraestructura: Mount Evans es la primera IPU dedicada basada en ASIC de Intel, junto con una nueva plataforma de referencia de IPU basada en FPGA, Oak Springs Canyon. Con una arquitectura basada en la IPU de Intel, los proveedores de servicios en la nube (CSP, por sus siglas en inglés) pueden maximizar los ingresos del centro de datos al descargar las tareas de infraestructura de las CPU a las IPU. La descarga de tareas de infraestructura a la IPU permite a los CSP alquilar el 100% de sus servidores de CPU a sus clientes.

Xe HPC y Ponte Vecchio: El SoC más complejo jamás construido por Intel y un gran ejemplo de cómo cobra vida nuestra estrategia IDM 2.0, Ponte Vecchio aprovecha varios procesos de semiconductores más avanzados, nuestra revolucionaria tecnología de interconexión de múltiples matrices EMIB y nuestro proceso de empaquetado Foveros 3D. Con este producto le damos vida a nuestro gran proyecto "moon-shot", el dispositivo con 100 mil millones de transistores que ofrece operaciones de punto flotante por segundo (FLOP, por sus siglas en inglés) y densidad de computación líderes en la industria para acelerar la inteligencia artificial (IA), la computación de alto rendimiento y las cargas de trabajo de analítica avanzada. En Architecture Day 2021, mostramos que nuestro primer silicio Ponte Vecchio ya está demostrando un rendimiento de liderazgo, estableciendo un récord en la industria tanto en la inferencia como en el rendimiento de entrenamiento en un popular benchmark de IA.1 Nuestro silicio A0 tiene un rendimiento superior a 45 TFLOPS FP32, más de 5 TB por segundo de ancho de banda de tejido de memoria y más de 2 TB por segundo de ancho de banda de conectividad.1 Al igual que nuestras arquitecturas Xe, Ponte Vecchio estará habilitado por oneAPI, los kits de herramientas de software unificada abierta, basada en estándares, de arquitectura cruzada y de proveedor cruzado.

Al reflexionar sobre el año pasado, la tecnología fue el elemento central para que todos nos comunicáramos, trabajáramos, jugáramos y sobreviviéramos a la pandemia. La enorme potencia informática resultó ser crítica. De cara al futuro, enfrentamos una demanda masiva de computación cuando para 2025 potencialmente aumentará la necesidad 1000X. Ese aumento de mil veces en cuatro años es la Ley de Moore a quinta potencia.

Tal y como lo dijo nuestro CEO, Pat Gelsinger, quien también es arquitecto, en Architecture Day 2021: “Enfrentamos enormes desafíos computacionales que solo pueden resolverse mediante arquitecturas y plataformas revolucionarias...Nuestros talentosos arquitectos e ingenieros hicieron posible toda esta magia tecnológica”.

El mundo cuenta con arquitectos e ingenieros para resolver los problemas informáticos más difíciles que enriquecen la vida de las personas. Nuestra estrategia y ejecución se acelera para satisfacer estas demandas a un ritmo acelerado.

(*) Raja Koduri: Vicepresidente corporativo y gerente general senior del Grupo de sistemas informáticos acelerados y de gráficos en Intel Corporation