Intel anunció hoy sus procesadores escalables Xeon de tercera generación (es decir, oro y platino), junto con las nuevas generaciones de su memoria persistente Optane (léase: SSD de latencia extremadamente baja y alta resistencia) y productos Stratix AI FPGA.
El hecho de que AMD actualmente esté superando a Intel en casi todas las métricas de rendimiento concebibles excepto La IA acelerada por hardware no es noticia en este momento. Claramente, tampoco es una novedad para Intel, ya que la compañía no hizo ninguna afirmación sobre el rendimiento de Xeon Scalable en comparación con los procesadores Epyc Rome de la competencia. Más interesante aún, Intel apenas mencionó las cargas de trabajo informáticas de uso general.
Para encontrar una explicación de la única mejora de generación en generación que no es de IA que se muestra, fue necesario pasar por varias notas al pie. Con suficiente determinación, finalmente descubrimos que la “ganancia de rendimiento promedio de 1.9X” mencionada en la diapositiva de descripción general se refiere a los puntos de referencia SPECrate 2023 “estimados o simulados” que comparan un sistema Platinum 8380H de cuatro sockets con un sistema de cuatro sockets de cinco años. E7-8890 v3.
Para ser justos, Intel parece haber introducido algunas innovaciones inusualmente impresionantes en el espacio de la IA. “Deep Learning Boost”, que anteriormente era solo una marca para el conjunto de instrucciones AVX-512, ahora también incluye un tipo de datos de punto flotante de 16 bits completamente nuevo.
Con generaciones anteriores de Xeon Scalable, Intel fue pionera e impulsó fuertemente el uso de enteros de 8 bits:INT8
—procesamiento de inferencias con su biblioteca OpenVINO. Para las cargas de trabajo de inferencia, Intel argumentó que la menor precisión de INT8
era aceptable en la mayoría de los casos, al tiempo que ofrecía una aceleración extrema de la tubería de inferencia. Sin embargo, para el entrenamiento, la mayoría de las aplicaciones todavía necesitaban la mayor precisión de FP32
Procesamiento de punto flotante de 32 bits.
La nueva generación agrega compatibilidad con procesadores de punto flotante de 16 bits, que Intel llama bfloat16
. Corte FP32
el ancho de bits de los modelos a la mitad acelera el procesamiento en sí mismo, pero lo que es más importante, reduce a la mitad la RAM necesaria para mantener los modelos en la memoria. Aprovechar el nuevo tipo de datos también es más simple para los programadores y las bases de código que usan FP32
modelos de lo que sería la conversión a enteros.
Intel también proporcionó cuidadosamente un juego que gira en torno a la eficiencia del tipo de datos BF16. No podemos recomendarlo ni como juego ni como herramienta educativa.
Aceleración de almacenamiento de Optane
Intel también anunció una nueva generación 25 por ciento más rápida de sus SSD de “memoria persistente” Optane, que se pueden usar para acelerar en gran medida la IA y otras canalizaciones de almacenamiento. Los SSD de Optane funcionan con la tecnología 3D Xpoint en lugar de los SSD típicos de flash NAND. 3D Xpoint tiene una resistencia de escritura tremendamente mayor y una latencia más baja que NAND. La latencia más baja y la mayor resistencia a la escritura la hacen particularmente atractiva como tecnología de almacenamiento en caché rápido, que incluso puede acelerar todos los arreglos de estado sólido.
La gran ventaja aquí es que la latencia extremadamente baja de Optane permite la aceleración de las canalizaciones de IA, que con frecuencia provocan cuellos de botella en el almacenamiento, al ofrecer un acceso muy rápido a modelos demasiado grandes para mantenerlos completamente en la RAM. Para canalizaciones que involucran escrituras rápidas y pesadas, una capa de caché de Optane también puede aumentar significativamente la expectativa de vida del almacenamiento primario NAND debajo de ella, al reducir la cantidad total de escrituras que realmente deben comprometerse.
Por ejemplo, un Optane de 256 GB tiene una especificación de resistencia de escritura de 360 PB, mientras que un SSD Samsung 850 Pro de 256 GB solo tiene una especificación de resistencia de 150 TB, superior a la ventaja de 1000:1 de Optane.
Mientras tanto, esta excelente revisión de Tom’s Hardware de 2023 demuestra hasta qué punto Optane deja a los SSD de grado de centro de datos tradicionales en términos de latencia.
Stratix 10 NX FPGA
Finalmente, Intel anunció una nueva versión de su Stratix FPGA. Los arreglos programables Field Gate se pueden usar como aceleración de hardware para algunas cargas de trabajo, lo que permite que más núcleos de CPU de uso general aborden tareas que los FPGA no pueden.
Imagen de listado por Intel