NVIDIA mostró la GPU más grande del mundo y el producto que Jensen Huang sacó del horno realmente explotó.
Era él o esa persona, esa familiar chaqueta de cuero.
En la noche del 6 de mayo de 2014, Huang Renxun celebró la conferencia en línea NVIDIA GTC 2020 en la cocina. Debido al impacto de la epidemia de COVID-19, el evento presencial planificado en NVIDIA fue cancelado y el comunicado de prensa originalmente programado para ser publicado a través de los medios el 24 de marzo también desapareció. Después de una larga espera, Huang Renxun finalmente vio a todos frente al horno.
El GTC de este año ha tomado un camino inusual desde el calentamiento. Jen-Hsun Huang se expuso el día antes del lanzamiento y sacó del horno una nueva GPU NVIDIA A100 con arquitectura Ampere.
Sorprendentemente, aunque no puede realizar eventos fuera de línea, Nvidia es demasiado vaga para realizar transmisiones en vivo en línea y reproduce directamente el video grabado por Huang Renxun en su propia cocina para completar el lanzamiento de nuevos productos. Efectivamente, si tiene "bienes duraderos" en sus manos, no le importa la forma.
La primera GPU con arquitectura Ampere de Nvidia puede considerarse como “la más potente de la historia”. ¿Basado en un proceso de 7 nm, con 54 mil millones de transistores y un área de 826 mm? En comparación con la arquitectura Volta, el rendimiento se mejora 20 veces y se puede utilizar tanto para entrenamiento como para inferencia.
NVIDIA A100 tiene el Tensor Core de tercera generación de TF32, que puede mejorar el rendimiento de la IA con precisión FP32 de 20 veces a 19,5 billones de veces por segundo sin cambiar ningún código.
GPU-MG de instancias múltiples puede dividir una única GPU A100 en 7 GPU independientes, proporcionando diferentes capacidades informáticas según diferentes tareas, maximizando así la mejor utilización y retorno de la inversión.
La nueva tecnología de eficiencia de NVIDIA A100 aprovecha la escasez inherente de las matemáticas de IA para duplicar el rendimiento después de la optimización.
NVIDIA resume las características de NVIDIA A100 en los siguientes cinco puntos:
Huang Renxun dijo: "El diseño innovador de la arquitectura Ampere proporciona el mayor salto de rendimiento hasta la fecha para la octava generación de NVIDIA. GPU de generación, integra entrenamiento e inferencia de IA, y su rendimiento es hasta 20 veces mayor que el de la generación anterior. Por primera vez en la historia, A100 puede acelerar la expansión horizontal y vertical de las cargas de trabajo en una plataforma. aumente el rendimiento y reduzca los costos del centro de datos”.
NVIDIA A100 es la primera GPU basada en la arquitectura NVIDIA Ampere, que proporciona la mayor mejora de rendimiento entre las GPU NVIDIA VIII. También se puede utilizar para análisis de datos, computación científica y gráficos en la nube, y se ha puesto en plena producción y se ha entregado a clientes de todo el mundo.
18 Los principales proveedores de servicios y creadores de sistemas del mundo están integrando NVIDIA A100 en sus servicios y productos, incluidos Alibaba Cloud, AWS, Baidu Cloud, Cisco, Dell Technologies, Google Cloud, HPE, Microsoft Azure y Oracle.
Huang Renxun también lanzó el sistema de IA de tercera generación DGX-A100 AI basado en NVIDIA A100. DGX-A100 AI es el primer servidor de IA de un solo nodo del mundo con una potencia informática de 5 PFLOPS. Cada DGX A100 se puede dividir en hasta 56 instancias que se ejecutan de forma independiente, equipadas con 8 GPU NVIDIA A100, cada GPU admite 12 buses de interconexión NVLink.
Se entiende que, en comparación con otros servidores de CPU de alta gama, el rendimiento informático de IA del DGXA100 es 150 veces mayor, el ancho de banda de la memoria es 40 veces mayor y el ancho de banda IO es 40 veces mayor.
Huang Renxun dijo: "La IA se ha aplicado a muchos campos, como la computación en la nube, los automóviles, el comercio minorista y la atención médica, y los algoritmos de IA se están volviendo cada vez más complejos y diversos. La demanda de potencia informática de la El modelo ResNet ha aumentado 3000 veces desde 2016 hasta ahora, necesitamos una mejor solución”.
Una IA DGX-A100 tan poderosa, naturalmente, no es barata. El precio es de 199.000 dólares estadounidenses, lo que equivale aproximadamente a 1,41 millones de RMB.
Además, Huang Renxun también mencionó el clúster DGXSuper POD de nueva generación de NVIDIA, que está compuesto por 140 sistemas DGXA100 y tiene una potencia informática de IA de 700 petaflops, equivalente al rendimiento de miles de servidores.
Se entiende que el primer lote de DGXSuper POD se implementará en el Laboratorio Nacional Argonne del Departamento de Energía de EE. UU. para investigaciones relacionadas con la epidemia del nuevo coronavirus.
Además de los dos exitosos productos mencionados anteriormente, Huang también anunció el lanzamiento de NVIDIA Merlin, un marco de trabajo de extremo a extremo para crear sistemas de recomendación de próxima generación, que se está convirtiendo rápidamente en el motor de una solución más personalizada. Internet. Merlin redujo el tiempo necesario para crear un sistema de recomendación para un conjunto de datos de 100 TB de cuatro días a 20 minutos.
NVIDIA también ha lanzado muchos productos relacionados con el campo de la IA, incluido Mellanox ConnectX-6 Lx SmartNIC, la plataforma EGX Edge AI y una serie de actualizaciones y extensiones de software.
1. Tarjeta de red inteligente Ethernet Mellanox ConnectX-6 Lx SmartNIC
ConnectX-6 Lx es la primera tarjeta de red inteligente segura de la industria optimizada para 25 Gb/s y puede proporcionar dos 25 Gb/s. puerto o un puerto de 50 Gb/s.
2.Plataforma EGX Edge AI
La plataforma EGX Edge AI es el primer producto Edge AI basado en la arquitectura NVIDIA Ampere. Puede recibir datos de hasta 200 Gbps y enviarlos directamente a la memoria de la GPU. para procesamiento de señales AI o 5G.
3. Spark 3.0
NVIDIA también anunció soporte para la aceleración de GPU NVIDIA en Spark 3.0. Spark 3.0 basado en RAPIDS rompe los estándares de rendimiento para la extracción, conversión y carga de datos. Ayuda a Adobe Intelligent Services a reducir los costos informáticos en un 90 %.
4. NVIDIA Jarvis
Huang Renxun presentó en detalle NVIDIA Jarvis en la conferencia de prensa, que es una nueva plataforma de extremo a extremo que puede utilizar plenamente las potentes funciones de NVIDIA. Plataforma de IA, para crear IA conversacional multimodal en tiempo real.
5. Inteligencia artificial interactiva de Misty
En una demostración en vivo, un sistema de inteligencia artificial llamado Misty demostró el proceso interactivo de comprender y responder una serie de preguntas complejas sobre el clima en tiempo real.
En términos de conducción autónoma, NVIDIA también ha integrado la arquitectura Ampere en la nueva plataforma de unidades NVIDIA. Se entiende que empresas de conducción autónoma como Ma Xiao Zhixing y Faraday Future han anunciado la adopción de la plataforma informática NVIDIA DRIVE AGX.
La plataforma de robótica definida por software NVIDIA Isaac de NVIDIA también se utilizará en las fábricas de BMW Group. El ecosistema robótico global de NVIDIA abarca distribución, venta minorista, robots móviles autónomos, agricultura, servicios, logística, fabricación y atención médica.
La conferencia de prensa de tres años de NVIDIA estuvo llena de sinceridad y la primera arquitectura Ampere fue una gran sorpresa. El rendimiento de la GPU NVIDIA A100 se ha mejorado 20 veces, lo que supone un salto en el rendimiento.
Aunque la rueda de prensa no se retransmitió en directo, aun así estuvo llena. Una IA DGX-A100 vale mil y también confirma el clásico dicho de Jen-Hsun Huang: "Cuanto más compras, más ganas". Las soluciones de IA de NVIDIA han cubierto todos los ámbitos de la vida y se está formando un poderoso ecosistema de IA.
Ni Guangnan, académico de la Academia China de Ingeniería, dijo una vez: "El umbral para el diseño de chips es extremadamente alto. Sólo unas pocas empresas pueden permitirse los costos de I+D de chips de gama media y alta". , lo que también restringe la innovación en el campo de los chips".
La arquitectura Ampere de NVIDIA y una serie de plataformas de IA basadas en ella demostraron la fortaleza de un gigante de los chips de IA en este GTC y una vez más establecieron un punto de referencia de rendimiento.
Según los datos de previsión de Gartner, el mercado mundial de chips de inteligencia artificial se disparará en los próximos cinco años, pasando de 4.270 millones de dólares en 2018 a 34.300 millones de dólares, un aumento de más de 7 veces. Se ha visto que el mercado de chips de IA tiene un enorme potencial de crecimiento.
Aunque todavía existe una brecha en la investigación y el desarrollo de chips de IA entre China y los países desarrollados occidentales, en los últimos dos años, las empresas emergentes de chips de IA de China han recibido cientos de millones de dólares en financiación. Empresas como Huawei también han desarrollado diseños de chips impresionantes.
Sin embargo, el desarrollo de chips es extremadamente complejo. A China le falta talento y hay menos empresas chinas de semiconductores entre las 65 principales, 438+05 en ventas globales, lo que indica que China todavía necesita hacer avances significativos para competir con Estados Unidos en el campo de los semiconductores.