Hoy, el consorcio MLPerf publicó los resultados del MLPerf Training v0.7, la tercera ronda de resultados de su conjunto de pruebas de rendimiento de entrenamiento en aprendizaje automátizado. MLPerf es un consorcio de más de 70 empresas e investigadores de universidades líderes, y las suites de referencia de MLPerf son el estándar de la industria que facilita el rendimiento del aprendizaje automátizado.
Las mediciones de MLPerf son el estándar de comparación en la industria y muestra un progreso sustancial de ésta y una diversidad creciente, incluidos múltiples procesadores, aceleradores y marcos de software nuevos. En comparación con la ronda de presentaciones anterior, los resultados más rápidos en los cinco puntos de referencia sin cambios, mejoraron en un promedio de 2.7 veces, mostrando una mejora sustancial en el hardware, el software y la escala del sistema.
NVIDIA estableció récords en la categoría que más les interesa a los clientes: productos disponibles comercialmente. Se realizaron pruebas con la última arquitectura de NVIDIA, Ampere y laa arquitectura Volta.
La GPU A100 y el sistema DGX SuperPOD, un grupo masivo de A100 conectados con HDR InfiniBand, establecieron ocho nuevos hitos de rendimiento cada uno, rompiendo 16 récords en general.
Esta es la tercera prueba consecutiva y la mejor para NVIDIA en entrenamiento de MLPerf, un grupo de evaluación comparativa de la industria formado en mayo de 2018. NVIDIA estableció 6 récords en los primeros estándares de competencia para el entrenamiento de MLPerf en diciembre de 2018 y 8 en julio de 2019.
NVIDIA fue la única compañía que presentó productos disponibles comercialmente available desde ahora para todas las pruebas. La mayoría de las otras compañías presentaron la categoría de vista previa preview category para productos que pueden no estar disponibles durante varios meses o la categoría de investigación research category Para productos que no se espera que estén disponibles durante un largo tiempo.
Una ganancia de rendimiento 4 veces en 1 año y medio
Los últimos resultados demuestran que el enfoque de NVIDIA de la evolución continua de una plataforma de inteligencia artificial que abarca procesadores, redes, software y sistemas está funcionando.
Por ejemplo, las pruebas muestran tasas de rendimiento equivalentes. El sistema DGX A100 de hoy ofrece hasta 4 veces el rendimiento del sistema que utilizó las GPU V100 en la primera ronda de pruebas de entrenamiento de MLPerf. Mientras tanto, el servidor DGX V100 original ahora puede ofrecer un rendimiento hasta 2 veces mayor gracias a las últimas optimizaciones de software.
Estas ganancias llegaron en menos de dos años a partir de innovaciones en toda la plataforma de IA. Las GPU NVIDIA A100 de hoy, junto con las actualizaciones de software para las bibliotecas CUDA-X libraries, potencian los clústeres en expansión construidos con Mellanox HDR 200Gb/s InfiniBand.
Esta última ronda de capacitación abarca 138 resultados en una amplia variedad de sistemas de nueve organizaciones que presentaron la solicitud. Todos los resultados de la división cerrada usan el mismo modelo / optimizador (es), mientras que los resultados de la división abierta pueden usar enfoques más variados. Los resultados incluyen los sistemas disponibles comercialmente, los próximos sistemas de vista previa y los sistemas RDI en investigación y desarrollo, o que se utilizan internamente.
Para ver los resultados, vaya a http://mlperf.org/training-results-0-7 . El conjunto de puntos de referencia MLPerf Training mide el tiempo que tarda en superar a los modelos de aprendizaje automático en un objetivo de calidad estándar en tareas que incluyen clasificación de imágenes, recomendación, traducción y reproducción Go. Esta versión de MLPerf incluye dos nuevos puntos de referencia y un punto de referencia sustancialmente revisado.
Comentarios Cerrados