Un NPU, ou Neural Processing Unit (Unité de Traitement Neuronal), est une puce spécialisée conçue pour effectuer des opérations de traitement de l'information basées sur des modèles neuronaux ou des réseaux de neurones artificiels. Ces puces sont optimisées pour accélérer les tâches liées à l'apprentissage machine, au traitement du langage naturel, à la vision par ordinateur et à d'autres tâches associées à l'intelligence artificielle.
Contrairement aux processeurs traditionnels qui exécutent des instructions séquentielles, les NPU sont spécifiquement conçus pour gérer simultanément de grandes quantités de données et effectuer des calculs massivement parallèles, ce qui les rend particulièrement efficaces pour les tâches liées à l'apprentissage profond et aux réseaux de neurones profonds.
Les NPU sont largement utilisés dans les applications telles que la reconnaissance vocale, la classification d'images, la traduction automatique, la détection d'objets, la prédiction de séquences et bien d'autres domaines où le traitement de données massives et complexes est nécessaire. Ils contribuent à accélérer ces tâches et à améliorer les performances des systèmes d'intelligence artificielle, tant en termes de vitesse de traitement que d'efficacité énergétique.