Die Renesas Electronics Corporation hat die Entwicklung einer eingebetteten Prozessortechnologie bekannt gegeben, die höhere Geschwindigkeiten und einen geringeren Stromverbrauch in Mikroprozessoreinheiten (MPUs) ermöglicht, die fortschrittliche KI realisieren. Die neu entwickelten Technologien sind wie folgt: (1) ein auf einem dynamisch rekonfigurierbaren Prozessor (DRP) basierender KI-Beschleuniger, der leichtgewichtige KI-Modelle effizient verarbeitet, und (2) eine heterogene Architekturtechnologie, die Echtzeitverarbeitung durch kooperativ arbeitende Prozessor-IPs, wie z.B. die CPU, ermöglicht. Renesas hat einen Prototyp einer eingebetteten KI-MPU mit diesen Technologien hergestellt und deren Hochgeschwindigkeits- und Niedrigverbrauchsbetrieb bestätigt.

Er erreichte eine bis zu 16-mal schnellere Verarbeitung (130 TOPS) als vor der Einführung dieser neuen Technologien und eine Energieeffizienz von Weltklasse (bis zu 23,9 TOPS/W bei 0,8 V Versorgungsspannung). Mit der jüngsten Verbreitung von Robotern in Fabriken, in der Logistik, im medizinischen Bereich und in Geschäften wächst der Bedarf an Systemen, die autonom und in Echtzeit arbeiten können, indem sie ihre Umgebung mithilfe fortschrittlicher KI erkennen. Da es insbesondere bei eingebetteten Geräten strenge Beschränkungen für die Wärmeentwicklung gibt, sind bei KI-Chips sowohl eine höhere Leistung als auch ein geringerer Stromverbrauch erforderlich.

Renesas hat neue Technologien entwickelt, um diesen Anforderungen gerecht zu werden, und diese Errungenschaften am 21. Februar auf der International Solid-State Circuits Conference 2024 (ISSCC 2024) vorgestellt, die vom 18. bis 22. Februar 2024 in San Francisco stattfindet. Die von Renesas entwickelten Technologien sind wie folgt: (1) Ein KI-Beschleuniger, der leichtgewichtige KI-Modelle effizient verarbeitet - Eine typische Technologie zur Verbesserung der KI-Verarbeitungseffizienz ist das Pruning, bei dem Berechnungen weggelassen werden, die die Erkennungsgenauigkeit nicht wesentlich beeinträchtigen. Es ist jedoch üblich, dass Berechnungen, die die Erkennungsgenauigkeit nicht beeinflussen, zufällig in KI-Modellen vorhanden sind.

Dadurch entsteht ein Unterschied zwischen der Parallelität der Hardware-Verarbeitung und der Zufälligkeit des Pruning, was die Verarbeitung ineffizient macht. Um dieses Problem zu lösen, hat Renesas seinen einzigartigen DRP-basierten KI-Beschleuniger (DRP-AI) für Pruning optimiert. Durch die Analyse des Zusammenhangs zwischen den Merkmalen von Beschneidungsmustern und einer Beschneidungsmethode und der Erkennungsgenauigkeit in typischen KI-Modellen für die Bilderkennung (CNN-Modelle) wurde die Hardwarestruktur eines KI-Beschleunigers identifiziert, mit der sowohl eine hohe Erkennungsgenauigkeit als auch eine effiziente Beschneidungsrate erreicht werden kann, und auf das Design der DRP-AI angewendet.

Darüber hinaus wurde eine Software entwickelt, um das Gewicht der für diese DRP-AI optimierten KI-Modelle zu reduzieren. Diese Software wandelt die zufällige Pruning-Modellkonfiguration in hocheffizientes paralleles Computing um, was zu einer schnelleren KI-Verarbeitung führt. Insbesondere die hochflexible Pruning-Unterstützungstechnologie von Renesas (flexible N:M Pruning-Technologie), die die Anzahl der Zyklen als Reaktion auf Änderungen der lokalen Pruning-Rate in KI-Modellen dynamisch ändern kann, ermöglicht eine Feinsteuerung der Pruning-Rate je nach Energieverbrauch, Betriebsgeschwindigkeit und Erkennungsgenauigkeit, die der Benutzer benötigt.

Diese Technologie reduziert die Anzahl der Verarbeitungszyklen von KI-Modellen auf nur ein Sechzehntel der Beschneidung inkompatibler Modelle und verbraucht weniger als ein Achtel des Stroms. (2) Heterogene Architekturtechnologie, die eine Echtzeitverarbeitung für die Robotersteuerung ermöglicht - Roboteranwendungen erfordern eine fortschrittliche KI-Verarbeitung für die Erkennung der Umgebung. Die Beurteilung von Roboterbewegungen und die Steuerung des Roboters erfordern hingegen eine detaillierte Programmierung der Bedingungen als Reaktion auf Veränderungen in der Umgebung, so dass eine CPU-basierte Softwareverarbeitung besser geeignet ist als eine KI-basierte Verarbeitung.

Die Herausforderung besteht darin, dass CPUs mit aktuellen Embedded-Prozessoren nicht vollständig in der Lage sind, Roboter in Echtzeit zu steuern. Aus diesem Grund hat Renesas neben der CPU und dem KI-Beschleuniger (DRP-AI) einen dynamisch rekonfigurierbaren Prozessor (DRP) eingeführt, der die komplexe Verarbeitung übernimmt. Dies führte zur Entwicklung einer heterogenen Architekturtechnologie, die höhere Geschwindigkeiten und einen geringeren Stromverbrauch in KI-MPUs ermöglicht, indem sie die Prozesse entsprechend verteilt und parallelisiert.

Ein DRP führt eine Anwendung aus, während er die Konfiguration der Schaltkreisverbindungen zwischen den Recheneinheiten innerhalb des Chips für jeden Operationstakt entsprechend den Verarbeitungsdetails dynamisch ändert. Da auch bei komplexen Verarbeitungen nur die notwendigen Rechenschaltungen arbeiten, sind ein geringerer Stromverbrauch und höhere Geschwindigkeiten möglich. SLAM (Simultaneous Localization and Mapping), eine der typischen Roboteranwendungen, ist zum Beispiel eine komplexe Konfiguration, die mehrere Programmierprozesse für die Positionserkennung des Roboters parallel zur Umgebungserkennung durch die KI-Verarbeitung erfordert.

Renesas demonstrierte den Betrieb dieses SLAM durch sofortige Programmumschaltung mit dem DRP und den parallelen Betrieb des KI-Beschleunigers und der CPU, was zu einer etwa 17-mal schnelleren Betriebsgeschwindigkeit und einer etwa 12-mal höheren Betriebseffizienz als bei der eingebetteten CPU allein führt. Betriebsverifizierung- Renesas hat einen Prototyp eines Testchips mit diesen Technologien entwickelt und bestätigt, dass er bei einer normalen Betriebsspannung von 0,8 V für den KI-Beschleuniger eine Leistungseffizienz von 23,9 TOPS pro Watt und für die wichtigsten KI-Modelle eine Leistungseffizienz von 10 TOPS pro Watt erreicht. Es wurde auch bewiesen, dass die KI-Verarbeitung ohne Lüfter oder Kühlkörper möglich ist.

Die Nutzung dieser Ergebnisse hilft bei der Lösung des Problems der Wärmeentwicklung aufgrund des erhöhten Stromverbrauchs, das eine der Herausforderungen bei der Implementierung von KI-Chips in einer Vielzahl von eingebetteten Geräten wie Servicerobotern und fahrerlosen Fahrzeugen darstellt. Die deutliche Verringerung der Wärmeentwicklung wird dazu beitragen, dass sich die Automatisierung in verschiedenen Branchen wie der Robotik und der intelligenten Technologie ausbreitet. Diese Technologien werden in den Renesas?

RZ/V Serie?MPUs für KI-Anwendungen eingesetzt.