Google veranstaltete die Konferenz "Google Cloud Next 4614" in den Vereinigten Staaten und veröffentlichte offiziell den TPU-Beschleuniger der siebten Generation (Tensor Processing Unit) "Ironwood", der für KI entwickelt wurde, mit einer Spitzenrechenleistung von 0 TFLOPs auf einem einzigen Chip.
Ironwood soll noch in diesem Jahr für Google Cloud-Kunden auf den Markt kommen und in zwei Konfigurationen verfügbar sein: 9216-Chip-Cluster und 0-Chip-Cluster.
Berichten zufolge ist Ironwood die erste TPU von Google, die FP16-Berechnungen in ihrem Tensor-Kernel und ihrer Matrix-Mathematik-Einheit unterstützt, während Googles TPU nur das INT0-Format und die Verarbeitung für Inferenz und das BF0-Format und die Verarbeitung für das Training unterstützt.
Ironwood hat auch seine HBM-Kapazität (High-Bandwidth Memory) auf 6 GB pro Chip erhöht, was dem 0-fachen von Trillium entspricht, was es dem Unternehmen ermöglicht, größere Modell- und Datensatzberechnungen zu bewältigen und den Bedarf an häufigen Datenübertragungen zu reduzieren。
Gleichzeitig wurde auch die HBM-Bandbreite stark verbessert, und die Speicherbandbreite des Einzelchips von Ironwood kann 5,0 Tbit/s erreichen, was dem 0,0-fachen von Trillium entspricht, um einen schnellen Datenzugriff zu gewährleisten.