banner

Blog

Dec 05, 2023

Google Cloud stellt seine leistungsstärkste KI vor

AKTUALISIERT 08:00 EDT / 29. AUGUST 2023

von Mike Wheatley

Google Cloud verstärkt seine Cloud-basierte Recheninfrastruktur für künstliche Intelligenz und fügt neue virtuelle Maschinen auf Basis einer Tensor-Verarbeitungseinheit und einer Grafikverarbeitungseinheit hinzu, die angeblich für die Bewältigung der anspruchsvollsten KI-Arbeitslasten optimiert sind.

Die neuen KI-optimierten VMs wurden auf der Google Cloud Next 2023 angekündigt, zusammen mit der Einführung eines aktualisierten Google Distributed Cloud-Angebots, das die Ausführung von KI- und Datenanalyse-Workloads an jedem Ort, auch am Netzwerkrand, ermöglicht. Darüber hinaus stellte Google eine neue, unternehmenstaugliche Edition von Google Kubernetes Engine für Container-basierte Anwendungen vor.

In einem Blogbeitrag sagte Amin Vahdat, General Manager für maschinelles Lernen, Systeme und Cloud-KI bei Google, dass Kunden leistungsfähigere VMs fordern, um die exponentiell wachsenden Anforderungen neuer Arbeitslasten wie generative KI und große Sprachmodelle zu bewältigen. „Die Anzahl der Parameter in LLMs ist in den letzten fünf Jahren um das Zehnfache pro Jahr gestiegen“, sagte er. „Daher benötigen Kunden eine KI-optimierte Infrastruktur, die sowohl kostengünstig als auch skalierbar ist.“

Um diesem Bedarf gerecht zu werden, hat Google das Cloud TPU v5e konzipiert, das jetzt als Vorschau verfügbar ist. Es gilt als die kosteneffizienteste, vielseitigste und skalierbarste Cloud-TPU, die jemals entwickelt wurde, und ermöglicht die Integration mit GKE, Googles Framework für maschinelles Lernen Vertex AI und verschiedenen führenden KI-Frameworks wie PyTorch, TensorFlow und JAX. Es soll für mittlere und große KI-Trainings- und Inferenzanwendungen konzipiert sein und im Vergleich zur Vorgängergeneration eine bis zu zweimal schnellere Trainingsleistung pro Dollar und eine bis zu 2,5-fache Inferenzleistung pro Dollar für LLMs und generative KI-Modelle liefern Cloud TPU v4.

Die gute Nachricht sei, dass Kunden für diese Kosteneffizienzsteigerungen weder auf Leistung noch Flexibilität verzichten müssten, sagte Vahdat. Er sagte, dass die TPU v5e-Pods ein perfektes Gleichgewicht zwischen Leistung, Flexibilität und Effizienz bieten und die Verbindung von bis zu 256 Chips mit einer Bandbreite von mehr als 400 Terabyte pro Sekunde und einer Leistung von 100 PetaOps ermöglichen. Kunden können aus acht verschiedenen VM-Setups wählen, die von einem einzelnen Chip bis zu mehr als 250 in einem einzelnen Slice reichen. Es bietet Kunden eine überragende Flexibilität beim Trainieren und Ausführen einer Vielzahl von LLMs und KI-Modellen, fügte Vahdat hinzu.

Mit der Einführung der Cloud TPU v5e VMs stellt Google auch eine neue Multislice-Technologie in der Vorschau zur Verfügung, die es ermöglicht, Zehntausende der TPU v5e-Chips oder Googles ältere TPU v4-Chips zu kombinieren. Bisher waren Kunden auf ein einzelnes Stück TPU-Chips beschränkt, was bedeutete, dass sie mit dem TPU v4 auf maximal 3.072 Chips begrenzt waren. Multislice ermöglicht Entwicklern die Arbeit mit Zehntausenden cloudbasierten Chips, die über eine Interchip-Verbindung verbunden sind.

Neben den TPU v5e-VMs kündigte Google seine neuen A3-VMs an, die auf der neuesten H100-GPU von Nvidia Corp. basieren und angeblich speziell für die anspruchsvollsten generativen KI-Workloads entwickelt wurden. Laut Google bieten sie einen enormen Leistungssprung gegenüber den A100-GPUs der vorherigen Generation, mit dreimal schnellerem Training und zehnmal mehr Netzwerkbandbreite. Aufgrund der größeren Bandbreite können Kunden ihre Modelle auf Zehntausende H100-GPUs skalieren, sagte Vahdat.

Jetzt in der Vorschau: Eine einzelne A3-VM enthält acht H100-GPUs sowie 2 Terabyte Hostspeicher und enthält außerdem die neuesten skalierbaren Xeon-Zentraleinheiten der 4. Generation von Intel, um andere Anwendungsaufgaben auszulagern.

Google sagte, dass das generative KI-Startup Anthropic AI, das ein Konkurrent von OpenAI LP ist, einer der ersten Anwender seiner neuen TPU v5e- und A3-VMs sei fortgeschrittene Modelle.

„GKE ermöglicht es uns, unsere GPU- und TPU-Infrastruktur in großem Maßstab zu betreiben und zu optimieren, während Vertex AI es uns ermöglicht, unsere Modelle über den Vertex AI Model Garden an Kunden zu verteilen“, sagte Tom Brown, Mitbegründer von Anthropic. „Die KI-Infrastruktur der nächsten Generation von Google wird Preis-Leistungs-Vorteile für unsere Workloads bringen, während wir die nächste KI-Welle weiterentwickeln.“

Google Distributed Cloud bietet Kunden die Möglichkeit, den Software-Stack von Google Cloud in ihre eigenen Rechenzentren zu integrieren, ähnlich dem Azure Stack von Microsoft Corp. Auf diese Weise können sie verschiedene lokale Anwendungen mit denselben Google Cloud-Anwendungsprogrammierschnittstellen, Steuerungsebenen, Hardware und Tools ausführen, die sie für ihre in der Cloud gehosteten Apps verwenden. „Viele Kunden mögen dieses vollständige Management“, sagte Sachin Gupta, Vizepräsident und General Manager der Infrastructure and Solutions Group von Google Cloud, in einem exklusiven Interview mit SiliconANGLE.

Mit den heutigen Updates wird Google Distributed Cloud angepasst, um Daten- und KI-Workloads an jedem Ort auszuführen, auch am Netzwerkrand, sagte Google. Diese Fähigkeiten werden durch eine Integration mit der Vertex AI-Plattform von Google ermöglicht, die erstmals mehrere maschinelle Lerndienste in die eigenen Rechenzentren des Kunden bringt.

Vertex AI auf GDC Hosted bietet vorab trainierte Modelle für Sprache, Übersetzung, optische Zeichenerkennung und mehr, und Kunden können die Plattform nutzen, um sie mithilfe ihrer eigenen Daten für spezifischere Arbeitslasten zu optimieren. Zu den weiteren Funktionen von Vertex AI auf GDC Hosted gehören Vertex Prediction, das dabei hilft, die Bereitstellung benutzerdefinierter Modelle zu automatisieren, und Vertex Pipelines, um maschinelle Lernvorgänge in großem Maßstab zu verwalten, so Google.

Google Distributed Cloud erhält außerdem Unterstützung für AlloyDB Omni, einen neuen verwalteten Datenbankdienst, der sich jetzt in der Vorschau befindet und alle Vorteile des cloudbasierten AlloyDB-Angebots in die lokalen Rechenzentren der Kunden bringt. Als PostgreSQL-kompatible Datenbank eignet sich AlloyDB Omni ideal sowohl für Transaktions-Workloads als auch für KI-Trainingsdaten, da es Vektoreinbettungen unterstützt, bei denen es sich um numerische Darstellungen von durch LLMs generierten Daten handelt.

Schließlich bringt Google neue Hardware auf den Markt, damit Kunden die Google Distributed Cloud vor Ort ausführen können. Dazu gehört ein neuer Hardware-Stack, der angeblich der bisher leistungsstärkste ist und Intels Xeon-CPUs der 4. Generation in Kombination mit Nvidias A100-GPUs und einer leistungsstarken Netzwerkstruktur mit einem Durchsatz von bis zu 400 Gigabyte pro Sekunde umfasst. Es bietet eine verbesserte virtuelle CPU-Leistung, mehr Speicher, Gen5 PCIe-Eingabe-/Ausgabe-Betriebsleistung und 400G/100G-Netzwerkverbindungen.

In der Zwischenzeit hat Google drei neue GDU Edge-Plattformen angekündigt, die auf Servern mit kleinem Formfaktor (klein, mittel und groß) mit unterschiedlichen vCPU-, RAM- und Speicherkapazitäten sowie einem robusten Design basieren, das sie ideal für den Einsatz an Standorten wie Einzelhandelsgeschäften und Restaurants macht . „Für all diese Optionen benötigen wir unterschiedliche Formfaktoren“, sagte Gupta.

Google Kubernetes Engine ist Googles Plattform zur Verwaltung von Containern, die die Komponenten moderner Anwendungen hosten. Kunden erhalten ab heute mit der Verfügbarkeit von GKE Enterprise neue Funktionen.

In einem Blogbeitrag erklärte Google, dass die GKE Enterprise Edition Multicluster-Flotten unterstützt, wodurch es erstmals möglich ist, ähnliche Arbeitslasten in dedizierten Clustern zu gruppieren, benutzerdefinierte Konfigurationen und Richtlinienleitlinien auf diese Flotten anzuwenden und sensible Arbeitslasten zu isolieren. Darüber hinaus werden neue verwaltete Sicherheitsfunktionen wie erweiterte Einblicke in Workload-Schwachstellen sowie Governance- und Richtlinienkontrollen sowie ein Managed Service Mesh hinzugefügt.

Laut Google ist GKE Enterprise vollständig verwaltet und integriert, was bedeutet, dass Kunden weniger Zeit und Aufwand für die Verwaltung der Plattform und mehr Zeit für die Entwicklung von Anwendungen und Erlebnissen für ihre Benutzer aufwenden müssen. Insbesondere unterstützt GKE Enterprise auch Hybrid- und Multicloud-Plattformen und ermöglicht so die Ausführung von Container-Workloads an jedem Ort, einschließlich anderen öffentlichen Clouds oder vor Ort.

„Kurz gesagt, GKE Enterprise macht es für verteilte Teams schneller und sicherer, selbst ihre geschäftskritischeren Workloads in großem Maßstab auszuführen, ohne dass die Kosten oder die Personalzahl steigen“, sagte Chen Goldberg, General Manager und Vice President von Google Cloud Runtimes. Sie behauptete, dass Kunden bei frühen Bereitstellungen „erstaunliche Ergebnisse“ gesehen hätten, die Produktivität um 45 % gesteigert und die Softwarebereitstellungszeiten um mehr als 70 % verkürzt hätten.

Mit Berichterstattung von Robert Hof

DANKE

Meta entfernt Tausende von Konten, die mit der Propagandakampagne der chinesischen Regierung in Verbindung stehen

Raus mit dem Alten, rein mit dem Neuen: KI prägt die Geschichte von Google Cloud Next

Mandiant warnt davor, dass Hacker immer noch Barracuda Email Security Gateway-Geräte im Visier haben

Die Aktie von Box fällt, da das Unternehmen einen knappen Gewinnanstieg und schwache Prognosen meldet

Eine multinationale Task Force bekämpft die zahlreichen Qakbot-Malware- und Botnet-Operationen

Die Aktien von HPE und HP fallen aufgrund schwacher Prognosen, da die Unternehmensausgaben hinterherhinken

Meta entfernt Tausende von Konten, die mit der Propagandakampagne der chinesischen Regierung in Verbindung stehen

POLITIK – VON JAMES FARRELL. VOR 1 STUNDE

Raus mit dem Alten, rein mit dem Neuen: KI prägt die Geschichte von Google Cloud Next

CLOUD – VON MARK ALBERTSON. VOR 1 STUNDE

Mandiant warnt davor, dass Hacker immer noch Barracuda Email Security Gateway-Geräte im Visier haben

SICHERHEIT – VON DUNCAN RILEY. VOR 2 STUNDEN

Die Aktie von Box fällt, da das Unternehmen einen knappen Gewinnanstieg und schwache Prognosen meldet

CLOUD – VON MIKE WHEATLEY. VOR 3 STUNDEN

Eine multinationale Task Force bekämpft die zahlreichen Qakbot-Malware- und Botnet-Operationen

SICHERHEIT – VON DUNCAN RILEY. VOR 3 STUNDEN

Die Aktien von HPE und HP fallen aufgrund schwacher Prognosen, da die Unternehmensausgaben hinterherhinken

INFRA – VON MIKE WEATLEY. VOR 3 STUNDEN

Verteilte Cloud-UpdatesGKE Enterprise Edition „TheCUBE ist ein wichtiger Partner der Branche. Ihr seid wirklich ein Teil unserer Veranstaltungen und wir wissen es wirklich zu schätzen, dass ihr kommt, und ich weiß, dass die Leute auch die von euch erstellten Inhalte schätzen“ – Andy JassyDANKE
AKTIE