Cloudflare, Inc. gab am 2. April 2024 bekannt, dass Workers AI allgemein verfügbar ist und die End-to-End-Infrastruktur bereitstellt, die benötigt wird, um KI-Modelle effizient und kostengünstig für die nächste Ära von KI-Anwendungen zu skalieren und einzusetzen. Cloudflare hat inzwischen in mehr als 150 Städten weltweit GPUs im Einsatz, zuletzt in Kapstadt, Durban, Johannesburg und Lagos, den ersten Standorten in Afrika, sowie in Amman, Buenos Aires, Mexiko-Stadt, Mumbai, Neu-Delhi und Seoul, um weltweit Inferenzen mit niedriger Latenz zu ermöglichen. Workers AI wird auch erweitert, um fein abgestimmte Modellgewichte zu unterstützen, so dass Unternehmen spezialisierte, domänenspezifische Anwendungen entwickeln und einsetzen können.

Zusätzlich zu Workers AI bietet das AI Gateway von Cloudflare eine Steuerungsebene für KI-Anwendungen, die es Entwicklern ermöglicht, Anfragen dynamisch zu bewerten und an verschiedene Modelle und Anbieter weiterzuleiten. So können Entwickler Daten nutzen, um Feinabstimmungen vorzunehmen und die fein abgestimmten Aufträge direkt auf der Workers AI-Plattform auszuführen.