Histoire
En 2019, Yuri Frayman cofonde Cast AI aux États-Unis avec une intuition devenue centrale dans le cloud moderne : les entreprises migrent massivement vers Kubernetes, mais la majorité des clusters sont surprovisionnés, coûteux et gérés encore trop manuellement. Son ambition est alors de transformer l’infrastructure cloud en un système capable de s’auto-optimiser en continu, sans intervention humaine constante.
La première force du modèle repose sur une spécialisation extrêmement précise : Kubernetes automation. Là où de nombreux outils FinOps se limitent à des dashboards ou à des recommandations, Cast AI agit directement sur l’infrastructure. La plateforme analyse CPU, mémoire, nœuds, autoscaling, instances spot et workloads, puis réalloue automatiquement les ressources pour réduire les coûts et améliorer la performance.
Sous l’impulsion de Yuri Frayman, Cast AI dépasse rapidement le simple cost management pour devenir une vraie couche d’infrastructure autonome. La plateforme automatise le rightsizing, la sélection des machines virtuelles optimales, la migration live des conteneurs et l’orchestration des workloads entre AWS, Google Cloud et Azure. Cette capacité à prendre des décisions d’infrastructure en temps réel devient le cœur de son avantage compétitif.
Le véritable tournant stratégique vient de la maîtrise du multicloud intelligent. Cast AI comprend que les entreprises ne veulent plus dépendre d’un seul fournisseur cloud, particulièrement avec l’explosion des charges IA et GPU. En 2026, le lancement d’OMNI Compute transforme la société en véritable control plane unifié, capable d’étendre automatiquement les clusters Kubernetes vers d’autres régions, clouds ou marketplaces GPU sans modifier le code des applications.
La puissance du modèle vient aussi de l’autonomie décisionnelle pilotée par IA. Les agents logiciels de Cast AI prennent en continu des décisions sur le placement des workloads, le choix des GPU, l’équilibre coût/performance et la résilience applicative. L’infrastructure devient ainsi “self-driving”, capable d’adapter automatiquement ses ressources selon la charge réelle.
Sous la direction de Yuri Frayman, cette proposition séduit rapidement des entreprises mondiales comme BMW, Cisco, Hugging Face, FICO et Samsung, qui utilisent la plateforme pour opérer des environnements critiques cloud-native et IA à grande échelle.
L’année 2026 marque la bascule symbolique : grâce à un investissement stratégique de Pacific Alliance Ventures et au lancement de son GPU marketplace, Cast AI dépasse officiellement 1 milliard $ de valorisation, atteignant le statut de licorne.
Leçon à tirer
Le succès de Cast AI montre que le futur du cloud appartient aux infrastructures autonomes. En transformant Kubernetes d’un système complexe à opérer en plateforme auto-optimisée, Yuri Frayman a créé un leader mondial de l’automatisation cloud-native et multicloud.
Acteurs et organisation
Yuri Frayman — Cofondateur et CEO
Laurent Gil — Cofondateur et President
Leon Kuperman — Cofondateur et CTO
Entreprise : Cast AI
Pays : États-Unis
Période
Cofondation : 2019
Spécialisation Kubernetes : 2020 – 2023
Expansion multicloud et IA : 2024 – 2026
Statut de licorne : 2026
Sources
Image de https://refreshmiami.com/wp-content/uploads/2021/10/youri-frayman-cast.jpg
https://visionfund.com/insights/qa-yuri-frayman-cast-ai-cloud-costs

