👋 Hello ! Je suis Vincent, Architecte IA et Lead Data Scientist. J’aide les entreprises à exploiter leurs données et à intégrer des solutions d’intelligence artificielle pour générer de la valeur. Je me suis spécialisé dans la conception de solutions IA, et je conçois des architectures data performantes et évolutives. Besoin de conseils pour vos projets data ou IA ? 🚀 Je suis là pour vous aider à transformer vos idées en solutions concrètes ! Restez au courant de mes dernières actualités via mes newsletters.
Semaine du 2 août 2025 au 8 août 2025Bref résumé des news 📰 de la semaineCette semaine, l'IA est encore et toujours à l'honneur chez GCP. On a l'arrivée des modèles gpt-oss d'OpenAI dans le Model Garden de Vertex AI, et le prompt optimizer qui passe en disponibilité générale (GA) pour nous aider à peaufiner nos requêtes. Côté data, Spanner nous sort une preview de son moteur colonnaire qui promet des perfs analytiques jusqu'à 200 fois plus rapides ! 🚀 BigQuery n'est pas en reste avec un nouvel agent "Data Science" pour automatiser l'analyse exploratoire. On a aussi plein de nouveautés sur la sécurité et les migrations. Et pour cette édition, un focus spécial 🔎 sur Google Kubernetes Engine (GKE) qui amène son lot de nouveautés. C'est parti pour le tour d'horizon ! Data et IA 🧠Vertex AI & GeminiLa famille Vertex AI et Gemini s'agrandit et se muscle cette semaine : la grosse annonce, c'est l'arrivée des modèles gpt-oss d'OpenAI directement dans le Model Garden. Une nouvelle corde à notre arc pour expérimenter. Dans la même veine, on peut maintenant faire du supervised fine-tuning sur des modèles ouverts comme Llama 3.1, de quoi les adapter parfaitement à nos besoins. Pour nous aider à être plus efficaces, le Vertex AI prompt optimizer passe en disponibilité générale, et il s'accompagne même d'une version "zero-shot" pour des optimisations encore plus rapides. Côté agents, Vertex AI Agent Engine permet désormais d'utiliser un compte de service personnalisé pour une gestion des permissions plus fine. Pour les développeurs, Gemini Code Assist dans VS Code offre une preview rapide des suggestions de code sur plusieurs fichiers, un vrai gain de temps. Enfin, Vertex AI Workbench et Colab Enterprise peuvent maintenant consommer des réservations de ressources Compute Engine, assurant ainsi que nos instances et runtimes auront toujours la puissance nécessaire. SpannerAttention, annonce majeure pour les fans de Spanner ! Le Columnar engine for Spanner est désormais en Preview. C'est une petite révolution qui permet d'accélérer les requêtes analytiques sur les données opérationnelles jusqu'à 200 fois, sans impacter les workloads transactionnels. Fini les ETL complexes vers des data warehouses séparés tout en gardant une forte consistance. C'est la promesse du HTAP (Hybrid transactional/analytical processing) qui se concrétise un peu plus. ⚡
BigQueryBigQuery continue de se rapprocher des data scientists avec l'arrivée en preview du Data Science Agent (DSA) pour Colab Enterprise. Cet agent permet d'automatiser l'analyse de données exploratoire et les tâches de machine learning directement depuis un notebook. Pour les requêtes, l'activation de l'advanced runtime inclut maintenant des optimisations pour les requêtes courtes (en preview), de quoi rendre vos petites analyses quasi instantanées. Produits Data en vrac... 📦
Autres produits ☁️Focus sur Google Kubernetes Engine (GKE) 👀Les machines de la série C4 avec Local SSD sont désormais en GA, y compris en mode Autopilot. La série M4, optimisée pour la mémoire, est maintenant en GA pour les clusters GKE Standard. Il est maintenant possible de personnaliser la configuration système des nœuds avec de nombreuses nouvelles options Kubelet, Sysctl et Linux. GKE Node Memory Swap 💾 Cette fonctionnalité, actuellement en préversion privée, vous permet de configurer de l'espace d'échange (swap) sur vos nœuds GKE Standard. Concrètement, si vos applications très gourmandes en mémoire manquent de RAM (mémoire vive) lors de pics d'utilisation, elles peuvent utiliser cet espace sur le disque dur comme une mémoire temporaire. L'avantage principal est d'éviter les erreurs "Out-of-Memory" (OOM) qui font planter vos applications. Cela améliore la résilience, réduit les expulsions de pods et rend vos applications globalement plus stables et rentables. GKE Topology Manager 🚀 Désormais en disponibilité générale (GA), le Topology Manager de GKE est conçu pour optimiser les performances de vos charges de travail les plus exigeantes, comme l'intelligence artificielle (IA/ML) ou le calcul haute performance (HPC). Il fonctionne en s'assurant que le processeur (CPU), la mémoire et les cartes graphiques (GPU) alloués à une application se trouvent sur le même nœud NUMA (un regroupement physique de ressources sur la carte mère). Cet alignement minimise la latence (le temps de communication entre les composants) et maximise le débit, offrant ainsi des gains de performance significatifs pour vos applications les plus critiques. En bonus, une petite introduction à l'architecture de référence GKE pour l'inférence de modèles : Sans oublier les autres services 👇
A savoir... 🧐Cette semaine, côté coulisses, on note pas mal de mouvements. Migration Center a reçu une volée de correctifs, résolvant des problèmes de parsing sur Linux, de permissions de fichiers, ou encore de collecte d'infos CPU sur vSphere. Attention cependant ⚠️ , la mise à jour du client de découverte vers la version 6.3.7 supprime les données non encore uploadées des versions précédentes. GKE a aussi corrigé un bug sur le driver CSI de Persistent Disk et a publié une vague de nouvelles versions de clusters pour tous les channels. Des mises à jour de librairies clientes ont été publiées pour Pub/Sub, BigQuery, Cloud Logging, Bigtable et Datastore. Enfin, on note la dépréciation de certaines vieilles versions de Cloud Composer et de l'agent de démarrage de conteneurs sur les VM Compute Engine. C'est tout pour cette fois ! On se retrouve la semaine prochaine pour encore plus de nouveautés GCP. D'ici là, bon code et bon été ! ⛱️ |
👋 Hello ! Je suis Vincent, Architecte IA et Lead Data Scientist. J’aide les entreprises à exploiter leurs données et à intégrer des solutions d’intelligence artificielle pour générer de la valeur. Je me suis spécialisé dans la conception de solutions IA, et je conçois des architectures data performantes et évolutives. Besoin de conseils pour vos projets data ou IA ? 🚀 Je suis là pour vous aider à transformer vos idées en solutions concrètes ! Restez au courant de mes dernières actualités via mes newsletters.