ABOUT 1 MONTH AGO • 6 MIN READ

GCP Architect's Corner ☁️ : Les dernières nouveautés Data - IA (et plus encore) sur Google Cloud Platform

profile

AI values Data. Data values Business.

👋 Hello ! Je suis Vincent, Architecte IA et Lead Data Scientist. Avec ma société TerraQuant, j’aide les entreprises à exploiter leurs données et à intégrer des solutions d’intelligence artificielle pour générer de la valeur. Je me suis spécialisé dans la conception de solutions IA, et je conçois des architectures data performantes et évolutives. Besoin de conseils pour vos projets data ou IA ? 🚀 Je suis là pour vous aider à transformer vos idées en solutions concrètes ! Restez au courant de mes dernières actualités via mes newsletters.

Semaine du 14 décembre au 20 décembre 2025

Bref résumé des news 📰 de la semaine

Ho ho ho ! 🎅 C'est Noël avant l'heure sur GCP. Alors que vous êtes peut-être déjà en train de préparer le réveillon (ou de finir vos derniers commits avant la trêve), Google nous a déposé une hotte bien remplie sous le sapin.

Cette semaine (comme chaque semaine ? 🤔), c'est l'IA générative et les Agents qui volent la vedette 🌟. On sent clairement que l'objectif est de rendre nos bases de données plus "bavardes" et nos agents plus autonomes. Gemini 3 Flash fait son entrée un peu partout, et BigQuery continue d'aspirer de la donnée de toujours plus de sources. Allez, on déballe tout ça ! 🎁

Data et IA 🧠

Vertex AI & Agent Builder

Gros focus sur les capacités agentiques cette semaine. Côté orchestration, le nouvel Agent Designer (Preview) offre une interface visuelle low-code pour concevoir et tester vos agents, ce qui devrait soulager ceux qui sont allergiques au YAML. De plus, le moteur d'agents (Agent Engine) voit ses fonctionnalités de Sessions et de Memory Bank passer en disponibilité générale (GA), stabilisant ainsi la gestion du contexte. Pour filtrer vos recherches, Vertex AI Search permet maintenant d'appliquer des filtres de pertinence au niveau du document (Preview), pratique pour éviter le bruit dans les résultats.

Gemini 3 Flash

Mais la news de la semaine, c'est Gemini 3 Flash qui arrive en Public Preview, promettant de meilleures capacités de raisonnement pour les problèmes complexes à des coûts défiant toute concurrence.

Quelques informations :

  • Rapport Qualité/Prix 👍:
    • Gemini 3 Flash se positionne sur la "frontière de Pareto", offrant des performances rivalisant avec les plus grands modèles (comme Gemini 3 Pro) mais à une fraction du coût.
    • Prix : 0,50 $/ 1M tokens en entrée et 3,00$ / 1M tokens en sortie (nettement moins cher que les 2,00 $/12,00 $ du Gemini 3 Pro).
  • Capacités de Raisonnement :
    • Il obtient un score de 90,4% sur le benchmark scientifique GPQA Diamond.
    • Sur SWE-bench Verified (codage agentique), il atteint 78,0%, surpassant non seulement la série 2.5, mais aussi le modèle plus puissant Gemini 3 Pro (76,2%).
  • Vitesse : Il est environ 3x plus rapide que Gemini 2.5 Pro (pour un coût 2 à 3 fois inférieur).

Gemini 3 Flash devient le moteur par défaut pour plusieurs produits Google :

  • Application Gemini : Il remplace Gemini 2.5 Flash, offrant gratuitement une meilleure capacité multimodale (compréhension vidéo/audio) et de raisonnement.
  • Recherche Google (AI Mode) : Il permet des réponses plus nuancées et structurées lors des recherches complexes (ex: planification de voyage).

FunctionGemma

Attendez, je croyais que la news de la semaine c'était Gemini Flash 3 ? Que nenni : après tout, c'est l'époque des cadeaux et on en a là un joli, croyez-moi. Google annonce la sortie de FunctionGemma, une version spécialisée de son modèle Gemma 3 270M. Ce modèle a été spécifiquement affiné (fine-tuned) pour le "function calling" (appel de "tools" finalement), répondant à la demande croissante des développeurs pour des agents capables non seulement de dialoguer, mais d'agir concrètement via des API.

video preview

  • Conçu pour le "Edge" (Périphérie) : Le modèle est extrêmement léger (270 millions de paramètres), ce qui lui permet de tourner localement sur des appareils comme le NVIDIA Jetson Nano ou des smartphones. Cela garantit une faible latence et une confidentialité totale des données (fonctionnement hors ligne).
  • Actions et Conversations unifiées : FunctionGemma peut générer des appels de fonctions structurés pour exécuter des outils, puis changer de contexte pour résumer les résultats en langage naturel pour l'utilisateur.
  • Le Fine-Tuning est la clé : Contrairement aux modèles généralistes basés sur le "prompting", FunctionGemma est conçu pour être spécialisé. Google a démontré qu'un fine-tuning spécifique permet de faire passer la précision du modèle de 58% à 85% sur des tâches mobiles.
  • Architecture flexible : Il peut agir comme un agent indépendant pour des tâches privées ou comme un "contrôleur de trafic" intelligent, traitant les commandes simples localement et redirigeant les tâches complexes vers des modèles plus grands (comme Gemma 3 27B).

Ce modèle est idéal si :

  1. Vous avez une surface d'API définie (domotique, navigation, contrôle média).
  2. Vous privilégiez le déploiement local (priorité à la vitesse et à la vie privée).
  3. Vous avez besoin d'un comportement déterministe et fiable (via fine-tuning).

Bases de données : "Do you speak SQL ?" 🗣️

La tendance "Chat with your data" se concrétise directement dans les services de bases de données. Google lance les "Data Agents" en Preview pour plusieurs services : Spanner, Cloud SQL pour PostgreSQL et MySQL, ainsi qu'AlloyDB. Cela permet de construire des agents capables d'interagir en langage naturel avec vos données relationnelles.
Par ailleurs, AlloyDB se dote du support de Gemini 3.0 Flash pour ses fonctions d'IA générative et optimise ses performances avec le Managed connection pooling qui passe GA.

La nouvelle approche via l'API AlloyDB AI natural language pour permettre aux applications "agentiques" (agents IA) d'interagir avec des bases de données en langage naturel (NL) annonce une précision proche de 100 % (voir article de blog).

BigQuery

Le service de Data Transfer continue d'étendre ses "tentacules". Il est désormais possible de transférer des données depuis MySQL et Oracle vers BigQuery en GA. En Preview, le support s'ouvre à Microsoft SQL Server, ainsi qu'aux sources marketing comme Klaviyo et HubSpot.
💡Un point intéressant pour les architectures Lakehouse : BigQuery permet maintenant d'ingérer des données directement depuis des sources blob (S3, Azure Blob Storage) vers des tables BigLake Iceberg (Preview).

Gemini Enterprise

Il est maintenant possible de planifier l'exécution d'agents pour des tâches récurrentes. Les administrateurs apprécieront de pouvoir surveiller l'usage avec des métriques au niveau utilisateur (Preview) et de visualiser l'utilisation des quotas groupés (Public Preview).

Cloud Run et MCP

Petite astuce pour déployer vos services MCP : c'est bien d'avoir tout un tas de services MCP, mais cela nécessite un serveur. Cela peut devenir cher et contraignant de déployer une VM juste pour un service MCP requêté 2 fois par jour... C'est ici que Cloud Run permet de le faire à bas coût, grâce à ses capacités natives d'auto-scaling.

Une documentation sur ce sujet spécifique existe et cela a été mis à l'honneur dans le dernier épisode de Serverless Expeditions de Martin Omander.

video preview

Produits Data en vrac... 📦

  • Cloud Storage : Vous pouvez désormais utiliser Anywhere Cache pour accélérer les lectures BigQuery. De plus, les datasets "Storage Insights" pour analyser l'activité sont disponibles.
  • Dataform : Le mode Strict act-as est maintenant GA, renforçant la sécurité en exigeant des permissions explicites sur les comptes de service.
  • Colab Enterprise : Les scripts de post-démarrage sont GA, idéal pour installer vos packages préférés automatiquement au lancement des runtimes.
  • Document AI : Un nouveau tableau de bord de monitoring est disponible en Preview pour suivre les performances de vos processeurs.
  • Cloud SQL : Les sauvegardes améliorées (Enhanced backups) avec rétention centralisée sont GA pour SQL Server, MySQL et PostgreSQL.
  • Sensitive Data Protection : Un nouveau détecteur pour les visages (PERSON/FACE) est disponible en Preview.

Autres produits ☁️

  • Cloud Run & Functions : Le support du runtime Python 3.14 est disponible en GA. Pour les amateurs de Go, un runtime "OS only" est en Preview.
  • Google Kubernetes Engine (GKE) : Le séquencement des déploiements (Rollout sequencing) avec des étapes personnalisées est en Preview, offrant un contrôle plus fin sur les mises à jour de flottes.
  • Compute Engine : Disponibilité générale du modèle de provisionnement "flex-start" pour les VMs G4 (GPU), offrant des réductions intéressantes pour les workloads flexibles.
  • Security Command Center : Les détecteurs de menaces sur les conteneurs (Container Threat Detection) passent en GA.
  • Apigee : Sortie de la version Hybrid v1.16 et support des AppGroups pour la monétisation.
  • App Hub : Il est maintenant possible d'enregistrer plusieurs ressources simultanément dans une application.
  • VPC Service Controls : L'analyseur de violations (violation analyzer) est GA, simplifiant grandement le debug des règles d'accès.
  • Cloud Composer : Les environnements de taille "Extra Large" sont maintenant GA pour supporter des milliers de DAGs.
  • Migration Center : Une nouvelle fonctionnalité en Preview permet de visualiser les dépendances réseaux entre vos serveurs.

A savoir... 🧐

Dans les coulisses, quelques ajustements et corrections. Côté sécurité, une vague importante de correctifs (CVEs) a été appliquée sur les images Container Optimized OS et GKE, pensez à vérifier vos versions si vous gérez vos nœuds manuellement.

💡Une petite note sur le portefeuille : les prix de Vertex AI Agent Engine ont été revus (à la baisse pour le Runtime, mais attention, la facturation des Sessions et du Memory Bank débutera en 2026). Enfin, Cortex Framework déprécie sa fonctionnalité Data Mesh au profit de Dataplex Universal Catalog.

Sur ce, je vous souhaite un excellent réveillon et un Joyeux Noël ! 🎄 Profitez bien de la trêve (et des déploiements) ! On se retrouve la semaine prochaine pour la dernière édition de l'année. 👋

AI values Data. Data values Business.

👋 Hello ! Je suis Vincent, Architecte IA et Lead Data Scientist. Avec ma société TerraQuant, j’aide les entreprises à exploiter leurs données et à intégrer des solutions d’intelligence artificielle pour générer de la valeur. Je me suis spécialisé dans la conception de solutions IA, et je conçois des architectures data performantes et évolutives. Besoin de conseils pour vos projets data ou IA ? 🚀 Je suis là pour vous aider à transformer vos idées en solutions concrètes ! Restez au courant de mes dernières actualités via mes newsletters.