ABOUT 2 MONTHS AGO • 8 MIN READ

GCP Architect's Corner ☁️ : Les dernières nouveautés Data - IA (et plus encore) sur Google Cloud Platform

profile

AI values Data. Data values Business.

👋 Hello ! Je suis Vincent, Architecte IA et Lead Data Scientist. J’aide les entreprises à exploiter leurs données et à intégrer des solutions d’intelligence artificielle pour générer de la valeur. Je me suis spécialisé dans la conception de solutions IA, et je conçois des architectures data performantes et évolutives. Besoin de conseils pour vos projets data ou IA ? 🚀 Je suis là pour vous aider à transformer vos idées en solutions concrètes ! Restez au courant de mes dernières actualités via mes newsletters.

Semaine du 22 Mars 2025 au 28 Mars 2025

Hello les google cloud practitioners ! ☁️ Cette semaine, pas mal de passages en GA (General Availability), notamment côté Data & IA, mais aussi des previews intéressantes :

Réservations GPU pour Vertex AI, index vectoriels en GA pour Spanner, nouvelles fonctionnalités pour BigQuery et Looker, support d'OpenLineage dans Cloud Composer, et améliorations de Gemini Code Assist pour les développeurs.

Accrochez-vous, on décolle ! 🚀

Data et IA 🧠

Vertex AI

On commence fort avec Vertex AI ! Il est maintenant possible (en GA) de consommer des réservations de VM avec GPU pour vos jobs de training custom ou de prédiction. Fini le stress de la disponibilité des ressources GPU au moment critique ! 💪

Côté Vertex AI Workbench, la fonctionnalité de backup et restauration des données d'instance est aussi passée en GA. Sécurité et résilience avant tout ! 🛡️

Gemini

Pour les développeurs utilisant IntelliJ Gemini Code Assist (Standard et Enterprise), vous pouvez maintenant voir et personnaliser les fichiers utilisés par le chat. Mieux encore, la prise en compte du code local est disponible : incluez des fichiers de votre projet IDE local dans le contexte du prompt en tapant @. 💬

Autre annonce, la sortie de Gemini 2.5, le modèle de Google le plus performant à ce jour, avec une première version expérimentale 2.5 Pro qui s'est classé en tête des benchmarks et de LMArena à sa sortie (26 mars). Précédemment limité à NotebookLM, cette nouvelle version est testable dans Vertex AI, avec pour le moment une fenêtre de contexte de maximum 1M tokens (2M à venir).

Spanner

Grosse semaine pour Spanner : Les index vectoriels et les fonctions de distance Approximate Nearest Neighbor (ANN) en dialecte GoogleSQL sont maintenant en GA. Idéal pour accélérer vos recherches de similarité sur de gros volumes de données vectorielles.

En prime, on a le support de `ALTER VECTOR INDEX`, l'import/export des bases utilisant l'ANN, la clause `STORING` pour optimiser les filtres, et l'utilisation de l'ANN sur les instances de moins d'un nœud. Cerise sur le gâteau 🍒, les index ANN de Spanner sont supportés dans Langchain.

Et pour les utilisateurs SQL, la possibilité de sauvegarder et gérer vos scripts SQL dans Spanner Studio est dispo en preview.

BigQuery

BigQuery n'est pas en reste ! Côté migration SQL, vous pouvez maintenant activer le caching des métadonnées pour la traduction SQL (en preview), histoire de gagner du temps sur les requêtes suivantes.

Les index de recherche s'améliorent aussi avec la possibilité de définir la granularité par colonne (en preview) pour optimiser encore plus vos recherches.

Les fonctions de quantiles KLL sont disponibles en preview pour calculer efficacement des quantiles approximatifs.

Possibilité de mettre des labels sur les réservations (en preview) pour l'organisation et l'analyse de la facturation.

BigQuery Data Transfer Service peut maintenant transférer les données de reporting et de configuration de Google Analytics 4 (en preview).

Côté BigQuery ML, la visualisation des métriques de monitoring de modèles débarque en preview pour les fonctions `ML.VALIDATE_DATA_SKEW` et `ML.VALIDATE_DATA_DRIFT`.

Enfin, l'interface "Add Data" a été repensée pour une expérience plus fluide (en GA).

Looker / Looker Studio

Quelques améliorations en Preview pour les connecteurs Looker dans Looker Studio et pour Studio dans Looker :

De plus, de nouveaux connecteurs partenaires (SEMSTORM, Pango, AppsFlyer, Vista Social, Linkedin Pages -Free, WooCommerce - Free) ont été ajoutés à la galerie Looker Studio.

Cloud Composer

Le suivi de la "lignée des données" (Data Lineage) dans Cloud Composer utilise maintenant OpenLineage. La compatibilité dépendra désormais des providers Airflow eux-mêmes (classes supportées). Plus d'infos ici. Attention, le déploiement est progressif. ⏳Une nouvelle release est en cours de déploiement depuis le 26 Mars, et une maintenance GKE est prévue jusqu'au 4 Avril.

Produits Data en vrac... 📦

Autres produits ☁️

A savoir... 🧐

Pas mal de mouvements sous le capot cette semaine !

On note de nombreuses corrections de bugs (FIX)🛠️ pour :

  • Migration Center (calcul ZFS, collecte vCenter, query WMI Windows, scan IP, test credentials VMware, tri serveurs Windows, IP primaire EC2, reporting disk Linux/Windows RAID, mount points avec espaces)
  • Navigation SDK for iOS (position barre de progression, boussole RTL, caméra paysage)
  • Google Distributed Cloud (création cluster bare metal)
  • Container Optimized OS (fluent-bit, scripts, nss, logging martian ConnectX-7, debugd, power_manager, pv, npd, race condition kernel, session_manager, minijail, libseccomp, shill, breakpad, runc, guest-configs, diffutils, hwdata, which, sqlite, docker-credential-helpers, acl, botocore, dbus, socat, python-dateutil, guest-agent, double-conversion, s3transfer, go, pambase, awscli)
  • Compute Engine (perf disque N2D)
  • Cloud Composer (màj fenêtre maintenance)


Côté sécurité (SECURITY_BULLETIN)🔒, des patchs ont été appliqués sur Container Optimized OS (Kernel Linux, openssl, binutils, python, wget, glibc, libxml2, docker, oauth2, openssh) et Google Distributed Cloud (bare metal & VMware).

Attention aux changements potentiellement impactants (BREAKING_CHANGE)💥: pour Google Distributed Cloud (v1.30+), le `featureGates.enableGMPForSystemMetrics` est activé par défaut et non désactivable ; pour Cloud Composer (Airflow 2.10.2/2.9.3), le package `apache-airflow-providers-google` passe en v14.0.0, supprimant de nombreux opérateurs dépréciés.

Une dépréciation (DEPRECATION)⏳ a été annoncée pour les anciennes versions (`v1.2`, `v1.3`) du processeur Document AI Custom Extractor, au profit de la v1.4 GA ; migration nécessaire avant le 24 Septembre 2025.

Plusieurs changements non bloquants (NON_BREAKING_CHANGE)🔄 ont aussi eu lieu :

  • ajout de data centers pour Network Connectivity Center
  • changements sur Navigation SDK for iOS (barre de progression)
  • Migration Center (alerte navigateur non supporté)
  • Maps SDK for iOS (passage progressif à Metal pour PanoramaView)
  • Google SecOps SIEM (renommage règles ATI, purge logs basée sur Ingestion Timestamp)
  • Google Kubernetes Engine (plein de nouvelles versions dans les différents canaux)
  • Google Distributed Cloud (conservation backups kubeadm)
  • Dataproc (libs hadoop native par défaut pour Serverless)
  • Container Optimized OS (mesures grub, sysctl, cloud-init, Python 3.11, tags GPU)
  • Confidential VM (note sur perf N2D post-fix)
  • Cloud Run (réduction conso IP pour Direct VPC)
    Cloud Deploy (dispo dans 2 nouvelles régions)
  • Cloud Composer (packages préinstallés, builds/images Airflow)
  • Cloud Build (filtrage par région)
  • Bigtable (renommage page Monitoring)
  • Apigee hybrid/Advanced API Security (support DRZ)
  • Apigee X (release spécifique JavaCallout)
  • Anthos Config Management (màj dépendances CVE)

Enfin, des mises à jour de librairies clientes (LIBRARIES)📚 sont disponibles pour Pub/Sub (Python), Datastore (Java), Cloud Logging (Java), Bigtable (Java, Python), et BigQuery (Node.js, Go, Java).

Des problèmes connus (ISSUE)⚠️ sont listés pour Google Distributed Cloud.

Et voilà pour cette semaine ! Plein de choses à explorer et tester. On se retrouve la semaine prochaine pour d'autres news GCP. D'ici là, bon code et bonnes expérimentations ! 😉

AI values Data. Data values Business.

👋 Hello ! Je suis Vincent, Architecte IA et Lead Data Scientist. J’aide les entreprises à exploiter leurs données et à intégrer des solutions d’intelligence artificielle pour générer de la valeur. Je me suis spécialisé dans la conception de solutions IA, et je conçois des architectures data performantes et évolutives. Besoin de conseils pour vos projets data ou IA ? 🚀 Je suis là pour vous aider à transformer vos idées en solutions concrètes ! Restez au courant de mes dernières actualités via mes newsletters.