Semaine du 29 mars 2025 au 4 avril 2025

Bref résumé des news 📰 de la semaine

Hello les data & AI geeks ! 👋 Cette semaine, Google Cloud a mis le paquet sur les services Data et IA, notamment BigQuery.

Celui-ci continue son intégration poussée avec Gemini et lance les UDF Python en preview (et pleins d'autres features). Spanner n'est pas en reste avec la GA des index de recherche JSON et des améliorations sur les graphes. Text-to-Speech nous offre de nouvelles voix HD en GA avec Chirp 3.

Côté autres services, GKE améliore le monitoring applicatif, Cloud Run passe les sidecars (multi-containers) en GA pour les jobs, et Cloud Storage rend les opérations batch et le FUSE monitoring disponibles pour tous. Pas mal de mouvement aussi du côté de la sécurité et des intégrations diverses.

Sinon, petit rappel : Google Cloud Next'25, c'est du 9 au 11 avril (donc demain quand vous recevrez cette NL). Même si vous n'avez pas prévu d'aller à Las Vegas, vous pouvez toujours vous inscrire en ligne pour profiter du streaming et revoir les sessions que vous auriez manquées en live dans un deuxième temps.

Data et IA 🧠

BigQuery

BigQuery ML s'enrichit de nouvelles fonctions d'IA générative (AI.GENERATE, AI.GENERATE_BOOL, AI.GENERATE_INT, AI.GENERATE_DOUBLE) en preview, permettant d'analyser du texte avec un modèle Vertex AI Gemini et d'obtenir une réponse typée. Pratique pour contrôler sa sortie ! ✨

Toujours en preview, la fonction AI.GENERATE_TABLE permet désormais de générer des données structurées avec les modèles Gemini 1.5 Pro, 1.5 Flash, et 2.0 Flash. L'argument output_schema facilite la mise en forme de la sortie pour une conversion aisée en table BigQuery. Un tutoriel est disponible pour tester ça. 📊 En somme, cela vous permet de transformer de la donnée non structurée en donnée structurée tout en restant en SQL.

Les User-Defined Functions (UDF) en Python débarquent en preview ! Elles supportent l'utilisation de bibliothèques additionnelles et d'APIs externes. De quoi étendre considérablement les capacités d'analyse directement dans BigQuery. 🐍 A surveiller tout de même en termes de coûts car il y aura des frais selon le compute et mémoire utilisés, pour la construction ou la reconstruction de l'image du conteneur UDF, ainsi que des frais réseau si trafic sortant externe.

Exemple d'UDF Python qui peut servir à appeler une API tierce de traduction

Gemini dans BigQuery Notebooks peut maintenant générer du code utilisant les bibliothèques BigFrames (en preview). Il suffit d'inclure l'intention dans votre prompt, comme par exemple "[...] using bigframes". Pour rappel, BigFrames permet d'utiliser une syntaxe pandas familière tout en exécutant les calculs directement dans BigQuery, évitant ainsi de charger les données en mémoire pour analyser des volumes importants.

La syntaxe "Pipe", qui vise à rendre les requêtes plus lisibles et maintenables, est maintenant en disponibilité générale (GA). 🛠️ Je remets la vidéo d'intro à cette syntaxe maintenant qu'elle est GA :

La création de modèles de contribution analysis via `CREATE MODEL` est maintenant en GA, avec de nouvelles options comme `top_k_insights_by_apriori_support` et `pruning_method`. Utilisez la fonction `ML.GET_INSIGHTS` pour générer des insights sur les métriques clés. Plusieurs types de métriques sont supportés.

Le Change Data Capture (CDC) supporte maintenant la définition d'un `_CHANGE_SEQUENCE_NUMBER` pour gérer l'ordre des `UPSERT` en streaming (GA).

Les politiques d'accès au niveau ligne (row level access policies) supportent maintenant les sous-requêtes, y compris pour les tables managées BigLake et via la BigQuery Storage Read API. C'est maintenant en GA. Sécurité affinée ! 🔒

Les tables externes Iceberg supportent maintenant le merge-on-read (GA), permettant d'interroger des tables Iceberg avec des position deletes et equality deletes. 🧊

Pour finir, côté BigQuery Studio, les pipelines BigQuery (ex-workflows) pour orchestrer SQL/notebooks sont en GA, tout comme la page de planification associée. On peut aussi inclure des tâches de préparation de données dans ces pipelines (Preview).

Spanner

Les index de recherche pour les colonnes JSON (GoogleSQL) et JSONB (PostgreSQL) sont maintenant en disponibilité générale (GA). Cela accélère de nombreuses requêtes sur les documents JSON, même sans connaissance préalable de leur structure. Les fonctions `JSON_CONTAINS` (SQL) et les opérateurs `@>` / `<@` (PG) peuvent utiliser ces index. 🚀

Spanner Graph permet maintenant de visualiser les éléments retournés par une requête Spanner Graph, ainsi que le schéma du graphe. Très utile pour comprendre les résultats et les relations entre nœuds/arêtes. 🕸️

De nouvelles fonctions de mutation JSON sont supportées en GoogleSQL (`JSON_ARRAY_APPEND`, `JSON_ARRAY_INSERT`, `JSON_REMOVE`, `JSON_SET`, `JSON_STRIP_NULLS`) et en PostgreSQL (`jsonb_insert`, `jsonb_set`, `jsonb_set_lax`, `jsonb_strip_nulls`, et les opérateurs `||` et `-`).

Les fonctions `JSON_KEYS` (GoogleSQL) et `json_object_keys` (PostgreSQL) pour extraire les clés JSON uniques sont en GA.

Text-to-Speech

Bonne nouvelle pour les amateurs de génération de voix : les voix HD Chirp 3 (8 speakers, 31 locales) sont maintenant en disponibilité générale (GA). Elles offrent du streaming temps réel et du traitement par lot, accessibles dans plusieurs régions. N'hésitez pas à consulter la section sur les contrôles vocaux. 🗣️

Looker / Looker Studio

Dans Looker Studio, vous pouvez maintenant insérer des données directement dans des éléments texte grâce aux variables de résultats de requête. Choisissez une cellule d'un tableau et Looker Studio la maintiendra à jour. Malin !

Les graphiques modernes (Modern charts) sont maintenant en GA et activés par défaut pour les nouveaux rapports Looker Studio. Ils offrent plus d'options de style et de configuration. Les anciens rapports peuvent être mis à niveau.

Pour avoir une idée rapide de ces features graphique, j'ai pu trouvé une petite démo qui résume tout en environ 8 mins, en faisant la comparaison entre les features annoncées et comment cela se passe dans l'interface (pas toujours avec succès 😅).

Le connecteur Looker s'améliore : il peut maintenant se connecter à une instance Looker (Google Cloud core) en IP privée uniquement ou via Private Service Connect en utilisant l'ID d'instance Looker (GA).

Dans Looker (en preview pour Studio), vous pouvez maintenant vous connecter à Google BigQuery et Google Sheets en utilisant les identifiants du propriétaire. Le formatage localisé des nombres est également supporté.

Gemini / Gemini Code Assist

La personnalisation du code pour le chat est maintenant en GA pour Gemini Code Assist dans VS Code et IntelliJ. Cela fournit des suggestions de code et des insights contextuellement pertinents directement dans l'interface de chat de votre IDE, sans configuration supplémentaire. 🤖💻

Google Agentspace (Enterprise / NotebookLM)

Le support des VPC Service Controls pour Google Agentspace Enterprise est en GA.

Pour Google NotebookLM Enterprise, les clés de chiffrement gérées par le client (CMEK) sont en GA pour les régions US et EU. L'utilisation d'EKM ou HSM avec CMEK est en GA mais nécessite une inscription sur liste d'attente.

Access Transparency supporte maintenant Google NotebookLM Enterprise en GA. Voir comment l'activer.

Google Agentspace Enterprise supporte maintenant les CMEK pour les connecteurs de données tiers (GA) et Google NotebookLM Enterprise est maintenant certifié pour la conformité HIPAA. 🩺

Produits Data en vrac... 📦

Cloud Storage: Les opérations batch de stockage sont en GA pour agir sur des milliards d'objets de manière serverless. Le monitoring des performances de Cloud Storage FUSE via des métriques est disponible.
Dataproc Metastore: La fédération supporte maintenant les services multi-régionaux.
Dataproc: Nouvelles versions runtime pour Serverless for Spark (1.1.98, 1.2.42, 2.2.42, et versions précédentes 1.1.97, 1.2.41, 2.2.41). Nouvelles versions d'image pour Dataproc on Compute Engine (2.2.51).
Cloud TPU: Le Flex-start pour Cloud TPU est dispo en Preview, utilisant le Dynamic Workload Scheduler pour provisionner dynamiquement des TPU jusqu'à 7 jours via l'API queued resources.
Cloud SQL for PostgreSQL / MySQL: Le Managed Connection Pooling (MCP) est dispo en Preview pour optimiser l'utilisation des ressources (lien pour MySQL).
Colab Enterprise: Un bouton permet de passer sur un runtime par défaut avec GPU (Preview).
Manufacturing Data Engine: Arrivée des Configuration Packages (voir aussi le contenu des fichiers) et du Development Mode. Annonce de la release 1.5.0 (non critique).
Mainframe Connector: Version 5.16.0 avec un nouveau framework de transcodage (preview) utilisant les commandes qsam decode et qsam encode, supportant des types de données complexes et la configuration via fichier. Passage à Java 17 pour les modes remote/standalone.
BigQuery Data Transfer Service: Pour Google Ad Manager, on peut maintenant sauter le chargement des match tables (GA) et configurer la fréquence de répétition (GA, min 4h). Pour Search Ads, support des données de campagnes Performance Max (PMax) dans certaines tables (GA).
BigQuery Migration Assessment: L'évaluation de migration BigQuery supporte maintenant Amazon Redshift Serverless (Preview).
Google Cloud Managed Service for Apache Kafka: Support de Kafka Connect en Public preview pour streamer des données entre clusters Kafka managés et d'autres systèmes (BigQuery, GCS, Pub/Sub...).

Autres produits ☁️

Cloud Run: Le déploiement de conteneurs multiples (sidecars) pour un job Cloud Run est en GA.
Cloud Composer: La pause de l'unification de la facturation Composer 3 avec BigQuery est prolongée.
Virtual Private Cloud: Accès aux API Google globales via des backends Private Service Connect basés sur des Load Balancers applicatifs internes cross-région (GA).
VPC Service Controls: Support GA pour l'intégration de Google Agentspace Enterprise.
Navigation SDK for Android: Ajout de fonctionnalités configurables pour les perturbations en temps réel. Mise à jour du design par défaut des cartes de direction. Ajout de l'API Prompt Visibility (Expérimental).
Migrate to Virtual Machines: Support de l'import d'images disque Arm vers Google Cloud. Voir les OS supportés.
Google SecOps SOAR: Release 6.3.40 disponible partout. Déploiement de la version 6.3.41 en cours (détails ici). Les préférences utilisateur (fuseau horaire, notifications, accessibilité) sont regroupées dans une nouvelle boîte de dialogue.
Google SecOps SIEM / Google SecOps: Nouveau ruleset "Medium Priority" dans Applied Threat Intelligence (ATI) pour étendre la priorisation aux malwares courants.
Google Kubernetes Engine: Le monitoring applicatif automatique est en GA (versions 1.28+), collectant des métriques via Managed Service for Prometheus et fournissant des dashboards. Support de 6 nouveaux serveurs de modèles IA (NVIDIA Triton, vLLM, TGI, JetStream, TorchServe, TensorFlow Serving).
Google Cloud Contact Center as a Service: Annonce de la pré-release version 3.33 avec de nombreuses features : nouveaux événements pour assistants virtuels, options pour attacher sessions CCaaS aux enregistrements CRM Salesforce, visualisation des transcriptions de chat, améliorations import de statuts agents, configuration destination liste de contacts pour passer paramètres SIP, options pour commentaires CRM lors sauvegarde enregistrements/transcriptions, déviations conditionnelles pour surcapacité, nouveau type d'appel dans les rapports.
Confidential Space: Possibilité d'ajouter des capacités Linux spécifiques (dont CAP_SYS_ADMIN) et fournit un cgroup namespacé en lecture/écriture. Le support sur CPU Intel (C3) avec Intel TDX est en GA.
Compute Engine: L'orchestrateur de politiques OS pour gérer les assignations de politiques OS à grande échelle (cross-projets/zones) est en GA via VM Manager.
Cloud-based maps styling: Ajout de la possibilité de prévisualiser les styles light et dark mode pour un map ID. Possibilité de créer et personnaliser des styles en dark mode et de les associer à un map ID.
Cloud Service Mesh: Version 1.25.0-asm.8 disponible pour Cloud Service Mesh in-cluster, basée sur Istio 1.25.0.
Cloud Monitoring: Si le logging des échecs d'uptime check est activé, les logs sont visibles depuis la page "Uptime details".
Cloud Deploy: Le support pour timed promote, les deploy policies, et l'automatisation repair rollout est en GA.
Application Integration: Intégration directe avec Dialogflow CX (Preview) pour construire des agents conversationnels via des triggers API.
Apigee X: Mise à jour de version (1-15-0-apigee-2).
Apigee API hub: Conformité Data Residency Zone (DRZ) C3. Introduction d'un processus de curation des métadonnées API. Intégration avec VPC Service Controls (Preview). Améliorations API pour gérer les opérations même sans spec. Possibilité de supprimer une instance API hub via l'API. Nouvelle vue graphe "API Supply chain". Support Terraform pour le provisioning. Nouveau Plugin Framework pour ingérer les métadonnées API.
Access Approval: Support de Document AI en GA.
API Gateway: Conforme aux exigences de résidence des données au repos. Mise à jour de version.

A savoir... 🧐

Quelques ajustements et infos utiles cette semaine : Vertex AI Agent Builder a été renommé en AI Applications (juste le nom change !).

Des mises à jour de librairies clientes ont été publiées pour Spanner (Go, Java, Node.js, Python), Pub/Sub (Node.js), et Bigtable (Java).

Plusieurs correctifs (FIX) ont été appliqués sur Navigation SDK for Android, Mainframe Connector, Google Cloud CCaaS, Dataproc, et Apigee X.

Une avalanche de bulletins de sécurité (SECURITY_BULLETIN) concerne Container Optimized OS, principalement des patchs pour le noyau Linux et quelques composants (expat, net).

Côté changements non-bloquants (NON_BREAKING_CHANGE), on note des évolutions pour Navigation SDK for Android (version Kotlin min, barre de progression), Manufacturing Data Engine (versioning métadonnées), Looker Studio (calcul vues YouTube), GKE (nouvelles versions dans les canaux), Dataproc (libs NVIDIA, disque par défaut), Confidential Space (nouvelles images), Cloud-based maps styling (association map IDs), Cloud Storage (filtrage IP), BigQuery (génération code Python par Gemini), Application Integration (replay amélioré), Apigee API hub (attachement de documents), et AlloyDB (CMEK pour backups).

Enfin, attention à des problèmes connus (ISSUE)⚠️ sur Cloud Service Mesh (upgrade 1.25.x), Cloud Composer 3 (CPU web server), et AlloyDB Omni / AlloyDB (perf après création index ScaNN), ainsi qu'une dépréciation (DEPRECATION) de l'endpoint de clé SSH pour la console sur Compute Engine.

Voilà pour cette semaine ! Pas mal de nouveautés pour jouer avec la data et l'IA. À la semaine prochaine pour d'autres news GCP ! 👋

AI values Data. Data values Business.

Semaine du 29 mars 2025 au 4 avril 2025

Bref résumé des news 📰 de la semaine

Data et IA 🧠

BigQuery

Spanner

Text-to-Speech

Looker / Looker Studio

Gemini / Gemini Code Assist

Google Agentspace (Enterprise / NotebookLM)

Produits Data en vrac... 📦

Autres produits ☁️

A savoir... 🧐

AI values Data. Data values Business.

Read more from Vincent Levorato

GCP Architect's Corner ☁️ : Les dernières nouveautés Data - IA (et plus encore) sur Google Cloud Platform

GCP Architect's Corner ☁️ : Les dernières nouveautés Data - IA (et plus encore) sur Google Cloud Platform

GCP Architect's Corner ☁️ : Les dernières nouveautés Data - IA (et plus encore) sur Google Cloud Platform

Read more from AI values Data. Data values Business.

GCP Architect's Corner ☁️ : Les dernières nouveautés Data - IA (et plus encore) sur Google Cloud Platform