ABOUT 1 MONTH AGO ‱ 10 MIN READ

GCP Architect's Corner ☁ : Les derniĂšres nouveautĂ©s Data - IA (et plus encore) sur Google Cloud Platform

profile

AI values Data. Data values Business.

👋 Hello ! Je suis Vincent, Architecte IA et Lead Data Scientist. J’aide les entreprises Ă  exploiter leurs donnĂ©es et Ă  intĂ©grer des solutions d’intelligence artificielle pour gĂ©nĂ©rer de la valeur. Je me suis spĂ©cialisĂ© dans la conception de solutions IA, et je conçois des architectures data performantes et Ă©volutives. Besoin de conseils pour vos projets data ou IA ? 🚀 Je suis lĂ  pour vous aider Ă  transformer vos idĂ©es en solutions concrĂštes ! Restez au courant de mes derniĂšres actualitĂ©s via mes newsletters.

Semaine du 24 mai 2025 au 30 mai 2025

Cette semaine, BigQuery continue son marathon d'innovations avec les transferts Ă©vĂ©nementiels depuis Cloud Storage et l'arrivĂ©e en GA de Spark dans ses notebooks. Gemini Code Assist devient encore plus malin pour gĂ©rer le contexte de vos prompts. Dataproc Serverless pour Spark runtime 2.3 est officiellement en disponibilitĂ© gĂ©nĂ©rale, et le nouveau moteur Lightning Engine sort en preview. Pour finir, Apigee X s'offre les services de Gemini pour pimenter le dĂ©veloppement d'API. C'est parti pour le dĂ©tail ! 🚀

Data et IA 🧠

Avant d'entrer dans le vif du sujet, je voulais vous partager un article récent qui expose la maniÚre dont Google présente ce qu'ils appellent leur open lakehouse. En bref : Google unifie la gestion des données au format ouvert (Iceberg notamment) et y intÚgre fortement l'IA pour améliorer performance et facilité d'usage.

Les points clés sont :

  • BigLake gĂšre nativement les donnĂ©es au format ouvert comme Apache Iceberg.
  • BigQuery (analytique) et AlloyDB (opĂ©rationnel) fonctionnent ensemble sur ces donnĂ©es.
  • Performances accrues pour BigQuery SQL et Apache Spark.
  • Dataplex Universal Catalog offre une gouvernance unifiĂ©e et une dĂ©couverte des donnĂ©es enrichies par l'IA.
  • Nouveaux outils et notebooks dopĂ©s Ă  l'IA (Gemini) pour les dĂ©veloppeurs.

BigQuery

Encore une semaine chargée pour notre data warehouse préféré :

  • Les transferts de donnĂ©es Ă©vĂ©nementiels depuis Cloud Storage vers BigQuery sont maintenant en disponibilitĂ© gĂ©nĂ©rale (GA). Plus besoin d'attendre, vos donnĂ©es arrivent dĂšs qu'elles sont prĂȘtes ! 💹
  • Bonne nouvelle pour les utilisateurs de dbt et Python 🐍 : vous pouvez maintenant utiliser l'adaptateur dbt-bigquery pour exĂ©cuter du code Python dĂ©fini dans les DataFrames BigQuery. Cette fonctionnalitĂ© est en Preview.
  • La gestion des autorisations se simplifie : utilisez vos identifiants utilisateur Google Account pour autoriser la crĂ©ation, la planification et l'exĂ©cution de pipelines, ainsi que la planification de notebooks et de prĂ©parations de donnĂ©es. C'est en Preview, plus d'infos ici.
  • L'indexation des mĂ©tadonnĂ©es de colonnes est dĂ©sormais en GA pour les tables BigQuery natives et les tables externes. De quoi accĂ©lĂ©rer vos requĂȘtes sur les mĂ©tadonnĂ©es. ⚡
  • C'est officiel : la crĂ©ation d'une session Spark serverless et l'exĂ©cution de code PySpark dans un notebook BigQuery sont en disponibilitĂ© gĂ©nĂ©rale (GA). ✹
  • Le partage de donnĂ©es en streaming Pub/Sub via BigQuery sharing (Analytics Hub) est maintenant en GA, avec un support Ă©tendu des bibliothĂšques clientes et des mĂ©triques d'usage pour les fournisseurs.
  • Pour les petites requĂȘtes rapides (tableaux de bord, exploration), BigQuery propose un mode optionnel de crĂ©ation de jobs en GA. Il optimise automatiquement les requĂȘtes Ă©ligibles et utilise un cache pour amĂ©liorer la latence.

Gemini & Gemini Code Assist

L'IA sauce Google continue de s'améliorer pour nous faciliter la vie de développeur : pour Gemini Code Assist Standard and Enterprise (et donc Gemini), vous pouvez maintenant gérer les fichiers et dossiers inclus dans le contexte via le "Context Drawer". Plus de contrÎle sur ce que Gemini "voit" pour répondre à vos prompts, c'est toujours bon à prendre. On peut visualiser et retirer des éléments du contexte, comme dans l'image d'exemple ci-dessous :

Dataproc

Du nouveau pour le traitement de données distribué :

  • ​Spark sur BigQuery est en disponibilitĂ© gĂ©nĂ©rale. Cela vous permet de crĂ©er une session Spark serverless directement dans un notebook BigQuery Studio. Simplissime pour crĂ©er, exĂ©cuter et tester des jobs Spark.
  • Dataproc Serverless pour Spark, versions de runtime 2.3, est en disponibilitĂ© gĂ©nĂ©rale (GA). Au menu : Spark 3.5.1, BigQuery Spark Connector 0.42.3, Cloud Storage Connector 3.1.2, Java 17, Python 3.11, R 4.3, et Scala 2.13.
  • De nouvelles versions de runtime Dataproc Serverless pour Spark sont disponibles : 1.1.105, 1.2.49, 2.2.49, et 2.3.0.

Autre grosse nouveautĂ©, le lancement de Lightning Engine pour Apache Spark (private preview), promettant des performances et une efficacitĂ© accrues. Google Cloud a annoncĂ© le 31 mai dernier son lancement en avant-premiĂšre : conçu pour surmonter les dĂ©fis de performance et de coĂ»ts souvent rencontrĂ©s avec Spark Ă  grande Ă©chelle, Lightning Engine vise Ă  amĂ©liorer significativement la vitesse d'exĂ©cution des requĂȘtes, les entrĂ©es/sorties de donnĂ©es (I/O) et l'utilisation des ressources.

En bref, ce nouveau moteur :

  • Optimise intelligemment les requĂȘtes Spark avec un planificateur avancĂ©.
  • ExĂ©cute les tĂąches plus rapidement grĂące Ă  un moteur natif (basĂ© sur Apache Gluten et Velox) optimisĂ© pour le matĂ©riel Google.
  • RĂ©duit les donnĂ©es Ă©changĂ©es (shuffle) entre les Ă©tapes de calcul.
  • AccĂ©lĂšre la lecture des fichiers (ex: Parquet) avec des techniques de prĂ©chargement et de cache.
  • AmĂ©liore l'accĂšs aux donnĂ©es via des connecteurs optimisĂ©s pour Google Cloud Storage et BigQuery (ex: transfert direct au format Apache Arrow).

A suivre !

Apigee X

Quand la gestion d'API rencontre l'IA générative :

  • ​Gemini Code Assist dĂ©barque en GA dans Apigee pour le dĂ©veloppement d'API ! Directement depuis VS Code, vous pouvez utiliser des prompts en langage naturel pour designer, crĂ©er, itĂ©rer et gĂ©rer vos spĂ©cifications OpenAPI. Cela inclut la gĂ©nĂ©ration de specs OpenAPI, l'itĂ©ration via chat, le test avec des mock servers, la publication sur API Hub et mĂȘme la dĂ©tection de duplicatas d'endpoints. Un vrai coup de boost pour le cycle de vie de vos APIs ! Pour en savoir plus, consultez le tutoriel et la doc de configuration.

Colab Enterprise Notebooks

Des nouveautés pour les data scientists utilisant Colab Enterprise :

  • Python 3.11 est maintenant disponible dans Colab Enterprise ! Les runtimes et templates existants resteront sur Python 3.10.
  • Lors de la crĂ©ation d'un template de runtime, vous pouvez maintenant le configurer pour utiliser la derniĂšre version de Python disponible ou spĂ©cifier une version. L'option "Latest" signifie que vos runtimes utiliseront automatiquement les nouvelles versions de Python dĂšs leur introduction. Pour les templates par dĂ©faut existants, il faudra soit les supprimer pour qu'ils se recrĂ©ent avec "Latest", soit modifier la version via l'API REST (un peu bof ça quand mĂȘme 😒).

Cloud Trace pour l'IA Générative

Tracez vos applications d'IA gĂ©nĂ©rative comme un pro đŸ•”ïžâ€â™‚ïž : dĂ©couvrez comment instrumenter vos applications d'IA gĂ©nĂ©rative en utilisant OpenTelemetry et le framework LangGraph. Cela permet de collecter des informations sur les actions de votre agent IA. Vous pouvez visualiser ces Ă©vĂ©nements dans le Trace Explorer. Un guide pratique pour instrumenter un agent LangGraph ReAct avec OpenTelemetry est Ă©galement disponible.

Contact Center AI Insights

Des analyses plus intelligentes pour vos centres de contact : Contact Center AI Insights propose dĂ©sormais une "analyse fusionnĂ©e" (merged analysis), qui affiche les rĂ©sultats prĂ©cĂ©dents de chaque type d'analyse Ă  cĂŽtĂ© de votre rĂ©sultat d'analyse le plus rĂ©cent. Pratique pour Ă©viter de relancer plusieurs fois les mĂȘmes analyses.

Google Agentspace đŸ€–

L'assistant intelligent pour l'entreprise s'améliore : pour Google Agentspace Enterprise, lors de la création d'un événement Outlook Calendar, l'assistant peut désormais suggérer des horaires de réunion en fonction de la disponibilité des participants. Demandez simplement à l'assistant de planifier une réunion et les créneaux appropriés apparaßtront.

Produits Data en vrac... 📩

Autres produits ☁

  • Virtual Private Cloud: Vous pouvez assigner des adresses IPv6 BYOIP (Bring Your Own IP) Ă  la plage d'adresses externes d'un sous-rĂ©seau. Ces plages peuvent ĂȘtre utilisĂ©es par les instances VM. Cette fonctionnalitĂ© est en disponibilitĂ© gĂ©nĂ©rale.
  • Places Swift SDK for iOS: La version 10.0.0 du Google Places Swift SDK for iOS est disponible, passant de la v5.x Ă  la v10 pour s'aligner avec Places SDKs for iOS. Le Places Swift SDK for iOS est passĂ© de Preview Ă  GA. Le Place Details UI Kit est maintenant en GA.
  • Places SDK for iOS: La version 10.0.0 du Places SDK for iOS est disponible. Le Places Swift SDK for iOS (mentionnĂ© ici aussi, probablement pour la compatibilitĂ©/Ă©cosystĂšme) est passĂ© de Preview Ă  GA.
  • Places SDK for Android :Le Place Details UI Kit est maintenant en GA. Le widget Place Autocomplete est maintenant disponible pour Autocomplete (New). La version 4.3.1 du Places SDK for Android est disponible.
  • NetApp Volumes: Le niveau de service Flex supporte maintenant la fonctionnalitĂ© d'auto-tiering en Preview (uniquement pour les pools zonaux Flex Ă  performance personnalisĂ©e). Plus d'infos sur la gestion de l'auto-tiering. La fonctionnalitĂ© de coffres-forts de sauvegarde inter-rĂ©gions est en GA.
  • Identity and Access Management (IAM): Workforce Identity Federation supporte la journalisation d'audit dĂ©taillĂ©e (GA), utile pour le dĂ©pannage des problĂšmes de mappage d'attributs.
  • Google SecOps SOAR: La Release 6.3.46 est disponible pour toutes les rĂ©gions. La fonctionnalitĂ© d'Ă©quilibrage de charge d'environnement est disponible, offrant une meilleure stabilitĂ© et un partage Ă©quitable des ressources dans les environnements multi-tenants. Plus d'infos sur la gestion de l'Ă©quilibrage de charge d'environnement. La Release 6.3.47 est en cours de dĂ©ploiement progressif. DĂ©tails ici.
  • Google SecOps SIEM & Google SecOps: Nouveaux flux basĂ©s sur le Storage Transfer Service (STS) sont en Preview. Cela concerne GOOGLE_CLOUD_STORAGE_V2, GOOGLE_CLOUD_STORAGE_EVENT_DRIVEN, AMAZON_S3_V2, AMAZON_SQS_V2, AZURE_BLOBSTORE_V2. Voir la configuration par type de source.
  • Google Kubernetes Engine (GKE): En version 1.32.2-gke.1297000 et ultĂ©rieures, vous pouvez exĂ©cuter des charges de travail GPU sur des nƓuds GKE confidentiels avec le type de machine A3 High et des GPU NVIDIA H100 (Preview). Plus d'infos sur le chiffrement des donnĂ©es GPU en cours d'utilisation. En version 1.32.2-gke.1297000 et ultĂ©rieures, vous pouvez utiliser les technologies Confidential Computing Intel TDX et AMD SEV-SNP avec les nƓuds GKE confidentiels (GA). Plus d'infos sur le chiffrement des donnĂ©es des charges de travail en cours d'utilisation.
  • Google Cloud Contact Center as a Service (CCaaS):
  • Filestore: Vous pouvez maintenant utiliser le driver CSI Filestore pour crĂ©er des instances Filestore avec le protocole NFSv4.1 depuis GKE, pour les niveaux de service zonaux, rĂ©gionaux et entreprise.
  • Container Optimized OS:Support des outils NVIDIA MFT Tools sur COS. Injection du pĂ©riphĂ©rique de caractĂšres du canal IMEX pour les GPU GB200.
  • Compute Engine: Les types de machines A3 Ultra optimisĂ©es pour les accĂ©lĂ©rateurs sont disponibles dans de nouvelles rĂ©gions et zones (Mumbai, Delhi, St. Ghislain, Eemshaven, Council Bluffs, Moncks Corner, Ashburn, The Dalles, Dallas). Liste complĂšte ici.
  • Cloud Run: Plusieurs rĂ©gions bĂ©nĂ©ficient d'une rĂ©activitĂ© amĂ©liorĂ©e pour les applications sensibles Ă  la latence pour les URL de service Cloud Run.
  • Cloud Logging commence Ă  appliquer les nouveaux quotas rĂ©gionaux basĂ©s sur le volume, remplaçant le quota global unique pour les appels d'Ă©criture d'entrĂ©es de journal. Plus d'infos sur les quotas et limites de l'API Logging.
  • Cloud Build: Vous pouvez maintenant crĂ©er des dĂ©clencheurs de build qui construisent Ă  partir de dĂ©pĂŽts connectĂ©s Ă  Developer Connect.
  • Apigee X (Autres fonctionnalitĂ©s): En preview publique : le processeur d'extension Apigee supporte le traitement du corps des requĂȘtes et des rĂ©ponses lors de la crĂ©ation d'une extension de service de load balancer. Voir DĂ©marrer avec le processeur d'extension Apigee.
  • Apigee UI: Le calendrier d'arrĂȘt de l'interface utilisateur classique d'Apigee a Ă©tĂ© annoncĂ© le 29 mai.
  • Apigee Integrated Portal: en GA, l'interface utilisateur d'administration du portail dĂ©veloppeur intĂ©grĂ© Apigee est dans la console Google Cloud. Vue d'ensemble de la publication.
  • Apigee Advanced API Security: Support Ă©tendu des rĂ©gions d'exĂ©cution pour inclure africa-south1 (Johannesburg). Liste des rĂ©gions supportĂ©es.

A savoir... 🧐

Quelques ajustements et informations importantes cette semaine :

​

Et voilà pour cette semaine bien remplie ! On se retrouve la semaine prochaine pour d'autres aventures dans l'univers GCP. D'ici là, à vos architectures ! 😉

AI values Data. Data values Business.

👋 Hello ! Je suis Vincent, Architecte IA et Lead Data Scientist. J’aide les entreprises Ă  exploiter leurs donnĂ©es et Ă  intĂ©grer des solutions d’intelligence artificielle pour gĂ©nĂ©rer de la valeur. Je me suis spĂ©cialisĂ© dans la conception de solutions IA, et je conçois des architectures data performantes et Ă©volutives. Besoin de conseils pour vos projets data ou IA ? 🚀 Je suis lĂ  pour vous aider Ă  transformer vos idĂ©es en solutions concrĂštes ! Restez au courant de mes derniĂšres actualitĂ©s via mes newsletters.