👋 Hello ! Je suis Vincent, Architecte IA et Lead Data Scientist. J’aide les entreprises à exploiter leurs données et à intégrer des solutions d’intelligence artificielle pour générer de la valeur. Je me suis spécialisé dans la conception de solutions IA, et je conçois des architectures data performantes et évolutives. Besoin de conseils pour vos projets data ou IA ? 🚀 Je suis là pour vous aider à transformer vos idées en solutions concrètes ! Restez au courant de mes dernières actualités via mes newsletters.
Semaine du 29 mars 2025 au 4 avril 2025Bref résumé des news 📰 de la semaineHello les data & AI geeks ! 👋 Cette semaine, Google Cloud a mis le paquet sur les services Data et IA, notamment BigQuery. Celui-ci continue son intégration poussée avec Gemini et lance les UDF Python en preview (et pleins d'autres features). Spanner n'est pas en reste avec la GA des index de recherche JSON et des améliorations sur les graphes. Text-to-Speech nous offre de nouvelles voix HD en GA avec Chirp 3. Côté autres services, GKE améliore le monitoring applicatif, Cloud Run passe les sidecars (multi-containers) en GA pour les jobs, et Cloud Storage rend les opérations batch et le FUSE monitoring disponibles pour tous. Pas mal de mouvement aussi du côté de la sécurité et des intégrations diverses. Sinon, petit rappel : Google Cloud Next'25, c'est du 9 au 11 avril (donc demain quand vous recevrez cette NL). Même si vous n'avez pas prévu d'aller à Las Vegas, vous pouvez toujours vous inscrire en ligne pour profiter du streaming et revoir les sessions que vous auriez manquées en live dans un deuxième temps. Data et IA 🧠BigQueryBigQuery ML s'enrichit de nouvelles fonctions d'IA générative ( Toujours en preview, la fonction Les User-Defined Functions (UDF) en Python débarquent en preview ! Elles supportent l'utilisation de bibliothèques additionnelles et d'APIs externes. De quoi étendre considérablement les capacités d'analyse directement dans BigQuery. 🐍 A surveiller tout de même en termes de coûts car il y aura des frais selon le compute et mémoire utilisés, pour la construction ou la reconstruction de l'image du conteneur UDF, ainsi que des frais réseau si trafic sortant externe. Gemini dans BigQuery Notebooks peut maintenant générer du code utilisant les bibliothèques BigFrames (en preview). Il suffit d'inclure l'intention dans votre prompt, comme par exemple "[...] using bigframes". Pour rappel, BigFrames permet d'utiliser une syntaxe pandas familière tout en exécutant les calculs directement dans BigQuery, évitant ainsi de charger les données en mémoire pour analyser des volumes importants. La syntaxe "Pipe", qui vise à rendre les requêtes plus lisibles et maintenables, est maintenant en disponibilité générale (GA). 🛠️ Je remets la vidéo d'intro à cette syntaxe maintenant qu'elle est GA : La création de modèles de contribution analysis via `CREATE MODEL` est maintenant en GA, avec de nouvelles options comme `top_k_insights_by_apriori_support` et `pruning_method`. Utilisez la fonction `ML.GET_INSIGHTS` pour générer des insights sur les métriques clés. Plusieurs types de métriques sont supportés. Le Change Data Capture (CDC) supporte maintenant la définition d'un `_CHANGE_SEQUENCE_NUMBER` pour gérer l'ordre des `UPSERT` en streaming (GA). Les politiques d'accès au niveau ligne (row level access policies) supportent maintenant les sous-requêtes, y compris pour les tables managées BigLake et via la BigQuery Storage Read API. C'est maintenant en GA. Sécurité affinée ! 🔒 Les tables externes Iceberg supportent maintenant le merge-on-read (GA), permettant d'interroger des tables Iceberg avec des position deletes et equality deletes. 🧊 Pour finir, côté BigQuery Studio, les pipelines BigQuery (ex-workflows) pour orchestrer SQL/notebooks sont en GA, tout comme la page de planification associée. On peut aussi inclure des tâches de préparation de données dans ces pipelines (Preview). SpannerLes index de recherche pour les colonnes JSON (GoogleSQL) et JSONB (PostgreSQL) sont maintenant en disponibilité générale (GA). Cela accélère de nombreuses requêtes sur les documents JSON, même sans connaissance préalable de leur structure. Les fonctions `JSON_CONTAINS` (SQL) et les opérateurs `@>` / `<@` (PG) peuvent utiliser ces index. 🚀 Spanner Graph permet maintenant de visualiser les éléments retournés par une requête Spanner Graph, ainsi que le schéma du graphe. Très utile pour comprendre les résultats et les relations entre nœuds/arêtes. 🕸️
De nouvelles fonctions de mutation JSON sont supportées en GoogleSQL (`JSON_ARRAY_APPEND`, `JSON_ARRAY_INSERT`, `JSON_REMOVE`, `JSON_SET`, `JSON_STRIP_NULLS`) et en PostgreSQL (`jsonb_insert`, `jsonb_set`, `jsonb_set_lax`, `jsonb_strip_nulls`, et les opérateurs `||` et `-`). Les fonctions `JSON_KEYS` (GoogleSQL) et `json_object_keys` (PostgreSQL) pour extraire les clés JSON uniques sont en GA. Text-to-SpeechBonne nouvelle pour les amateurs de génération de voix : les voix HD Chirp 3 (8 speakers, 31 locales) sont maintenant en disponibilité générale (GA). Elles offrent du streaming temps réel et du traitement par lot, accessibles dans plusieurs régions. N'hésitez pas à consulter la section sur les contrôles vocaux. 🗣️ Looker / Looker StudioDans Looker Studio, vous pouvez maintenant insérer des données directement dans des éléments texte grâce aux variables de résultats de requête. Choisissez une cellule d'un tableau et Looker Studio la maintiendra à jour. Malin ! Les graphiques modernes (Modern charts) sont maintenant en GA et activés par défaut pour les nouveaux rapports Looker Studio. Ils offrent plus d'options de style et de configuration. Les anciens rapports peuvent être mis à niveau. Pour avoir une idée rapide de ces features graphique, j'ai pu trouvé une petite démo qui résume tout en environ 8 mins, en faisant la comparaison entre les features annoncées et comment cela se passe dans l'interface (pas toujours avec succès 😅). Le connecteur Looker s'améliore : il peut maintenant se connecter à une instance Looker (Google Cloud core) en IP privée uniquement ou via Private Service Connect en utilisant l'ID d'instance Looker (GA). Dans Looker (en preview pour Studio), vous pouvez maintenant vous connecter à Google BigQuery et Google Sheets en utilisant les identifiants du propriétaire. Le formatage localisé des nombres est également supporté. Gemini / Gemini Code AssistLa personnalisation du code pour le chat est maintenant en GA pour Gemini Code Assist dans VS Code et IntelliJ. Cela fournit des suggestions de code et des insights contextuellement pertinents directement dans l'interface de chat de votre IDE, sans configuration supplémentaire. 🤖💻 Google Agentspace (Enterprise / NotebookLM)Le support des VPC Service Controls pour Google Agentspace Enterprise est en GA. Pour Google NotebookLM Enterprise, les clés de chiffrement gérées par le client (CMEK) sont en GA pour les régions US et EU. L'utilisation d'EKM ou HSM avec CMEK est en GA mais nécessite une inscription sur liste d'attente. Access Transparency supporte maintenant Google NotebookLM Enterprise en GA. Voir comment l'activer. Google Agentspace Enterprise supporte maintenant les CMEK pour les connecteurs de données tiers (GA) et Google NotebookLM Enterprise est maintenant certifié pour la conformité HIPAA. 🩺 Produits Data en vrac... 📦
Autres produits ☁️
A savoir... 🧐Quelques ajustements et infos utiles cette semaine : Vertex AI Agent Builder a été renommé en AI Applications (juste le nom change !). Des mises à jour de librairies clientes ont été publiées pour Spanner (Go, Java, Node.js, Python), Pub/Sub (Node.js), et Bigtable (Java). Plusieurs correctifs (FIX) ont été appliqués sur Navigation SDK for Android, Mainframe Connector, Google Cloud CCaaS, Dataproc, et Apigee X. Une avalanche de bulletins de sécurité (SECURITY_BULLETIN) concerne Container Optimized OS, principalement des patchs pour le noyau Linux et quelques composants (expat, net). Côté changements non-bloquants (NON_BREAKING_CHANGE), on note des évolutions pour Navigation SDK for Android (version Kotlin min, barre de progression), Manufacturing Data Engine (versioning métadonnées), Looker Studio (calcul vues YouTube), GKE (nouvelles versions dans les canaux), Dataproc (libs NVIDIA, disque par défaut), Confidential Space (nouvelles images), Cloud-based maps styling (association map IDs), Cloud Storage (filtrage IP), BigQuery (génération code Python par Gemini), Application Integration (replay amélioré), Apigee API hub (attachement de documents), et AlloyDB (CMEK pour backups). Enfin, attention à des problèmes connus (ISSUE)⚠️ sur Cloud Service Mesh (upgrade 1.25.x), Cloud Composer 3 (CPU web server), et AlloyDB Omni / AlloyDB (perf après création index ScaNN), ainsi qu'une dépréciation (DEPRECATION) de l'endpoint de clé SSH pour la console sur Compute Engine. Voilà pour cette semaine ! Pas mal de nouveautés pour jouer avec la data et l'IA. À la semaine prochaine pour d'autres news GCP ! 👋 |
👋 Hello ! Je suis Vincent, Architecte IA et Lead Data Scientist. J’aide les entreprises à exploiter leurs données et à intégrer des solutions d’intelligence artificielle pour générer de la valeur. Je me suis spécialisé dans la conception de solutions IA, et je conçois des architectures data performantes et évolutives. Besoin de conseils pour vos projets data ou IA ? 🚀 Je suis là pour vous aider à transformer vos idées en solutions concrètes ! Restez au courant de mes dernières actualités via mes newsletters.