Le Cloud Data & AI Summit de Google Cloud s'est tenu en ligne les 29 et 30 mars dernier. Cet événement était particulièrement attendu cette année du fait des derniers progrès fulgurants de l'iA générative et de l'entrée fracassante de ChatGPT dans notre quotidien fin 2022.
Au-delà des annonces, le message reste inchangé pour Google depuis plusieurs années maintenant : proposer des innovations dans un environnement unifié et sécurisé et où le partage et l'accès aux données est facilité.
Voici donc un tour d'horizon des principales annonces autour de l'IA Générative, de BigQuery et Looker.
Intégration de l'iA générative dans Vertex AI
On commence avec l'iA Générative et son intégration naturelle à l'écosystème Google Cloud. La firme de Mountain View présente en effet 2 offres orientées entreprises et développeurs, et qui combinent IA conversationnelle, modèles de fondation (Google & Open Source) et recherche. Il s'agit notamment de :
- l'intégration de l'IA Générative dans Vertex AI avec de nouvelles fonctionnalités à venir, en l'occurence Generative AI Studio et Model Garden.
- le lancement de Gen App Builder qui permet de rapidement développer des applications multimodales (texte, images, vidéo...) grâce à une couche d'orchestration qui fluidifie l'expérience utilisateur.
Pour le moment, l'accès à ces nouveautés est ouvert aux Trusted Testers, qui sont, comme le nom l"indique, des partenaires de confiance de Google Cloud.
BigQuery Editions
Il s'agit de 3 niveaux de facturation : Standard, Enterprise et Enterprise Plus. Il sera possible de les combiner afin de d'optimiser au mieux les coûts. Ces 3 éditions présentent des caractéristiques différentes et sont fonctions des charges de travail envisagées. Elle s'accompagnent de 2 grandes nouveautés :
- l'autoscaling et le pay-per-use : les coûts s'adapteront aux charges de travail et vous ne paierez que ce que vous aurez consommé. Jusqu'à présent, BigQuery fonctionnait sur un système de réservation de slots.
- le compressed storage (stockage compressé) : les coûts de stockage seront à hauteur du volume des données stockées dans BigQuery une fois compressées.
A noter tout de même une augmentation de 25% des coûts de réservation des modèles de facturation actuels dès le 5 juillet prochain, date à partir de laquelle ces anciens modèles ne seront plus disponibles. Il faudra donc migrer vers les nouvelles éditions.
Looker Modeler
Grâce à la modélisation sémantique de Looker, il sera possible de créer des métriques une seule et unique fois et de les rendre accessibles dans les outils BI compatibles dont la liste viendra s'allonger progressivement. L'objectif est de disposer d'une source unique de vérité pour les métriques BI offrant ainsi une meilleure gouvernance des données.
La disponibilité générale de Looker Modeler est prévue pour fin 2023.
BigQuery ML Inference Engine
Plutôt que de déplacer les données jusqu'aux modèles, de nouveaux modèles seront accessibles depuis BigQuery, en SQL. Ce sera notamment le cas de Tensorflow Lite, ONNX, XGBOOST, mais également de modèles disponibles depuis Vertex AI Prediction ainsi que les modèles pré-entraînés de Google (Vision, NLP, Translate).
BigQuery Clean Rooms
Il s'agit d'environnements fermés et sécurisés dans lesquels des données soumises à des exigences réglementaires et de confidentialité strictes sont partagées entre entreprises contributrices. Les Clean Rooms seront disponibles via Analytics Hubs. Seules les entreprises contributrices, c'est à dire celles ayant conclu un accord de partage, pourront accéder aux données partagées.
Retrouvez toutes les annonces sur le blog de Google Cloud ici.
NB: toutes les images présentes dans cet articles sont issues du blog officiel de Google Cloud.