Vous souhaitez passer la certification Google Cloud Machine Learning Engineer et vous ne savez pas à quoi vous attendre? Je vous propose mon retour d’expérience après l’avoir obtenue il y a quelques semaines. Quelles sont les ressources que j’ai utilisées, comment je m’y suis prise pour la préparer et comment l’aborder.
La certification
C’est une certification de niveau Professional dont l’objectif est de vérifier que vous êtes en mesure de répondre à des problématiques liées à la mise en œuvre de modèles de Machine Learning (ML) dans un environnement Google Cloud.
L’examen est en anglais. Il dure 2 heures et comporte 60 questions. Chaque question correspond à une mise en situation où l’on expose une problématique métier en relation avec le ML. Il ne comporte pas de questions théoriques à proprement parler mais implique de maîtriser les concepts, ainsi que les produits, solutions et bonnes pratiques de Google.
Les prérequis
Avant de passer l’examen, Google recommande de disposer d’une expérience d’au moins 3 ans dans l’utilisation des produits Google Cloud. Pour être plus précis, voici ce qui me semble être indispensable pour aborder la formation et la certification sereinement :
être familier avec les concepts de ML : la terminologie, les modèles, les problématiques auxquelles il permet de répondre, mais aussi ses limites.
être familier avec l’écosystème Data Engineering de Google : BigQuery, Storage, Composer, Dataflow, Dataproc, Data Fusion, Cloud Functions, Pub/Sub… cela permet de gagner un temps considérable puisque vous n’aurez pas à vous documenter ou vous former spécifiquement à ces produits. L’idéal serait d’être déjà certifié Data Engineer, ou du moins d’avoir déjà utilisé ces produits.
Python et Tensorflow : sans surprise, il y a beaucoup de code. Personnellement, je ne suis pas développeuse. En revanche, il me paraît indispensable de savoir lire et comprendre le code nécessaire au développement d’un modèle de ML.
Les ressources
Concernant les ressources, voici celle que j’ai utilisées :
La préparation à la certification Coursera : La spécialisation est très dense car elle consacre une bonne partie de son contenu au Machine Learning en tant que discipline à part entière. Elle aborde en profondeur de très nombreux concepts, mais elle manque terriblement de structure, ce qui peut être décourageant. Si vous n’êtes pas du tout familier avec les concepts du ML ou avec les produits Google Cloud, il va falloir prendre le temps de raccrocher les wagons. Si au contraire vous n’êtes pas un néophyte, vous pourrez survoler, voire faire l’impasse sur certains modules. Notez également que la formation est payante. Elle est dispensée en anglais sans sous-titrage en français. Point positif tout de même, le parcours a été mis à jour cet été et intègre désormais Vertex AI.
Machine Learning Crash Course de Google sur les concepts du ML. Ce cours gratuit constitue une bonne entrée en la matière. Il existe d’autres cours proposés sur le site ainsi qu’un glossaire très utile.
Les bonnes pratiques de Google en termes de gestion de l’écosystème ML, d’optimisation des coûts et performances et du MLOps. Ces 3 références m’ont été d’une très grande aide lors de l’examen. A lire et relire sans modération. Par ailleurs, le site regorge de ressources, ne vous privez pas.
La documentation produit de Google. Sur ce point, je trouve qu’ils ont amélioré de manière vraiment significative la qualité de leur documentation déjà très riche : c’est clair, net et précis, et vient contrebalancer le manque de structure de la spécialisation. Même la traduction s’en trouve améliorée.
Le guide de préparation à l’examen qui sert de feuille de route.
L’examen blanc de Google qui a 2 objectifs : estimer votre niveau de compréhension d’une part, et vous familiariser avec les types de questions posées durant l’examen d’autre part. Même si ce n’est qu’un échantillon, il a le mérite de vous aider à vous positionner et dispose également de nombreuses ressources utiles.
Les labs : la pratique doit rester au cœur de l’apprentissage.
Plus tard dans la formation, recourir à d’autres examens blancs. Les seuls disponibles à ma connaissance sont ceux de Whizlabs. Les questions sont formulées de manière bien plus simple en comparaison avec celles de l’examen, mais elles présentent tout de même un intérêt : tester votre niveau de connaissance des concepts. Il y a 125 questions sur les définitions, les types de ML, les différents modèles, les différents produits Google… C’est un très bon complément à la spécialisation.
Pour les ressources externes, Google fournit pour chaque module une liste d’articles et de ressources complémentaires.
Pour finir, il y a ce très bon post qui détaille les sujets à maîtriser. Les recommandations sont vraiment pertinentes et restent d’actualité à l’exception d’AI Platform /Vertex AI. C’est un excellent complément au guide qui va également combler certaines lacunes de la formation.
Comment je m’y suis prise
J’ai commencé à me documenter sur le sujet de l’intelligence artificielle et du ML d’abord par curiosité, suite à ma certification Data Engineer. J’ai ensuite suivi une formation en gestion de projets ML avec Google Cloud. Cette dernière apporte un éclairage différent, orienté business et création de valeur. Vous pouvez retrouver ici mon retour sur cette formation.
Pour la certification, j’ai suivi une première fois le cursus en accéléré à l’automne 2021 à l’occasion d’une offre découverte sur Coursera. Le but était de prendre la mesure de l’effort à fournir et identifier les sujets sur lesquels je devais travailler en priorité avant de m’engager. Sans surprise pour moi : Python & Tensorflow. J’y ai consacré deux bons mois en début d’année. Il y avait d’autres points à travailler mais qui pouvaient être vus au fil de mon avancement.
Une fois suffisamment à l’aise avec le code, je repars sur la spécialisation avec un rythme plus ou moins soutenu. Il y a eu des périodes d’apprentissage plus poussives que d’autres, avec parfois l’impression de régresser, mais cela fait partie du processus. Dans ces cas, n’hésitez pas à faire des pauses franches pour prendre du recul, ou à diversifier les modes d’apprentissage (labs, quizz, articles…). Au terme du parcours, je me donne 2 à 3 semaines pour passer l’examen, le temps de m’entraîner, de revoir mes notes et de faire une dernière pause.
D’un point de vue organisation et méthodologie, je me suis beaucoup aidée du guide et du post cité dans les ressources. Une préparation comme celle proposée par ACloudGuru pour la certification Data Engineer ferait gagner un temps précieux et apporterait de la structure. Malheureusement, elle n’existe pas et celle proposée par Whizlabs ne m’a pas été utile. J’ai aussi commencé les tests assez tôt, sans avoir forcément abordé tous les concepts. Cela m’a permis de varier les modes d’apprentissage.
Dernier aspect de ma préparation : la prise de note manuscrite systématique. Cela peut ne pas convenir à tous. Personnellement, cela m’a permis de réorganiser les cours physiquement, de décrocher de l’écran et d’être plus active pendant l’apprentissage. Le fait de devoir reformuler m’a également permis de mieux m’approprier les concepts.
Comment savoir si vous pouvez enfin passer l’examen
Voici ce qui peut contribuer à vous sentir suffisamment en confiance pour passer l’examen.
Premier indicateur : votre taux de réussite aux tests et notamment à l’examen blanc de Google, est élevé et constant. Si vous avez une très bonne mémoire, cela peut toutefois ne pas être révélateur.
Deuxième indicateur : vous avez une bonne maîtrise de la terminologie, des produits et des recommandations. Vous vous posez moins de questions. Vous avez moins de doutes.
Troisième indicateur : vous avez vraiment envie de passer l’examen et n’avez pas peur d’échouer.
Vous vous sentez prêt(e)? Vous pouvez penser à programmer votre examen. Je vous conseille de le faire au moins une semaine à l’avance. Cela vous permettra de le décaler sans frais en cas de besoin. Préparez votre poste de travail et renseignez-vous sur les conditions de passage dans la foulée de votre inscription (voir ici et là). Cela vous fera gagner du temps et vous évitera les mauvaises surprises ou du stress supplémentaire.
Le jour de l’examen
Procédez aux dernières vérifications matérielles, notamment votre connexion. Activez le partage de connexion sur votre mobile afin de pouvoir l’utiliser en cas de problèmes. Prévoyez de le faire avant le début de l’examen car vous ne pourrez pas garder votre téléphone à proximité.
Pour ce qui est de l’endroit où vous passerez l’examen, les recommandations de Google sont très strictes. Choisissez une pièce calme et neutre au possible car tout est passé en revue, du sol au plafond.
Prévoyez également une webcam mobile avec une bonne résolution afin de ne pas avoir à déplacer votre écran. Même si vous utilisez un ordinateur portable, c’est bien plus pratique.
Le temps pris pour faire toutes les vérifications n’est pas décompté du temps de l’examen. Il faut finalement prévoir un créneau de 2h30 à 3h où vous serez totalement seul(e).
Lorsque les vérifications sont terminées, vous pourrez lancer l’examen. C’est parti pour 2 heures de grand 8 et de sueurs froides!
Mes conseils pour répondre aux questions
L’examen est ardu et dès les premières questions, le doute s’installe. Pour ne pas vous sentir dépassé, voici quelques conseils qui pourraient vous aider :
Prenez le temps de lire et relire la question et les réponses car les énoncés sont longs et la formulation est très souvent piégeuse.
Triez et analysez les informations fournies afin d’identifier le contexte général : repérez les mots-clés dans la question et dans les réponses, puis procédez par élimination.
Une fois vos choix restreints, déterminez la meilleure solution possible parmi celles restantes. Concernant ce point, il arrive parfois que la solution qui tombe sous le sens et qui est censée être la bonne pratique à appliquer ne fasse pas du tout partie des choix proposés. Cela peut être déroutant.
Si vraiment vous ne parvenez pas à départager les options qu’il vous reste, marquez la question pour y revenir plus tard.
Ne vous focalisez pas trop sur le minuteur. Regarder les secondes qui défilent aide rarement à rester concentré.
Gardez à l’esprit que le ML ne résout pas tout : attendez-vous à des questions pour lesquelles le ML n’est pas la solution.
En procédant ainsi, j’ai passé en revue les 60 questions en 1h30, et j’ai consacré les 30 dernières minutes à revoir la douzaine de questions sur lesquelles il me restait des doutes. Pour ces questions, j’avais déjà présélectionné la réponse qui me semblait être correcte et éliminé celles qui ne convenaient pas d’office. J’ai conservé mon premier choix pour certaines et j’ai modifié les autres.
Sur ce point concernant la gestion et le marquage des questions, il n’y a pas de bonne ou de mauvaise façon de faire. Vous pouvez choisir de ne pas vous attarder sur ces questions et les marquer pour y revenir plus tard, ou bien vous pouvez approfondir votre analyse pour n’en marquer qu’un nombre réduit. Tant que vous arrivez à gérer votre temps, adoptez la stratégie qui vous convient le mieux et gardez-la tout au long de l’examen. Aussi, profitez des examens blancs pour tester différentes approches.
Le résultat
Au terme de l’examen, vous verrez apparaître le résultat sur l’écran. Contrairement à AWS ou Azure qui fournissent un score, Google affiche “sobrement” Pass ou Fail.
Cela a ses avantages et inconvénients, notamment en cas d’échec : on ne sait pas ce qui nous a manqué pour réussir et sur quoi concentrer nos efforts pour repasser l’examen.
Vient ensuite le temps des réactions à chaud :
Ce n’est pas une partie de plaisir. Le doute ne vous quitte que rarement en raison de la formulation des questions.
Les questions sont variées et portent sur tout le workflow ML. On ne peut rien laisser au hasard lors de la préparation.
C’est bien plus difficile qu’on ne peut l’imaginer. Et même si j’ai l’expérience de la certification Data Engineer, je ne me sens pas loin du KO.
Il y a eu des questions auxquelles je ne m’attendais pas du tout car non abordées durant la formation. Il s’agit notamment de questions concernant le DLP et le transfer learning. Ces 2 sujets faisaient en revanche partie des tests Whizlabs.
Je m’attendais à des questions sur BigQuery ML, il n’y en a eu aucune. Mais cela ne signifie pas qu’il n’y en aura jamais.
Une seule question contenait du code à proprement parler et je pensais qu’il y aurait une plus forte proportion. Il y a tout de même eu plusieurs questions sur l’utilisation des APIs Keras et Tensorflow.
Il n’y a pas eu de questions théoriques mais les concepts ML étant en toile de fond de chaque question, il est indispensable de les maîtriser.
Il faut enfin patienter 7 à 10 jours pour obtenir la validation officielle de Google et récupérer votre certificat.
En cas d’échec, vous trouverez ici les modalités pour repasser l’examen.
En conclusion
C’est une certification extrêmement exigeante, tant dans la préparation que dans l’examen. Elle demande un niveau de motivation et de concentration très élevé car le doute que vous avez réussi à dompter pendant la préparation revient insidieusement le jour de l’examen.
Comme je l’ai indiqué, bien que complète, la spécialisation est mal pensée surtout pour un apprenant individuel. Mais si vous êtes organisé, si vous êtes déjà certifié Data Engineer ou que vous évoluez dans un environnement data sur GCP, et surtout si vous avez un réel attrait pour le ML et que vous souhaitez vous certifier, alors n’hésitez pas.
Si vous êtes freelance ou que votre entreprise ne prend pas en charge ce type de formation mais que vous souhaitez élargir vos compétences, sachez que Google et Coursera proposent régulièrement des promotions avec en prime un voucher de 20% sur le tarif des certifications si vous terminez la spécialisation dans le temps imparti. C’est d’ailleurs le cas actuellement.
Bon courage à celles et ceux qui veulent se lancer!