Comment devenir data scientist sans diplôme d’ingénieur…

eFC logo
Comment devenir data scientist sans diplôme d’ingénieur…

Avoir un portfolio de projet montre que vous avez de l’expérience. Imaginez que deux data scientists juniors arrivent devant un recruteur, le premier dit : « Je connais Python, le Machine Learning, la gestion de base de données », le second dit « Je connais Python, le Machine Learning et la gestion de base de données et d’ailleurs j’ai appliqué ces connaissances dans ce projet où j’ai pu appliquer un réseau de neurones sur des données collectées en Open Data sur ce site ». A votre avis, sur quel candidat le recruteur va-t-il s’attarder le plus ?

Certes, pendant un entretien les profils ne sont pas à des extrêmes aussi flagrants. Mais, dans tous les cas, vous pouvez mettre en valeur des expériences beaucoup plus facilement via votre portfolio et peser dans la balance, même face à des personnes qui ont plus d’expérience en entreprise.

Ceci est d’autant plus vrai si les projets menés sont en lien avec l’industrie dans laquelle l’entreprise se trouve. Par exemple, si vous postulez pour une banque et que vous avez travaillé sur un projet de fraude bancaire en Machine Learning, cela va surement plus intéresser le recruteur. Cela prouve que vous vous intéressez aux problématiques auxquelles l’entreprise peut faire face mais aussi que vous avez une certaine connaissance métier.

Les projets assoient aussi votre légitimité en tant que Data Scientist car, plus vous avez un portfolio varié, plus vous avez fait face à des problématiques différentes et que, par conséquent, vous êtes capable de vous adapter. Ce qui est une capacité recherchée, pas seulement en Data Science.

Comment se créer un portfolio ?

Se créer un portfolio n’est pas chose facile mais ce n’est pas insurmontable non plus. Le meilleur moyen de commencer est de trouver quelque chose qui vous intéresse. Nous avons par exemple des élèves qui aiment beaucoup la crypto-monnaie et qui ont décidé de travailler sur le sujet. Les sujets sont vastes, le tout est d’en trouver un qui vous intéressera assez pour que vous l’acheviez malgré les difficultés potentielles.

Une question que l’on pose souvent est : « Où est ce qu’on peut trouver des données pertinentes pour mon projet ? ». Il existe à cette fin des ressources plus ou moins fiables sur lesquelles se reposer. Beaucoup d’entreprises mettent leurs données à disposition pour les personnes curieuses de les analyser. Les gouvernements et les universités sont d’ailleurs souvent les premiers à le faire.

Kaggle est une plateforme de Machine Learning où les Data Scientists du monde entier viennent analyser les données qui sont mises à disposition. De fait, il y a beaucoup de bases de données accessibles pour ceux qui souhaitent mettre en place leurs algorithmes. L’avantage de cette plateforme, c’est que les données sont relativement bien structurées et nettoyées. C’est donc un très bon endroit pour commencer lorsque l’on débute.

Les erreurs à ne pas commettre

Même si avoir des projets va vous servir, il faut savoir cibler. Certains projets sont en effet tellement vus et revus qu’il est préférable de ne pas les mettre dans votre portfolio. Parmi eux : le titanic et la base de données Iris.

Ces deux bases de données sont très bien pour commencer à faire vos armes, mais rien ne sert de les ajouter dans votre portfolio comme un projet personnel. Les personnes qui vont regarder votre portfolio vont, au mieux, penser que votre profil est très junior.

Une autre erreur est de penser que vous ne pouvez pas améliorer vos projets une fois que vous les avez terminés. L’élaboration d’un projet est un processus itératif, il est très bien de revenir dessus et de les améliorer en permanence. Par exemple, il est tout à fait possible que vous ayez appliqué un algorithme X ou que vous ayez nettoyé vos données d’une manière X, et que vous décidiez de changer de méthode pour améliorer les performances de votre modèle. Vous pouvez alors tout à fait créer une nouvelle partie dans votre projet et exposer vos trouvailles.

Communiquer sur vos projets

Faire des projets, c’est bien mais que les autres puissent le voir, c’est mieux. C’est pour cela qu’il est bon de communiquer sur vos projets, et faire en sorte qu’ils soient visibles aux yeux du plus grand nombre. Un moyen efficace de relayer vos projets est d’utiliser les réseaux sociaux. Créez-vous un compte Github et Kaggle et commencer à poster vos projets là-dessus.

Dans Github, il est important que chacun de vos projets comporte un fichier README.md que vos utilisateurs puissent facilement lire. C’est souvent une chose qui est oubliée parmi les codeurs et qui est pourtant cruciale. Si vous n’avez pas de README.md, il est beaucoup plus difficile pour le lecteur de comprendre le sujet du projet.

Kaggle fonctionne de la même manière. Il faudra avoir un kernel qui explique dans le détail les tenants et aboutissants de votre projet pour que cela puisse être intelligible pour le plus grand nombre.

Vous pouvez aussi utiliser LinkedIn et publier votre projet sous forme d’article. C’est un très bon moyen de gagner en visibilité car tous vos contacts et toutes les personnes qui visitent votre profil vont pouvoir lire les articles que vous avez écrits.

Avoir un blog ou un site personnel est aussi très bien pour centraliser vos projets. D’autant plus qu’il est très facile de mettre en place un site web sans dépenser un budget énorme. Wordpress est un très bon début, ou vous pouvez même utiliser un CMS comme Strikingly ou Wix qui feront très bien l’affaire.

Si vous vous amusez à améliorer votre SEO, vous pourrez même apparaître assez haut dans les recherches Google. En plus de votre blog personnel, il y a des plateformes de blogging comme Medium ou Quora que vous pouvez utiliser pour publier vos articles de blog.

Vous pouvez tout à fait valoriser vos projets sur votre CV comme une expérience ou dans une section “projet”. C’est une très bonne façon d’attirer l’œil d’un recruteur et de pouvoir ensuite diriger la conversation pour que vous puissiez développer.

Avoir des projets sur lesquels vous avez travaillé est ce qui va vous différencier d’un Data Scientist lambda, passez donc du temps à les peaufiner car c’est ce qui va vous permettre de vous créer de belles opportunités.

Diplômé d’Audencia Business School et de UC Berkeley, Antoine Krajnc a travaillé pendant plus de trois ans en tant que Business Analyst à San Francisco et à Paris. Il a ensuite fondé sa première entreprise Evohé qu’il a vendu pour repartir dans la Silicon Valley et fonder le cours de Data Analytics de Product School, le plus grand bootcamp de Product Management des US, qu’il a enseigné pendant deux ans. Il est aujourd’hui CEO et fondateur du cours de Data Science de Jedha.

Vous avez un scoop, une anecdote, un conseil ou bien un commentaire que vous aimeriez partager ? Contact : tiochem@efinancialcareers.com

A lire aussi…

Secteurs les plus recherchés

Loading...

Recherche emploi

Rechercher articles

Close
Loading...