TÉMOIGNAGE : « Les connaissances mathématiques nécessaires pour un job en data science et IA »

eFC logo
Big data

Si vous aspirez à trouver un emploi dans la data science et l'intelligence artificielle, vous vous demandez probablement comment répartir votre temps : devriez-vous vous concentrer sur l’apprentissage des mathématiques, ou de Python, ou bien les deux ?

La réponse est les deux. Vous ne devriez pas négliger les mathématiques.

Les mathématiques ne vont pas de soi. Ils ne répondent pas à l'étude scientifique d'un sujet comme c'est par exemple le cas de la théologie ou de la biologie. Le mot lui-même vient du mot grec «mathematikos» qui signifie tout simplement «friands d’apprentissage». En un sens, les mathématiques constituent notre capacité à apprendre.

Malheureusement, à l'école, nous sommes amenés à croire que les mathématiques sont une question de chiffres. En effet, il existe trois types de mathématiciens : ceux qui savent compter et ceux qui ne savent pas. Ce n’est que plus tard, si nous choisissons de poursuivre le sujet jusqu’à la fin d'un premier cycle et au-delà, que nous apprenons que les nombres sont accidentels, alors que les mathématiques concernent les idées, la logique et l’intuition – la vérité en quelque sorte.

Jacques Hadamard a cru qu’il s’agissait avant tout de cette dernière, car d'après lui « la logique ne fait que sanctionner les conquêtes de l’intuition ». L'intuition commence par l'observation - tout comme la philosophie commence par l'émerveillement - une observation profonde et réfléchie, et le désir de découvrir la vérité - le but ultime d'un data scientist.

La tentation de la complexité contrecarre les efforts d'un mathématicien. Une fois que nous avons appris la théorie du pricing des options de Black-Scholes-Merton, lauréats du prix Nobel, le démon de la complexité commence à murmurer à notre oreille : «Pourquoi s'arrêter aux options vanille ? Considérez le bénéfice que vous pourriez tirer à partir du pricing de produits plus exotiques ! ».

Ici le discernement et l'introspection sont nécessaires : augmentons-nous la complexité parce qu'elle est réellement nécessaire ou parce que nous voulons montrer à quel point nous sommes intelligents ? Comme l'a souligné Isaac Newton dans Rules for methodizing the Apocalypse, «la vérité se trouve toujours dans la simplicité, et non dans la multiplicité et la confusion des choses». Comment pouvons-nous distinguer la vraie complexité de l'entropie, et le signal du bruit ?

En effet, certaines des branches les plus simples des mathématiques sont les plus utiles pour le data scientist. Si vous souhaitez travailler dans la data science et l'apprentissage automatique, vous n'avez pas nécessairement besoin de comprendre le calcul stochastique, mais vous devrez comprendre les concepts mathématiques ci-dessous :

1. Algèbre linéaire

Vous devez vous familiariser avec l'algèbre linéaire si vous souhaitez travailler dans la datascience et le machine learning, car cela facilite la gestion des matrices, des objets mathématiques composés de plusieurs nombres organisés dans une grille. Les données collectées par un data scientist se présentent naturellement sous la forme d'une matrice - la matrice de données - de n observations par p caractéristiques, donc une grille n-par-p.

2. Théorie des probabilités

La théorie des probabilités aide le data scientist à gérer l'incertitude et à l'exprimer dans des modèles. Les fréquentistes, les bayésiens et même les physiciens quantiques discutent encore de ce qu’est la probabilité (dans de nombreuses langues, telles que le russe et l’ukrainien, le mot «probabilité» vient de l'expression «avoir la foi»), alors que des pragmatiques, tels que Andrey Kolmogoro, évitent la question, en postulant des axiomes qui décrivent comment la probabilité se comporte (plutôt que ce qu’elle est) et en disant : arrêtez de poser des questions, utilisez simplement les axiomes.

3. Statistiques

Après la théorie des probabilités, il y a des statistiques. Comme le faisait remarquer Ian Hacking, « les statisticiens silencieux ont changé notre monde - non pas en découvrant de nouveaux faits ou des développements techniques, mais en modifiant les méthodes de raisonnement, d'expérimentation et de formation des opinions ». Lisez How to Lie with Statistics de Darrell Huff - ne serait-ce que pour apprendre à être dans le vrai et comment reconnaître la vérité - tout comme Moïse a appris « toute la sagesse des Égyptiens » - afin de la rejeter.

4. Théorie d'estimation

Une branche particulière de la statistique - la théorie de l'estimation - avait été largement négligée dans la finance mathématique. Ce qui a entraîné un coût élevé. En effet, cette théorie nous indique à quel point nous connaissons un nombre particulier : quelle est l'erreur présente dans nos estimations ? Dans quelle mesure est-ce dû au biais et à la variance ?

Au-delà des statistiques classiques, dans le machine learning nous voulons minimiser l'erreur sur les nouvelles données - hors échantillon - plutôt que sur les données déjà vues - dans l'échantillon. Comme l’a remarqué quelqu'un, probablement Niels Bohr ou Piet Hein, « la prévision est très difficile, surtout en ce qui concerne l'avenir ».

5. Théorie d'optimisation

Vous pouvez passer votre vie à étudier cela. Une grande partie du machine learning concerne l’optimisation - nous voulons trouver les poids qui donnent les meilleures performances (en termes d’optimisation, optimales) d’un réseau de neurones sur de nouvelles données. Nous devons donc naturellement optimiser, peut-être avec une forme de régularisation (et avant d’avoir calibré ce réseau de mémoire à court terme (LSTM), avez-vous essayé la régression linéaire de base sur vos données ?).

Mieux encore : un data scientist lambda n’utilise peut-être pas son langage, mais certaines des avancées récentes en matière de réseaux neuronaux ont été alimentées par la théorie de l’information de Claude Shannon - et la thermodynamique. Après tout, l'entropie est notre ennemi et nous devrions rester proche de nos amis et plus proche encore de nos ennemis.

Ancien trader quantitatif et algorithmique chez Deutsche Bank, Citi et Nomura, Paul Bilokon enseigne également à temps partiel à l'Imperial College de Londres. Il est l'un des fondateurs des Thalésiens, une société d’Intelligence Artificielle (IA) spécialisée dans la néo-cybernétique, l’économie numérique, la finance quantitative, l’éducation et le conseil.

Vous avez un scoop, une anecdote, un conseil ou un commentaire que vous aimeriez partager ? Contact : tiochem@efinancialcareers.com

A lire aussi…

Close
Loading...