Machine Learning & Black Swans

Les cygnes noirs ont été définis comme des événements qui se caractérisent par leur rareté, leur imprévisibilité et la tendance à les rationaliser a posteriori.

En finance, ces événements ont la caractéristique de pouvoir être exogènes : événements naturels, pandémie, guerre, mais aussi de pouvoir être générés par les marchés financiers eux-mêmes sous la forme de bulles spéculatives. Les marchés économiques et financiers ont ainsi connu plusieurs événements mondiaux de ce type, par exemple la bulle immobilière de 2008, souvent classifiés dans la catégorie des cygnes noirs. L’imprévisibilité de ces bulles repose sur le fait de déterminer si elles existent réellement ou non, de mesurer leur évolution et leur capacité à exploser, et surtout, leur impact potentiel sur les marchés et l’économie.

Intelligence artificielle

L’irruption de ChatGPT-4 en 2023 a constitué un point tournant dans la compréhension des possibilités de l’IA et dans l’accélération des outils utilisés jusqu’alors. En finance des marchés, le développement rapide de nouveaux dispositifs a permis de généraliser et d’étendre des algorithmes qui étaient, pour certains, déjà avancés (trading haute fréquence, robot advisory, web scraping), en multipliant également le nombre d’acteurs actifs dans le domaine. Alors que l’accent a été porté dans un premier temps sur les traitements massifs de documents, la synthétisation et la réécriture par les Large Langage Models (LLM), désormais l’intelligence est de plus en plus utilisée dans l’investissement même, en appliquant en particulier les principes du machine learning.

Machine Learning et cygnes noirs

Les algorithmes de machine learning sont conçus pour apprendre sur la base de vastes volumes de données financières et pour identifier les tendances et formuler des prédictions ou des décisions sans intervention humaine ou avec une intervention humaine limitée. Cependant, aussi impressionnante soit-elle, la capacité de l’IA à prédire ou à atténuer l’impact des événements particuliers n’est pas assurée. Ceci est lié à la fois au caractère par définition imprévisible du cygne noir, mais également aux caractéristiques de l’apprentissage.

En effet, l’objectif général de l’apprentissage est de minimiser l’entropie pour que la distribution prédite soit la plus proche possible de la distribution observée, ayant ainsi tendance à traiter à part ou ignorer les outliers, qu’ils soient aberrants ou difficiles à expliquer. L’apprentissage est aussi tributaire de l’accès et de la longueur des données historiques, de leur disponibilité selon les domaines, mais également de l’hypothèse que les données passées, massivement employées, permettent de déterminer des tendances ayant un certain pouvoir prédictif. Enfin, une part importante de la mise au point est d’éviter le «surapprentissage», c’est-à-dire de fonctionner en favorisant les données d’apprentissage au détriment de la capacité de prédiction. Ceci conduit naturellement à écarter ou minimiser les événements particuliers qui ne rentrent pas dans la moyenne.

Petits et gros cygnes

Les caractéristiques de l’apprentissage, qu’il soit supervisé ou non supervisé, posent la question de la génération d’une bulle particulière et de l’autoproduction d’un cygne noir d’un nouveau genre par la multiplication d’acteurs automatisés dont la diversité serait factice. Selon les principes établis par Shannon, le nombre et la multiplication d’acteurs ne veut pas dire qu’il y a plus d’information, ni que celles-ci soient différentiées. Ceci est illustré par le paradoxe du jeu inventé par Shannon en 1948, qui créé un prédicteur universel discret profitant des biais de l’information fournie (en l’occurrence un expérimentateur qui génère des nombres qui ne sont en réalité pas aléatoires). L’accès facilité à des algorithmes avancés provoque une multiplication des acteurs, mais ceux-ci risquent de traiter les informations de manière similaire. Il est probable que ces acteurs, en faisant des hypothèses semblables et en utilisant essentiellement les mêmes données et les mêmes algorithmes, obtiennent des résultats similaires et renforcent les mêmes prédictions en limitant les possibilités d’arbitrage. Un parallèle, peut être fait avec le trading haute fréquence qui permettait de dégager une surperformance significative tant que le nombre d’acteurs était limité.

On peut alors se poser la question de savoir si l’utilisation de modèles d’apprentissage permet d’obtenir une meilleure efficience des marchés, en multipliant les acteurs, ou au contraire augmente le risque d’inefficience en reproduisant des acteurs clonés artificiellement. Le paradoxe serait alors que la maturité de l’investissement par IA finisse par reproduire les biais reprochés aux investissements indiciels: concentration excessive, crainte de création de bulle, comportements grégaires. Cependant, elle ne supporte a priori pas les mêmes inconvénients majeurs qui sont associés à ces fonds indexés: manque de surperformance, manque de flexibilité et impossibilité de pouvoir profiter d’opportunités sur le marché.

Allnews

La finance suisse dans l'e-media

Machine Learning & Black Swans

Thierry Vessereau

Cet article est réservé aux investisseurs qualifiés