Comment construire le backtest sans se raconter d’histoires
Le lecteur quant sait déjà que le diable est dans les conventions. Il faut donc les écrire noir sur blanc.
Définition opérationnelle du cluster
Pour chaque marché et chaque émetteur, on agrège les déclarations publiques d’initiés. Un cluster achat est déclenché lorsqu’au moins 3 initiés distincts achètent dans une fenêtre glissante de 30 jours calendaires. Même logique pour les ventes. Le point de départ investissable est la date de publication publique de la troisième transaction rendant le cluster observable, pas la date de transaction si celle-ci n’était pas encore publique.
Ensuite, on forme un portefeuille, égal-pondéré ou pondéré par volatilité, et on mesure la performance sur des horizons prédéfinis, par exemple 20, 60 et 120 jours de bourse. Le ratio de Sharpe annualisé repose sur les rendements excédentaires ou, mieux, sur des alphas résiduels après contrôle des facteurs locaux.
Les choix qui changent tout
Trois paramètres modifient fortement le résultat.
1. Distincts veut dire distincts
Compter trois transactions du même CEO comme un cluster est une erreur de catégorie. Le signal vient de la pluralité des agents, pas de la fragmentation administrative d’un ordre.
2. Les achats planifiés et mécaniques
Certains marchés, surtout les États-Unis, comportent des plans de transaction préétablis ou des schémas récurrents. Si l’on ne filtre pas les opérations manifestement mécaniques, on dilue le signal. La vente est particulièrement vulnérable à ce problème.
3. Les coûts et la capacité
Un signal rare sur petites capitalisations peut afficher un Sharpe séduisant et rester inexploitable à taille institutionnelle. Il faut donc publier, à côté du Sharpe, le nombre moyen de positions, le turnover, la taille médiane des titres et un estimateur de coûts. Sans cela, on backteste surtout l’optimisme.
Ce que nous pouvons dire avec la donnée disponible
La seule statistique fournie ici est le volume total de la base, 162574 déclarations de dirigeants. C’est un point important. Une base de cette taille permet, en principe, de construire des sous-univers par marché, par type de déclarant, par sens de transaction et par taille de capitalisation. Elle rend plausible une étude à 17 marchés. En revanche, elle ne permet pas, à elle seule, de publier le Sharpe de chaque marché sans le tableau de résultats correspondant.
On peut donc défendre la méthode, pas le palmarès. Le journalisme financier a parfois du mal avec cette distinction. Sigma, par tradition, essaie de la conserver.
Ce que l’on doit attendre, marché par marché, avant même de voir les chiffres
L’absence de tableau de résultats n’interdit pas de formuler des attentes disciplinées. Ce n’est pas de la divination, c’est de la théorie appliquée.
Marchés à publication rapide et forte standardisation
Les États-Unis, avec Form 4 et EDGAR, offrent une diffusion rapide et structurée. On s’attend à un signal de cluster bien mesuré, mais potentiellement plus vite arbitrée. Le Sharpe peut rester élevé si l’information des initiés est réellement spécifique, mais l’horizon d’exploitation sera probablement plus court.
Marchés européens sous MAR
Le cadre MAR harmonise une partie des obligations, notamment pour les dirigeants et personnes qui leur sont étroitement liées. Cela facilite la comparaison entre pays de l’Union, sans l’achever. Les différences de qualité de diffusion, de couverture historique et de traduction des catégories demeurent. On s’attend en général à des signaux plus comparables entre eux qu’avec les États-Unis, mais pas parfaitement interchangeables.
Petits marchés, petites capitalisations, grands effets
Dans les marchés plus étroits, le cluster peut produire des rendements post-signal plus marqués, car l’information se diffuse plus lentement et la couverture sell-side est plus faible. Le revers est classique, moins d’événements, plus de variance, et des coûts plus élevés. Le Sharpe ex post peut être flatteur sur échantillon et capricieux hors échantillon.
Le cas français, ni exotique ni trivial
La France est souvent un bon laboratoire intermédiaire. Le cadre réglementaire est européen, la publication AMF est formalisée, le marché combine grandes capitalisations très suivies et un tissu de mid et small caps où les initiés peuvent encore parler plus fort que les analystes. Si le cluster a une chance d’être utile en pratique, c’est souvent dans ce type de terrain mixte.
Cela dit, il faut rester modeste. Sans la ventilation par marché de nos 162574 déclarations, impossible de dire combien relèvent de la France, combien déclenchent un cluster, ni quel Sharpe en résulte. Le mot correct reste n/a.
Ce que la revisite apporte, même sans tableau final
Un bon papier quant ne vaut pas seulement par ses chiffres. Il vaut aussi par sa capacité à clarifier ce qu’un chiffre voudra dire lorsqu’on l’aura.
Première leçon, le cluster est un test de cohérence informationnelle
Une transaction isolée pose une question. Un cluster apporte un début de réponse. Si plusieurs initiés convergent, le marché devrait, en moyenne, réviser plus fortement ses anticipations. Si ce n’est pas le cas dans un marché donné, deux explications dominent, soit les initiés y sont moins informatifs, soit le marché a déjà incorporé l’essentiel avant publication.
Deuxième leçon, le Sharpe n’est qu’un résumé
Le ratio de Sharpe est utile, mais il peut masquer des profils très différents. Un marché peut afficher un Sharpe correct avec peu de gros gagnants et beaucoup de bruit. Un autre peut avoir un Sharpe voisin avec un taux de succès plus élevé mais des gains plus modestes. Pour un praticien, ces distributions comptent. Elles déterminent la patience nécessaire, la tolérance aux drawdowns et la compatibilité avec d’autres signaux.
Troisième leçon, l’international force la discipline méthodologique
Sur un seul marché, on peut parfois survivre à des conventions floues. Sur 17, elles vous rattrapent. Date de signal, définition de l’initié, traitement des amendements, exclusion des transactions non discrétionnaires, neutralisation sectorielle, ajustement des coûts, tout cela doit être homogène. Sinon, la comparaison n’est pas une étude, c’est un concours de formats de fichiers.