Ce que cela change dans l’interprétation des études publiées
Corriger le biais de survie ne produit pas seulement des rendements plus faibles. Cela change la manière de lire toute la littérature sur les initiés.
Les résultats académiques modestes sont souvent plus crédibles
Quand une étude bien construite trouve un excès de rendement économiquement intéressant mais loin des promesses commerciales, il ne faut pas la juger timide. Il est probable qu’elle compte les dossiers disparus, les coûts implicites, les délais de publication et les frictions de mise en œuvre. Bref, elle décrit un marché, pas une brochure.
À l’inverse, un papier non académique qui annonce des performances très élevées sans discussion détaillée de l’univers, des delistings et des corporate actions mérite une lecture sceptique. Pas cynique, sceptique. La nuance est utile.
Les comparaisons entre pays demandent une hygiène de données rare
Comparer l’effet des achats d’initiés entre France, Allemagne, Royaume-Uni et États-Unis est séduisant. Le risque est de comparer des régimes de données plutôt que des marchés. Si un pays a une meilleure couverture historique des radiations et un autre une meilleure normalisation des déclarations, l’écart de performance peut venir de la tuyauterie.
C’est pourquoi nous privilégions les comparaisons dont les règles d’univers et de sortie sont harmonisées ex ante. Sinon, le tableau comparatif est précis comme une montre sans aiguilles.
Les petits échantillons sont encore plus fragiles
Sur des sous-univers étroits, par exemple achats de CEO sur small caps françaises, quelques delistings manquants suffisent à transformer la distribution des rendements. Un ou deux dossiers catastrophiques retirés de l’historique peuvent faire basculer la moyenne, la skewness et le Sharpe.
Autrement dit, plus l’échantillon est petit et plus le protocole de survie doit être strict. C’est rarement ce qu’on observe.
Ce que nous publions, et ce que nous refusons de publier
Notre ligne éditoriale sur les backtests d’initiés est simple, un résultat non auditable n’est pas un résultat. Cela a deux conséquences.
Nous documentons l’univers avant la performance
Avant de montrer un Sharpe, nous voulons pouvoir répondre à des questions peu glamour et décisives.
- Quels émetteurs étaient éligibles à chaque date ?
- Comment les identifiants ont-ils été chaînés dans le temps ?
- Quel traitement a été appliqué aux retraits de cote, faillites et suspensions ?
- Quelle proportion des signaux a été exclue, et pourquoi ?
- Les résultats survivent-ils à des conventions de sortie plus sévères ?
Si ces réponses sont absentes, le graphique de performance est un accessoire de communication.
Nous préférons un Sharpe plus bas à un mythe plus haut
La correction du biais de survie réduit généralement l’attrait visuel des résultats. C’est un excellent signe. Une stratégie qui reste intéressante après avoir réintégré les morts mérite d’être étudiée. Une stratégie qui ne fonctionne que dans un cimetière vidé de ses tombes mérite surtout d’être refermée.
Nous séparons signal économique et exploitabilité
Un achat d’initié peut contenir de l’information, sans pour autant produire une stratégie facilement monétisable après publication réglementaire, coûts de transaction, contraintes de liquidité et événements de sortie. Corriger le biais de survie aide justement à distinguer ces deux questions.
Le signal peut exister. Le portefeuille, lui, doit vivre dans le monde réel, où les sociétés fusionnent, font faillite, suspendent leur cotation et cessent de répondre aux fantasmes du backtester.
Ce qu’il faut vérifier dans toute étude d’initiés avant de croire le chiffre
Pour finir utilement, voici la liste de contrôle minimale que nous appliquons à toute étude, y compris aux nôtres.
Univers et identifiants
L’étude précise-t-elle comment les émetteurs disparus sont conservés dans l’historique ? Utilise-t-elle des identifiants persistants ou seulement des tickers actuels ? Les changements de nom et de place sont-ils gérés ?
Rendements de sortie
Les delisting returns, ou leur équivalent méthodologique, sont-ils intégrés ? Les OPA en cash, échanges de titres, faillites et liquidations ont-ils des règles distinctes ? Les suspensions longues sont-elles traitées explicitement ?
Point-in-time
Les métadonnées et critères de filtre sont-ils disponibles à date, ou reconstruits à partir d’une photo actuelle de la base ? La réponse importe plus que le style du code.
Sensibilité
Les performances sont-elles robustes à des conventions de sortie prudentes ? Si un résultat s’effondre dès qu’on réintroduit quelques émetteurs disparus, ce n’est pas un facteur, c’est une illusion d’archivage.
Auditabilité
Peut-on reproduire le nombre de signaux, les exclusions et les positions terminales ? Si non, la confiance doit être proportionnelle au silence méthodologique, c’est-à-dire faible.
Le point essentiel est simple. Le biais de survie ne rend pas seulement les études d’initiés trop optimistes. Il les rend parfois méconnaissables. Corriger ce biais exige un univers point-in-time, des identifiants persistants, des règles de sortie explicites et une tolérance limitée pour les trous de données flatteurs. La prochaine étape concrète est donc moins glamour qu’un nouveau facteur, mais plus utile, publier, pour chaque backtest d’initiés, un appendice standardisé sur les delistings, les exclusions et les conventions de rendement terminal. La question ouverte est nette, combien de stratégies “robustes” survivraient à cette simple discipline ?