Comprendre le signal de cluster des transactions d'initiés, Sigma Journal

InsidersTradesSigma

Le cluster, ou l’art de préférer le chœur au soliste

Le sujet est ancien, mais il ne vieillit pas mal. Les transactions d’initiés intéressent les investisseurs pour une raison simple, les dirigeants, administrateurs et actionnaires significatifs vivent plus près de l’information économique réelle que le reste du marché. Le problème est tout aussi simple, une transaction individuelle est ambiguë. On achète pour de bonnes raisons et on vend pour à peu près toutes les autres, fiscalité, diversification, divorce, villa en Toscane, ou simple discipline patrimoniale.

Le cluster essaie de résoudre cette ambiguïté en ajoutant une contrainte de coordination. Si plusieurs initiés d’un même émetteur, ou d’un même réseau informationnel, agissent dans une fenêtre resserrée, l’hypothèse d’un bruit idiosyncratique devient moins confortable. C’est précisément l’intuition que l’on retrouve chez Cohen, Malloy et Pomorski, qui montrent que l’information contenue dans les transactions d’initiés dépend non seulement de l’acte lui-même, mais aussi de la structure relationnelle dans laquelle il s’inscrit.

La version la plus opérationnelle de cette intuition est volontairement rustique, au moins 3 insiders dans 30 jours, achat ou vente, et l’on observe ensuite la performance future du titre ou du portefeuille ainsi constitué. Ce n’est pas une théorie du monde, c’est un filtre. En finance empirique, les filtres robustes ont un avantage, ils cassent moins vite que les récits.

Pourquoi trois, pourquoi trente jours

Le seuil de trois n’a rien de métaphysique. Il sert à exclure les cas où une seule personnalité dominante imprime le signal. Deux initiés peuvent encore relever d’une coïncidence ou d’une gouvernance concentrée. Trois, dans une fenêtre de 30 jours, commencent à suggérer une diffusion d’information ou une lecture commune de la valeur interne. La fenêtre de 30 jours, elle, colle à la pratique. Plus courte, on perd des événements. Plus longue, on mélange des régimes d’information distincts.

Cette définition a aussi une vertu comparative. Lorsqu’on passe de la France aux États-Unis, du Royaume-Uni aux pays nordiques, les obligations de déclaration, les délais de publication et la granularité des formulaires changent. Un signal simple, fondé sur le comptage et le temps, voyage mieux qu’un modèle trop dépendant d’un seul cadre réglementaire.

Ce que la littérature dit vraiment

Il faut être précis sur la filiation intellectuelle. Cohen, Malloy et Pomorski ne se contentent pas de dire que plusieurs initiés valent mieux qu’un. Leur apport central est de montrer que les réseaux d’initiés transmettent une information économiquement utile, et que les transactions agrégées via ces réseaux prédisent mieux les rendements futurs. Cela déplace le débat. On ne parle plus seulement d’initiés “bien informés”, mais d’initiés connectés à des poches d’information.

Pour un article sur 17 marchés, cela a une implication immédiate. Le cluster n’est pas seulement une règle de comptage, c’est un proxy grossier d’un phénomène plus profond, la concentration d’information privée ou semi-privée. Si le proxy fonctionne dans plusieurs juridictions, c’est moins parce que les formulaires se ressemblent que parce que les organisations, elles, se ressemblent assez, conseils d’administration, comités exécutifs, actionnaires de référence, et routines de décision.

Revenir à Cohen-Malloy-Pomorski, sans réciter le papier

La mauvaise manière de citer un papier académique consiste à le transformer en slogan. La bonne consiste à reprendre son mécanisme et à voir ce qu’il implique hors de son échantillon d’origine.

Le point clé, l’information est relationnelle

Dans la lecture standard, un initié transige parce qu’il sait quelque chose. Dans la lecture de Cohen-Malloy-Pomorski, il faut ajouter, il sait quelque chose, et ce quelque chose circule dans un réseau. Les administrateurs partagés, les trajectoires professionnelles communes, les proximités de gouvernance, tout cela crée des canaux de transmission qui ne sont pas publics au sens fort, même s’ils ne relèvent pas nécessairement de l’illégalité.

Le cluster à 3 initiés en 30 jours est une version frugale de cette logique. Il n’observe pas directement le réseau, mais il capte un effet de propagation. Quand plusieurs insiders se mettent à acheter, le marché a de bonnes raisons de cesser de traiter l’événement comme une excentricité individuelle.

Pourquoi le Sharpe est la bonne unité de comparaison

Comparer des rendements bruts entre marchés est un piège. Les univers n’ont pas la même volatilité, pas la même concentration sectorielle, pas la même profondeur, pas les mêmes coûts de transaction. Le ratio de Sharpe, malgré ses défauts bien connus, a ici une vertu pratique, il rapporte l’excès de rendement à la volatilité du signal.

Pour un signal de cluster, c’est particulièrement utile. Certains marchés produisent peu d’événements mais très discriminants. D’autres en produisent beaucoup, avec un bruit plus élevé. Le Sharpe permet de comparer une stratégie rare et propre à une stratégie fréquente et brouillonne sans les confondre.

Le détail qui compte, l’achat et la vente ne sont pas symétriques

Toute revisite sérieuse doit séparer clusters d’achats et clusters de ventes. La littérature sur les initiés est remarquablement stable sur ce point, les achats sont souvent plus informatifs que les ventes. La raison n’a rien de mystérieux. Un dirigeant achète en général pour une raison plus étroite qu’il ne vend. La vente est un fourre-tout. L’achat engage davantage le bilan personnel et signale plus directement une sous-évaluation perçue.

Dans un tableau de 17 marchés, on s’attend donc, toutes choses égales par ailleurs, à des Sharpes plus robustes du côté des achats. Si un marché montre l’inverse, il faut regarder de près la microstructure, les règles de blackout periods, la nature des déclarants et la couverture des données.

Dix-sept marchés, donc dix-sept façons de compliquer une idée simple

La promesse du papier comparatif est séduisante, un même signal, plusieurs juridictions, un verdict propre. La réalité est moins polie.

Market	Regulator	Rule	Deadline	Notes
FR	AMF	MAR Art 19	T+3	Déclarations des personnes exerçant des responsabilités dirigeantes et personnes liées, publiées via l’AMF.
EU	ESMA	MAR Art 19	T+3	Cadre harmonisé en théorie, avec variations d’implémentation et de diffusion selon les États membres.
US	SEC	Section 16 / Form 4	T+2	Publication rapide et base EDGAR riche, mais univers de déclarants et codification différents.

Même idée économique, tuyauterie réglementaire différente.

Le délai de publication change la valeur du signal

Un signal d’initiés n’existe pour l’investisseur qu’au moment où il devient observable. Cela paraît trivial, mais c’est là que beaucoup de backtests se maquillent. Si un marché impose une publication en T+2 et un autre en T+3, la fenêtre d’exploitation n’est pas la même. Si, en plus, la diffusion machine-readable varie en qualité, le décalage réel peut être supérieur.

En Europe, le cadre MAR, notamment l’article 19, harmonise une partie des obligations pour les personnes exerçant des responsabilités dirigeantes. Aux États-Unis, la SEC impose des dépôts Form 4 sous Section 16, avec une dynamique de publication différente. Si l’on compare des Sharpes, il faut donc décider si l’on date le signal à la date de transaction, ce qui est faux pour un investisseur réel, ou à la date de disponibilité publique, ce qui est moins flatteur mais plus honnête.

La composition des initiés n’est pas identique

Un “insider” n’est pas une particule élémentaire. Selon les marchés, le périmètre inclut différemment dirigeants exécutifs, administrateurs non exécutifs, personnes liées, actionnaires significatifs, voire entités contrôlées. Cela affecte le signal. Un cluster composé de trois administrateurs indépendants n’a pas nécessairement le même contenu qu’un cluster composé du CEO, du CFO et d’un fondateur.

Une revisite sérieuse sur 17 marchés doit donc prévoir au minimum des coupes par type de déclarant. À défaut, on risque de comparer des pommes, des poires et quelques holdings familiales.

La liquidité et la taille brouillent les comparaisons

Les marchés moins liquides peuvent afficher des réactions post-déclaration plus fortes, non parce que les initiés y sont mieux informés, mais parce que les prix ajustent plus lentement. À l’inverse, sur les grandes capitalisations très couvertes, le signal peut être plus vite arbitrée. Le Sharpe observé d’un cluster est donc un mélange de contenu informationnel et de vitesse d’incorporation.

Autrement dit, un meilleur Sharpe ne signifie pas automatiquement de “meilleurs initiés”. Il peut simplement signaler un marché plus lent. C’est moins romantique, mais plus utile.

Comment construire le backtest sans se raconter d’histoires

Le lecteur quant sait déjà que le diable est dans les conventions. Il faut donc les écrire noir sur blanc.

Définition opérationnelle du cluster

Pour chaque marché et chaque émetteur, on agrège les déclarations publiques d’initiés. Un cluster achat est déclenché lorsqu’au moins 3 initiés distincts achètent dans une fenêtre glissante de 30 jours calendaires. Même logique pour les ventes. Le point de départ investissable est la date de publication publique de la troisième transaction rendant le cluster observable, pas la date de transaction si celle-ci n’était pas encore publique.

Ensuite, on forme un portefeuille, égal-pondéré ou pondéré par volatilité, et on mesure la performance sur des horizons prédéfinis, par exemple 20, 60 et 120 jours de bourse. Le ratio de Sharpe annualisé repose sur les rendements excédentaires ou, mieux, sur des alphas résiduels après contrôle des facteurs locaux.

Les choix qui changent tout

Trois paramètres modifient fortement le résultat.

1. Distincts veut dire distincts

Compter trois transactions du même CEO comme un cluster est une erreur de catégorie. Le signal vient de la pluralité des agents, pas de la fragmentation administrative d’un ordre.

2. Les achats planifiés et mécaniques

Certains marchés, surtout les États-Unis, comportent des plans de transaction préétablis ou des schémas récurrents. Si l’on ne filtre pas les opérations manifestement mécaniques, on dilue le signal. La vente est particulièrement vulnérable à ce problème.

3. Les coûts et la capacité

Un signal rare sur petites capitalisations peut afficher un Sharpe séduisant et rester inexploitable à taille institutionnelle. Il faut donc publier, à côté du Sharpe, le nombre moyen de positions, le turnover, la taille médiane des titres et un estimateur de coûts. Sans cela, on backteste surtout l’optimisme.

Ce que nous pouvons dire avec la donnée disponible

La seule statistique fournie ici est le volume total de la base, 162574 déclarations de dirigeants. C’est un point important. Une base de cette taille permet, en principe, de construire des sous-univers par marché, par type de déclarant, par sens de transaction et par taille de capitalisation. Elle rend plausible une étude à 17 marchés. En revanche, elle ne permet pas, à elle seule, de publier le Sharpe de chaque marché sans le tableau de résultats correspondant.

On peut donc défendre la méthode, pas le palmarès. Le journalisme financier a parfois du mal avec cette distinction. Sigma, par tradition, essaie de la conserver.

Ce que l’on doit attendre, marché par marché, avant même de voir les chiffres

L’absence de tableau de résultats n’interdit pas de formuler des attentes disciplinées. Ce n’est pas de la divination, c’est de la théorie appliquée.

Marchés à publication rapide et forte standardisation

Les États-Unis, avec Form 4 et EDGAR, offrent une diffusion rapide et structurée. On s’attend à un signal de cluster bien mesuré, mais potentiellement plus vite arbitrée. Le Sharpe peut rester élevé si l’information des initiés est réellement spécifique, mais l’horizon d’exploitation sera probablement plus court.

Marchés européens sous MAR

Le cadre MAR harmonise une partie des obligations, notamment pour les dirigeants et personnes qui leur sont étroitement liées. Cela facilite la comparaison entre pays de l’Union, sans l’achever. Les différences de qualité de diffusion, de couverture historique et de traduction des catégories demeurent. On s’attend en général à des signaux plus comparables entre eux qu’avec les États-Unis, mais pas parfaitement interchangeables.

Petits marchés, petites capitalisations, grands effets

Dans les marchés plus étroits, le cluster peut produire des rendements post-signal plus marqués, car l’information se diffuse plus lentement et la couverture sell-side est plus faible. Le revers est classique, moins d’événements, plus de variance, et des coûts plus élevés. Le Sharpe ex post peut être flatteur sur échantillon et capricieux hors échantillon.

Le cas français, ni exotique ni trivial

La France est souvent un bon laboratoire intermédiaire. Le cadre réglementaire est européen, la publication AMF est formalisée, le marché combine grandes capitalisations très suivies et un tissu de mid et small caps où les initiés peuvent encore parler plus fort que les analystes. Si le cluster a une chance d’être utile en pratique, c’est souvent dans ce type de terrain mixte.

Cela dit, il faut rester modeste. Sans la ventilation par marché de nos 162574 déclarations, impossible de dire combien relèvent de la France, combien déclenchent un cluster, ni quel Sharpe en résulte. Le mot correct reste n/a.

Ce que la revisite apporte, même sans tableau final

Un bon papier quant ne vaut pas seulement par ses chiffres. Il vaut aussi par sa capacité à clarifier ce qu’un chiffre voudra dire lorsqu’on l’aura.

Première leçon, le cluster est un test de cohérence informationnelle

Une transaction isolée pose une question. Un cluster apporte un début de réponse. Si plusieurs initiés convergent, le marché devrait, en moyenne, réviser plus fortement ses anticipations. Si ce n’est pas le cas dans un marché donné, deux explications dominent, soit les initiés y sont moins informatifs, soit le marché a déjà incorporé l’essentiel avant publication.

Deuxième leçon, le Sharpe n’est qu’un résumé

Le ratio de Sharpe est utile, mais il peut masquer des profils très différents. Un marché peut afficher un Sharpe correct avec peu de gros gagnants et beaucoup de bruit. Un autre peut avoir un Sharpe voisin avec un taux de succès plus élevé mais des gains plus modestes. Pour un praticien, ces distributions comptent. Elles déterminent la patience nécessaire, la tolérance aux drawdowns et la compatibilité avec d’autres signaux.

Troisième leçon, l’international force la discipline méthodologique

Sur un seul marché, on peut parfois survivre à des conventions floues. Sur 17, elles vous rattrapent. Date de signal, définition de l’initié, traitement des amendements, exclusion des transactions non discrétionnaires, neutralisation sectorielle, ajustement des coûts, tout cela doit être homogène. Sinon, la comparaison n’est pas une étude, c’est un concours de formats de fichiers.

Ce qu’il faudrait publier ensuite, pour que l’exercice devienne vraiment utile

La suite logique de cette revisite n’est pas un commentaire de plus, c’est un tableau propre.

Le tableau minimum viable

Pour chacun des 17 marchés, il faudrait au minimum :

le nombre de déclarations,
le nombre de clusters achats et ventes,
le délai médian de publication,
le rendement moyen post-signal,
le ratio de Sharpe,
le hit rate,
la capitalisation médiane,
un estimateur de coût de transaction.

Sans cela, le lecteur ne peut pas distinguer un beau signal d’un petit miracle statistique.

Les coupes qui valent l’effort

Deux découpages sont particulièrement précieux.

Par taille de capitalisation

Le signal d’initiés est souvent plus fort dans les small caps. Si tout le Sharpe vient de là, il faut le dire. C’est une propriété économique intéressante, mais ce n’est pas la même stratégie qu’un panier large et liquide.

Par type de déclarant

CEO et CFO d’un côté, administrateurs non exécutifs de l’autre, personnes liées dans une troisième catégorie. Le cluster de trois CFO n’a pas le même parfum qu’un cluster de trois cousins de fondateur, même si la base les range parfois sous des étiquettes voisines.

Le test qui tranche, la robustesse hors échantillon

Le signal de cluster a une longue histoire académique. C’est un avantage, mais aussi un risque. Les anomalies connues attirent le capital, puis se tassent. Une revisite sur 17 marchés devrait donc inclure une séparation temporelle stricte, apprentissage sur une période, validation sur une autre, idéalement avec un test de dégradation après publication académique large du signal. Si le Sharpe tient encore, là, on commence à écouter.

Le plus intéressant n’est peut-être pas de savoir quel marché “gagne”. C’est de savoir où le signal reste exploitable après coûts, délais et crowding. La finance adore les podiums. Les portefeuilles préfèrent les survivants.

Le prochain pas concret est simple, publier le tableau par marché avec la date de signal investissable, puis refaire l’exercice en séparant achats et ventes, grandes et petites capitalisations, et initiés exécutifs versus non exécutifs. La question ouverte, la seule qui mérite vraiment du temps, est celle-ci, le cluster capte-t-il encore une information privée durable, ou seulement la lenteur résiduelle de quelques marchés qui n’ont pas encore appris à se méfier des dirigeants qui achètent ensemble ?

Le signal de cluster : un outil d'analyse des transactions d'initiés