Étape 1, définir l’objet réglementaire
Il faut d’abord isoler les filings comparables.
- Transactions de dirigeants et personnes liées, pas les autres formulaires.
- Date de transaction économique clairement identifiée.
- Date de première publication publique, pas seulement date d’ingestion.
- Juridiction ou autorité compétente déterminée de manière fiable.
Si plusieurs dates existent, il faut documenter la hiérarchie. Par exemple, first_public_timestamp prioritaire, puis regulator_posted_at, puis issuer_release_at, et seulement en dernier recours vendor_ingested_at.
Étape 2, nettoyer les observations impossibles
Une règle simple et défendable consiste à exclure les délais négatifs inférieurs à un seuil technique, ou à les recoder si l’on peut démontrer un décalage de fuseau horaire. Par exemple :
- conserver les écarts entre -1 et +30 jours pour audit,
- recoder les valeurs entre -1 et 0 si une convention UTC explique le décalage,
- exclure les valeurs inférieures à -1 jour sauf justification,
- winsoriser les extrêmes positifs si l’objectif est la comparaison centrale.
Le point n’est pas de maquiller les chiffres. Le point est d’éviter que des erreurs de tuyauterie soient promues au rang de doctrine réglementaire.
Étape 3, passer de la moyenne à la médiane, et ajouter des quantiles
La médiane par régulateur donne le centre de la distribution. Les quantiles, p25, p75, p90, disent si l’application est stable ou si elle dépend d’une longue queue de retards. Deux régulateurs peuvent partager une médiane de 2 jours, mais l’un avoir un p90 à 3 jours et l’autre à 9 jours. Le premier est prévisible. Le second est conforme en moyenne, imprévisible en pratique.
Étape 4, distinguer délai légal et délai observé
Une comparaison utile juxtapose :
- le délai légal nominal,
- la médiane observée événement vers publication,
- le taux de dépassement du délai légal,
- la dispersion des délais.
C’est seulement à ce stade que l’on peut parler d’asymétrie d’application. Avant cela, on parle surtout d’asymétrie de base de données.
Pourquoi cette asymétrie compte pour le marché
On pourrait croire qu’une différence d’un jour ou deux dans la publication des transactions de dirigeants relève de l’archivistique. C’est une erreur classique, et donc populaire.
Les transactions de dirigeants restent un signal suivi
La littérature académique et la pratique de marché convergent sur un point simple, les achats de dirigeants, surtout lorsqu’ils sont groupés, informatifs, non liés à des plans automatiques, et réalisés par certains profils d’initiés, contiennent de l’information. L’ampleur du signal varie selon les marchés, les périodes et les filtres. Mais l’existence du signal n’est pas une curiosité.
Si l’information est publiée plus vite dans une juridiction que dans une autre, l’égalité d’accès au signal n’est plus homogène. Les investisseurs systématiques qui consomment les flux machine-readable en temps réel bénéficient davantage des régimes les plus standardisés. Les autres reçoivent parfois l’information avec un léger parfum de réchauffé.
Le coût de l’hétérogénéité est surtout un coût de comparabilité
Une règle uniforme mal observée n’est pas seulement un problème de conformité. C’est un problème de comparabilité cross-market. Pour un gérant paneuropéen, un filtre “buy by CEO within 3 business days” n’a pas le même sens si la date visible au public dépend du pays. Le backtest devient un concours de plomberie réglementaire.
La surveillance elle-même peut être biaisée
Les autorités surveillent les abus de marché avec des jeux de données qui, en interne, sont souvent meilleurs que ceux du public. C’est normal. Mais si la diffusion publique est hétérogène, le marché secondaire, analystes, chercheurs, investisseurs, journalistes, opère sur une image plus bruitée et moins comparable. On obtient alors un paradoxe familier, l’harmonisation existe dans les textes, mais pas dans la matière première que voient les utilisateurs.
Ce que l’on peut déjà dire, et ce qu’il faut encore produire
Nous pouvons tirer des conclusions prudentes à partir de l’extrait. Nous ne pouvons pas encore publier un classement crédible des régulateurs sans la table médiane nettoyée par autorité compétente.
Ce que l’extrait permet d’affirmer
Premièrement, votre base contient des anomalies temporelles suffisamment fortes pour invalider une lecture naïve des moyennes brutes par “market”.
Deuxièmement, la répétition du -0,5 jour indique probablement une convention technique transversale, pas un comportement réglementaire.
Troisièmement, l’angle éditorial est bon. L’asymétrie d’application existe probablement, mais elle doit être isolée des artefacts de données avant d’être attribuée aux régulateurs.
Ce qu’il faut calculer ensuite
La requête minimale à produire devrait ressembler à ceci, conceptuellement :
- remapper chaque déclaration à un régulateur,
- calculer
delay_days = first_public_date - transaction_date,
- exclure ou corriger les délais impossibles,
- calculer médiane, p25, p75, p90, et part au-delà du délai légal,
- segmenter par période pour voir si l’écart se réduit ou s’accroît.
Une coupe temporelle serait particulièrement utile autour de 2016, entrée en application de MAR, puis autour des années récentes pour voir si la numérisation des portails a réduit les écarts. Sans série chronologique, on voit le niveau. Avec la série, on voit l’apprentissage institutionnel, ou son absence.
Une citation qui résume le cadre juridique européen