Le benchmark implicite reste la SEC
Il est difficile d’éviter la comparaison avec les États-Unis. Les formulaires de la SEC, notamment le Form 4, ont depuis longtemps alimenté un écosystème de recherche et d’outils grâce à une structuration relativement meilleure et à une culture de diffusion électronique plus ancienne. La France et l’Europe ne partaient pas du même point. Cela se voit encore.
La différence n’est pas seulement technologique. Elle tient aussi à l’ancienneté des pratiques de collecte, à la stabilité des identifiants, et à l’existence d’un usage intensif par la recherche académique et les data vendors. Le BDIF a nettement réduit l’écart d’accessibilité. L’écart d’industrialisation, lui, n’a pas totalement disparu.
Pour l’analyste quantitatif, le BDIF est exploitable, à condition de respecter la mécanique
Le bon usage d’un registre comme le BDIF n’est ni naïf ni cynique. Naïf, ce serait prendre chaque ligne comme un signal propre. Cynique, ce serait considérer la source inutilisable. Les deux positions évitent le travail, ce qui explique leur popularité.
Une chaîne de traitement minimale
Une exploitation sérieuse demande au moins cinq étapes.
D’abord, l’alignement des identifiants émetteur. Sans cela, impossible de relier proprement les déclarations à l’univers titres, aux historiques de prix et aux événements corporate.
Ensuite, la normalisation des types d’opérations. Il faut une taxonomie interne stable, documentée, qui distingue les achats de marché, les ventes de marché, les exercices, les attributions, les conversions et les transferts non informatifs.
Troisièmement, la gestion des dates. La date de transaction doit être prioritaire pour le fait économique, la date de publication pour l’étude de réaction de marché, et la date de notification pour le contrôle de conformité. Les confondre revient à fabriquer des conclusions au hasard, avec des tableaux très propres.
Quatrièmement, le traitement des doublons et amendements. Les registres réglementaires contiennent parfois des corrections, des republications ou des lignes proches qui décrivent une même opération sous plusieurs angles.
Enfin, le filtrage économique. Une stratégie de recherche ou d’investissement ne doit pas traiter de la même manière un achat ouvert de dirigeant sur le marché et une opération technique sans vraie discrétion.
Ce que l’absence de série FR nous apprend malgré tout
Le fait que notre requête FR renvoie [] ne permet pas de raconter une trajectoire chiffrée sur dix ans. Il permet néanmoins de rappeler une vérité un peu moins glamour, l’ouverture d’une base publique ne suffit pas si l’historique n’est pas récupérable de manière robuste dans le temps.
Pour une rédaction comme la nôtre, qui travaille sur 162 000 filings agrégés, c’est presque une leçon de gouvernance de la donnée. Les registres réglementaires doivent être pensés non seulement pour la consultation immédiate, mais aussi pour l’archivage, la versioning discipline, la documentation des changements de schéma et la stabilité des points d’accès. Sans cela, chaque utilisateur reconstruit sa propre histoire du marché, avec ses propres rustines. C’est inefficace, et cela nuit à la comparabilité des travaux.
Le bilan de la décennie est favorable, mais il reste administratif
Le BDIF a produit un gain indiscutable de transparence. Il a aussi accompagné, avec le cadre européen, une montée en qualité de la standardisation. Ce n’est pas une révolution esthétique. C’est mieux, c’est une amélioration administrative. Et en matière de données réglementaires, l’amélioration administrative est souvent ce qui finit par compter.
Ce qui a clairement marché
Le premier acquis est l’accès. Les déclarations sont plus visibles, plus centralisées, plus faciles à retrouver qu’avant 2009.
Le deuxième acquis est la normalisation. Le cadre MAR a donné un langage commun et des délais plus clairs. Même avec des différences nationales de mise en œuvre, l’environnement est plus lisible qu’au début de la période.
Le troisième acquis est la réutilisation possible. Pas parfaite, pas gratuite, mais possible. C’est déjà une frontière importante. Une donnée impossible à réutiliser ne crée pas vraiment de contrôle externe. Une donnée réutilisable, même imparfaitement, permet l’émergence d’analyses indépendantes.
Ce qui reste à faire pour passer du “public” au “natif data”
La prochaine étape est assez évidente.
Il faut des schémas stables et documentés, des exports machine lisibles, des identifiants émetteurs robustes, des champs de nature d’opération moins ambigus, et une documentation publique des changements de format. Une API aiderait. Un historique versionné aiderait davantage. Les deux seraient presque une marque de respect envers les utilisateurs.
Il faut aussi mieux distinguer, dans la présentation publique, ce qui relève d’une opération discrétionnaire potentiellement informative et ce qui relève d’un mouvement technique ou patrimonial. Le régulateur n’a pas à faire le travail de l’analyste. Il peut en revanche éviter de lui compliquer inutilement la tâche.