Saviez-vous…
… que vous pouvez rapidement observer l’évolution de la consommation d’un médicament en France en 2022 et avoir une idée globale de l’état du marché ?
Ce tutoriel va vous expliquer comment répondre simplement à cette question en utilisant des données en accès libre (Open Data). Il s’inscrit dans une série de tutoriels créés par la CRO e-Health Services Sanoïa afin de promouvoir les usages des données Open Data. En effet, énormément de données sur le système de santé français sont disponibles gratuitement et à portée de clic : il suffit d’aller les trouver !
1. Quelle base open data choisir ?
1.1 Notre choix
Pour répondre à notre question sur l'évolution de la consommation d'un médicament, nous avons choisi la base Medic'AM.
Résumé : Depuis 2012, Medic'AM recense les informations sur les médicaments délivrés par les pharmacies de ville en France et remboursés par l’ensemble des régimes d’assurance maladie. Dans un premier temps, de 2012 à 2014, ces données étaient présentées annuellement; depuis 2015, elles le sont aussi mensuellement.
Origine : La base Medic'AM est mise à disposition par l’Assurance Maladie.
Liens utiles :
Rafraîchissement des données : La base de données Medic’AM est mise à jour en trois temps chaque année : deux fichiers contenant les informations mensuelles sont publiées à la fin de chaque semestre, puis un troisième fichier incluant les données en cumul annuel est publié au début de l’année d’après.
Description : La base Medic'AM présente des informations sur les médicaments délivrés par les pharmacies de ville et remboursés chaque mois par l’ensemble des régimes d’assurance maladie, pour chaque classe de médicaments (classification ATC) ou pour chaque médicament (code CIP) et selon le taux de remboursement de l’Assurance Maladie. Pour plus d’informations sur les classifications ATC / CIP13, vous pouvez consulter notre fiche sur la base de données Open Medic.
Les informations présentes dans la base Medic'AM sont la base de remboursement, le montant remboursé et le nombre de boîtes remboursées.
Bien que similaire à la base Open Medic, la base de données Medic’AM se distingue par la présence d’informations mensuelles, offrant ainsi une vision de l’évolution de la consommation d’un médicament sur une année.
En ce qui concerne les fichiers téléchargeables, un document excel présente plusieurs feuilles différentes correspondant aux types de classification (ATC1, ATC2, …, CIP13). Pour chaque classification, deux feuilles sont proposées :
la première, intitulée “totale”, contient la ventilation des dépenses selon la classification,
tandis que la seconde distingue ces dépenses en fonction du taux de remboursement (100% et non à 100%).
Limites : Les données collectées portent uniquement sur les médicaments délivrés en pharmacie de ville et ne contiennent donc pas les médicaments délivrés à l’hôpital. Contrairement à Open Medic, il n’y a pas de découpage socio-démographique disponible dans ces données.
De même, Medic'AM ne permet pas de décrire l’utilisation des dispositifs médicaux. Pour ce faire, il faudra utiliser une autre base : Open LPP, que vous pouvez découvrir dans notre fiche dédiée.
Les données exposées sont des données statistiques, agrégées et figées. Ainsi, si un même bénéficiaire a consommé des prestations pour 2 codes CIP13, il sera comptabilisé 2 fois.
1.2 Jeu de données utilisé dans notre exemple
Nous avons choisi les deux bases de données de l’année 2022 (1er et 2ème trimestre) s’appuyant sur la classification CIP13.
Voici les liens pour télécharger ces bases : Medic'AM - de janvier à juin 2022 (série labellisée) et Medic'AM - de juillet à novembre 2022 (série labellisée).
2. Exemple complet (avec code)
2.1 Utilisez notre Python
Notre code Python est implémenté sur Google Collaboratory et est accessible ici : Code Python Medic'AM. Il est en accès libre, cependant un compte Google est nécessaire pour pouvoir l’exécuter.
Alternativement vous pouvez copier/coller le code et l'exécuter dans votre environnement Python préféré.
2.2 Données nécessaires en entrée
Pour étudier un médicament particulier, il faut connaître son ou ses codes CIP13.
Astuce : Il existe 2 types de codes CIP, un à 7 chiffres et un autre à 13 chiffres. Medic'AM utilise celui à 13 chiffres (CIP13).
Dans cet exemple, nous choisissons d’étudier la consommation française de boîtes de HUMIRA® 20 mg, un médicament biologique pour traiter les maladies inflammatoires.
Une recherche sur la base de données publique des médicaments nous permet de retrouver le médicament que l’on cherche.
Note : par souci de simplicité, dans cet exemple, nous ne nous intéressons qu'à un seul dosage du médicament en question. Si vous voulez analyser la consommation totale de ce médicament, (c’est à dire en prenant en compte tous les dosages, toutes les formes et tous les conditionnements) vous devrez prendre tous les codes CIP13 associés.
Étape 1 : Rechercher le médicament dans la base de données publique des médicaments
Étape 2 : Aller sur sa fiche :
Étape 3 : Choisir le ou les codes CIP que l’on souhaite analyser (bien faire attention au nombre de chiffres ! ).
En résumé :
L’exemple d’étude porte sur l’Adalimumab, il faut donc récupérer tous les codes CIP de l’Adalimumab :
3400930042489, 3400930042687, 3400930116494, 3400930116500, 3400930126165, 3400930141724, 3400930141731, 3400930141755, 3400930141762, 3400930141779, 3400930141809, 3400930142288, 3400930143728, 3400930144114, 3400930144121, 3400930155080, 3400930155097, 3400930157374, 3400930157404, 3400930157428, 3400930172780, 3400930172797, 3400930178805, 3400930216330, 3400930226384, 3400930226438, 3400930226445, 3400930226452.
2.4 Lancez notre algorithme
Notre code exemple réalise les actions suivantes :
Télécharger les deux bases Medic'AM (celle de janvier à juin et celle de juillet à décembre)
les bases ont été préalablement nettoyées pour être utilisables sur Python
Fusionner des bases après nettoyage
Interroger l’utilisateur sur le(s) code(s) CIP13 à utiliser
vous pouvez copier/coller même avec des espaces et vous pouvez consulter plusieurs CIP à la fois en les séparant par des virgules
Parcourir le volumineux fichier Medic'AM ligne à ligne
Monter dans un dataframe (c’est à dire un tableau de données filtrées, nommé “short_list” dans le code) les lignes correspondant au(x) code(s) CIP13 à utiliser
Améliorer l’exactitude de nos données en récupérant le nombre de produits (tels que les seringues ou les stylos) pour chaque types de boîtes de médicaments
Pourquoi c’est important ? Parce qu’une boîte de 10 seringues et une boîte de 1 seringue, c’est pas pareil ! Il vaudrait mieux utiliser la même unité à chaque fois et le plus simple c’est de ramener tout ça à la seringue.
Modifier le format de certaines variables du dataframe afin de pouvoir les analyser
Créer un dataframe pour chacune des variables d’intérêts : nombre de boîtes délivrées, base de remboursement, montant total remboursé
Calculer le nombre total de produits délivrés
Mettre en forme nos deux dataframes d’intérêt : l’un contient les données de consommation de médicament et l’autre porte sur les montants remboursés
Afficher les résultats sous forme de graphiques
Exporter le dataframe dans un fichier Excel pour pouvoir le réutiliser plus tard simplement.
2.5 Résultats de notre code
Étape 1 : L'exécution du code prend un peu de temps… soyez patient.
Et surveillez bien le bas de la fenêtre : c’est là que vous est demandé le code CIP après quelques secondes d'exécution.
Étape 2 : Les tableaux et graphiques sont ensuite affichés à la suite du code :
Sortie 1 : Évolution pour chacun des Adalimumab analysés
Sortie 2 : Graphique avec les quantités délivrées de tous les Adalimumab chaque mois
Sortie 3 : Distribution des quantités des délivrances de tous les adalimumab chaque mois
Sortie 4 : Montant total remboursé pour des délivrances de chaque Adalimumab par mois
Que peut-on tirer de ces graphiques ?
Sortie 1 : Les premiers graphiques de chaque Adalimumab nous permettent d’observer plusieurs comportements dans l’évolution de leur consommation. En général, les biosimilaires sont en croissance, tandis que Humira (le princeps) est en décroissance. Cependant, certains biosimilaires présentent des comportements anormaux, comme Idacio, par exemple.
Sortie 2 : Malgré la présence de nombreux biosimilaires sur le marché, Humira reste en tête avec une volume de délivrance bien plus élevée que les autres.
Sortie 3 : Le graphique à colonne empilé à 100% confirme ce qui a été constaté précédemment : Humira reste dominant avec une part de marché d’Adalimumab supérieur à 50%, malgré la croissance des biosimilaires.
Sortie 4 : Tout comme pour la consommation de produits, la part des montants remboursés pour Humira reste élevée par rapport aux autres adalimumab. La différence est d’autant plus grande ici, de par le prix plus élevé de Humira par rapport aux biosimilaires. Ce graphique permet également de voir à quel point le marché de l’adalimumab est important avec environ 4 millions d’euros de remboursés chaque mois.
Étape 3 : Le fichier filtré se télécharge automatiquement.
3. Autres usages possibles
Ce jeu de données permet de répondre à une multitude d’autres questions :
Quelles ont été les évolutions de la consommation des biosimilaires de X l’année où le brevet tombe dans le domaine public ?
pour cela il faudra choisir les bases correspondant à l’année d’intérêt
Pour un même médicament X, quelle est la répartition des délivrances selon les formes ou les dosages ?
seringue vs auto-injecteur, dosage 5mg vs dosage 10 mg, etc.
4. Pour aller plus loin
Nous espérons vous avoir convaincu de l’utilité et du potentiel des données en Open Data. Cet exemple était volontairement simple à des fins pédagogiques mais des usages épidémiologiques plus poussés sont possibles !
👍 Retrouvez l’ensemble de nos fiches sur LinkedIn en suivant notre page Linkedin.
👉Si vous avez des projets d’utilisation ou de génération de données, notre équipe se tient à votre disposition : contact@sanoia.com !
Bình luận