Informations GHT en Open Data
11/10/2018
Publication de la composition des GHT en open data, pour plus d'interopérabilité et de réutilisation.
Depuis la loi de santé 2016, les centres hospitaliers sont regroupés en GHT : Groupements Hospitaliers de Territoire. Il s’agit d’une nouvelle forme de coopération entre les établissements publics de santé à l’échelle d’un territoire.
La liste des GHT est publiée sur le site du ministère de la santé.
Certains sites internet reprennent ces données minimales, les complètent et en offrent une visualisation :
- le site de la FHF avec un ensemble de documents PDF : Cartographie-GHT
- le site Réseau Hopital GHT , voir la cartographie
Problématique
Ces répresentations sont intéressantes mais quid des données ? De leur complétude, de leur structuration ?
Comment utiliser ces données publiques pour :
- en faire sa propre représentation ;
- les exploiter dans ses projets, via des outils informatisés ?
Pour pouvoir utiliser les données des GHT, il est nécessaire en réalité d’utiliser deux sources de données :
- la liste des établissements juridiques consitutant les GHT ;
- les informations plus détaillées sur les établissements géographiques (les lieux physiques) liés à ces entités juridiques.
Source 1 : liste des GHT
Cette liste est disponibles sur le site du ministère de la santé. Fichier : https://solidarites-sante.gouv.fr/IMG/xlsx/dgos_ght_liste_2017_10_31.xlsx
Cependant :
- les données sont très sommaires (région, dénomination ght, code ght, finess, catégorie, dénomination établissement, commune, code postal) ;
- les données sont accessibles via un fichier excel. Ce n’est donc pas un format ouvert ;
- les données sont publiées à une adresse qui n’a pas toutes les caractéristiques d’une adresse internet pérenne : comment un système automatisé peut se baser sur cette URL ? (sachant qu’il n’y a pas d’API pour retrouver cette URL).
Source 2 : fichier Finess de la DRESS
La publication dans la source 1 du numéro finess juridique permet de faire le lien avec les différents établissements géographiques. Pour cela, l’extraction Finess, disponible en open data sur le portail data.gouv.fr permet d’obtenir les informations complémentaires.
Même si les données sont disponibles en open data, on pourra regretter que :
- les lignes de données ne sont pas homogènes : 3 sections dans le fichier CSV, obligeant un traitement inutilement complexe ;
- une description des données au format XML dans un PDF : non intégrable dans un programme, obligeant des développeurs à créer des projets annexes pour aider à son analyse (par exemple https://github.com/GuillaumePressiat/finess_etalab).
Pour compléter la source 1, nous utiliserons l’extraction des données Finess géolocalisées.
Proposition
Pour avoir 1 version réutilisable en phase avec le concept d’open data, et la loi de 2016 sur la république numérique (Art. 53-1) indiquant que les données doivent être fournies dans un
« standard ouvert, librement réutilisable et exploitable par un système de traitement automatisé »
il serait intéressant de publier ces données :
- dans 1 format structuré ou semi-structuré : XML ou JSON ;
- avec des références à des jeux de valeurs codés pour une intéropérabilité sémantique ;
- dans un format international existant et indépendant ;
- avec des données consolidées (une seule source vs deux sources actuellement).
Ainsi, ces données publiques respecteraient, en plus, le principe de portabilité de la loi numérique.
Expérimentation
Le programme ght-opendata propose de :
- lire le fichier excel du ministère de la santé ;
- faire le lien avec le fichier finess de data.gouv.fr ;
- fournir une version enrichie et structurée des données en utilisant un format internationnal. Deux possibilités :
- un format libre et international, répandu dans le domaine de la santé : les ressources HL7 FHIR
- un format internationnal général : schema.org
Détails sur l’appariement des données
Lien sur le numéro Finess
Le fichier du ministère de la santé référence chaque établissement par son finess juridique. Les coordonnées géolocalisées des établisements se rapportent aux bâtiments et donc aux établissements qui disposent d’un finess géographique. Nous aurons donc une relation de 1-n.
- GHT 13 : 13 finess juriques → 229 finess géographique
Schématiquement, nous avons donc :
Fichier XLSX
Chaque ligne a la forme suivante (convertie en CSV) :
Provence-Alpes-Côte d'Azur;Bouches-du-Rhône;PACA-04;130786049;C.H.R.;APHM DIRECTION GENERALE;Marseille 05;13354
Fichier CSV - data.gouv.fr
Les lignes, en lien avec le finess juridique précédént (130786049
) sont de la forme :
structureet;130783236;130786049;APHM HOPITAL DE LA CONCEPTION;APHM HOPITAL DE LA CONCEPTION;;;147;BD;BAILLE;;;205;13;BOUCHES-DU-RHONE;13005 MARSEILLE;0491383000;0491382012;101;Centre Hospitalier Régional (C.H.R.);1101;Centres Hospitaliers Régionaux;26130008100088;8610Z;03;ARS établissements Publics de santé dotation globale;1;Etablissement public de santé;1983-03-16;1983-03-16;2013-03-20;
structureet;130783293;130786049;APHM HOPITAL LA TIMONE ADULTES;APHM HOPITAL LA TIMONE ADULTES;;;264;R;SAINT PIERRE;;;205;13;BOUCHES-DU-RHONE;13005 MARSEILLE;0491380000;0491385033;101;Centre Hospitalier Régional (C.H.R.);1101;Centres Hospitaliers Régionaux;26130008100096;8610Z;03;ARS établissements Publics de santé dotation globale;1;Etablissement public de santé;1971-01-01;1971-01-01;2013-03-20;
geolocalisation;130783236;894579.9;6246320.6;1,ATLASANTE,100,IGN,BD_ADRESSE,V2.2,LAMBERT_93;2018-01-25
geolocalisation;130783293;895027.2;6246634.5;2,ATLASANTE,100,IGN,BD_ADRESSE,V2.2,LAMBERT_93;2018-01-25
Géolocalisation des établissements
Les coordonnées du fichier finess géolocalisé n’utilise pas les coordonnées GPS. Pour simplifier la réutilisation des données, les coordonnées GPS sont calculées et utilisées.
Mises en oeuvre
Pour partager ces données, dans une optique open data, deux formats sont proposés, qui font l’objet de deux articles :
- Données GHT en open data au format FHIR
- format schema.org (à venir)
Publication sur data.gouv.fr
Les données produites par l’expérimentation, fruit du programme open source open-ght, sont disponibles sur le portail data.gouv.fr.
Une rubrique Etablissements de santé par GHT propose les données des 135 GHT :
- format JSON
- jormat XML
Chaque jeu de données est nommé par son code GHT suivi de l’extension json ou xml. Par exemple, pour le GHT 13 : PACA-04 : Bouches-du-Rhône
, les deux fichiers de données sont :
Pour ce GHT (PACA-04
), nous aurons donc dans chaque fichier, 472 entités :
- une entité GHT ;
- 13 entités d’établissement juridique ;
- 229 entités d’établissement géographiques ;
- 229 entités de localisation physiques en lien avec les établissements géographiques.
Plus d’informations, sur l’article dédié à la mise en oeuvre des données GHT avec FHIR.