La qualité des données

Share

04/07/2017 10:21

La qualité des données (Seddon Kirk)

Pour poursuivre sur le thème des données, venons-en maintenant au sujet de la qualité des données.

La question “Notre emploi du temps actuel est-il de bonne qualité ?” m’avait été posée – quelle réponse pouvais-je lui apporter? J’ai commencé tout simplement par compter le nombre de groupes ayant au moins un événement et il s’est avéré que c’était le cas pour 80% des groupes. Mais qu’est-ce que cela veut dire ? Certains groups peuvent n’avoir qu’un événement, mais il pourrait en manquer des dizaines à d’autres groupes…

Cette question devrait être abordée différemment et CELCAT dispose d’outils qui peuvent nous aider à nous faire une idée plus claire de la ‘qualité’ d’un emploi du temps.

Tout d’abord, pour en revenir au nombre d’événements par groupe, j’aurais tout d’abord dû comparer les heures planifiées par groupe par rapport au nombre total d’heures qui auraient du être planifiées.

Ensuite, on aurait pu examiner les événements sans personnel, sans matière et sans catégorie d’événements. On aurait ensuite pu approfondir notre examen en comparant les heures planifiées du personnel aux heures stipulées dans leurs contrats, ce que j’ai réalisé pour plusieurs clients!

La vérification des conflits est un aspect important de la gestion des emplois du temps; ce n’est pas l’activité que je préfère mais elle permet de s’assurer qu’un étudiant, par exemple, ait un emploi du temps qui peut être suivi (qui ne lui demande pas par exemple d’être à deux endroits différents en même temps).

Bien entendu, la qualité des données est aussi affectée sur d’autres plans – par exemple, l’étudiant est-il bien inscrit à la bonne formation ? Le groupe a-t-il un nombre correct d’heures à planifier ? L’adresse email d’un étudiant est-elle bien valide ? Ces facteurs dépendent de la façon dont les données sont saisies et stockées, ainsi que de l’emplacement où elles sont stockées. Quels processus de validation pourrait être mis en place pour la saisie des numéros de téléphone ou des adresses emails, et pour vérifier les données figurant déjà dans nos systèmes d’information ? Nous devrions tous nous poser ces questions.

Il y a des limites quand à la portée de vos vérifications; évidemment, s’assurer qu’un numéro de téléphone soit encore valide ou qu’une adresse email soit encore utilisée sont d’autres étapes qui pourraient prendre beaucoup de temps, mais pour commencer, on pourrait au moins vérifier que le numéro de téléphone comporte bien des chiffres uniquement.

Je passe une bonne partie de mon temps à considérer l’assiduité des étudiants. Un registre de présence est le dernier maillon à la fin d’une longue chaine de données et de processus. Comparer les étudiants figurant dans le registre entre mes mains et ceux qui sont devant moi témoignera de la qualité des données. S’agit-il bien du registre pour cette classe ? Pour cette semaine ? Tous les étudiants figurent-ils dans la liste ? La salle et le personnel qui y figurent sont-ils les bons ?

Mon dernier critère pour mesurer la “qualité” des emplois du temps repose sur le nombre de changements à apporter chaque jour/semaine/mois à l’emploi du temps et pour quelles raisons. Quand ce nombre concerne uniquement des absences du personnel et des changements occasionnels de salles en raison de travaux, je peux alors répondre avec confiance à la question “Notre emploi du temps actuel est-il de bonne qualité ” par “Oui, excellent! ”

Seddon Kirk - Data Quality