Discussion utilisateur:Nika Borovskikh/D2SN 2020/Mémoire

Commentaires pour le rendu du sujet de mémoire

modifier

Ni! Bonjour Nika, et merci pour l'ébauche de sujet bien organisée. Cela permet de faire un commentaire beaucoup plus utile (et plus long!).

Comme tu pars d'une base de données assez propre, il me semble que le défi pour toi sera de prendre en compte les informations qualitatives dont tu disposes dans le modelage et pour l'interprétation des résultats. Mais il faut aussi mieux décrire la base de données. Je ne vois pas quelques informations essentielles pour se rendre compte de quoi peut-on en faire, comme le nombre d'années sur lesquelles portent les données.

Pour les informations dont tu disposes sur les phénomènes, c'est important de les sourcer. Par exemple quand tu dis que « les "nouveaux arrivés" [...] sont ramenés à poser la demande de congé en période imposée par leur responsable opérationnel ». D'où vient cette information ? Ça a sorti d'une analyse exploratoire de la donnée, ou d'une discussion informelle avec les sujets, ou d'un entretien avec les responsables ou le personnel, ou d'un autre papier, ou c'est une idée à toi (ce qui reste tout à fait valide dès que tu le dise) ? Cela va t'aider aussi à se rendre compte de quand il y a une nécessité de faire du qualitatif, par exemple des entretiens, pour pouvoir s'emparer correctement des données, des modèles et interprétations.

C'est important aussi que tu rends plus explicite comment tu vas jouer avec les variables pour cibler les questions et hypothèses. Par exemple, définir la période au niveau de la semaine, comme tu le dis, peut être intéressant pour répondre à certaines questions, mais peut-être tu pourras commencer simplement en regardant les saisons/trimestres, ou même définir des périodes inégales par rapport à d'autres considérations (température, vacances scolaires).

Davantage, il sera utile de prévoir dans ton travail et dans le mémoire une compréhension et discussion des implicites du modèle, car, par exemple, là où on assume des variables indépendantes c'est souvent où on perd dans nos comptes les influences collectives et d'autres informations d'ordre sociologique, que des recherches qualitatives peuvent aider à remettre en question.

D'une manière générale, il faut mieux préciser le modelage: ton hypothèse c'est que la valeur de chaque variable va dépendre de quelles autres ? Des variables socio-démographiques ? Des autres variables ? De sa propre valeur dans l'année précédente ou dans les jours précédentes ? Et, alors, comment ? Les variables seront utilisés directement ou par leur différence ? Si par différence, par rapport au jour précédent ou le même jour dans l'année précédent ? Si tu n'as pas ces réponses claires, c'est qu'il faut mieux comprendre le modèle que t'as choisi, faute de choisir le modèle en fonction de ces choix, au risque de mal interpréter les résultats. Pour cela il faudra que tu rends ça de plus en plus explicite dans ton texte, du sujet à rendre jusqu'au mémoire où cela doit être soigneusement décrit.

Pour ton choix de modèle, je me demande s'il est adapté à ce que tu veux faire. Je suis pas l'archi-expert, mais on utilise ARIMA pour des auto-analyses, c'est à dire qu'on va expliquer la série à partir d'elle-même, et pas à partir d'autres variables comme tu le souhaite. S'il s'agit d'une usage d'ARIMA avec des variables exogènes, il faut préciser de quel modèle tu parles, et aussi s'interroger si la composante d'auto-analyse est de fait utile dans la façon qu'elle se correspond avec les variables extérieures. Pour le sujet il faut pas avoir choisi le modèle définitif, mais il faut que se questionnement soit bien présenté.

J'espère que ces commentaires t'aideront à développer le sujet en quelque chose qui te servira de guide pour ton mémoire.

Bon travail et à la rentrée,

Ale Solstag (discussion) 14 décembre 2019 à 16:10 (UTC)Répondre

Retour à la page de l’utilisateur « Nika Borovskikh/D2SN 2020/Mémoire ».