Discussion utilisateur:Mylene.Ly/D2SN 2020/Mémoire
Commentaires pour le rendu du sujet de mémoire
modifierAle
modifierBonjour Mylene, et merci pour l'ébauche bien contextualisé.
Je dois avouer que, pour un master dont le sujet est la sociologie numérique, je ne vois pas l'humain en tant qu'entité sociale dans ton sujet.
Par contre, t'as un champ super riche dans lequel tu pourrais poser plein de questions d'ordre sociale, en partant des données que tu discutes.
Par exemple, qui sont ces joueurs ? Quel est leur classe social ? Quel est leur sexe, orientation et identité sexuel ? Quel est leur âge ? Ont-ils un métier autre que l'e-sport ? Avec qui vivent-ils ? Ont-ils une famille, des partenaires ou enfants ? Pourquoi ils jouent ? Se connaissent-ils entre eux ? Forment-ils des guildes/clans/équipes pour s'entraîner et échanger des pratiques ?
Et ces facteurs, exercent une influence les uns sur les autres, par exemple les joueurs pauvres sont-ils plus susceptibles d'abandonner l'école ou autre chose pour se dédier au jeu ? Mais, plus loin, est-ce que ces facteurs ont une influence sur la carrière d'un joueur ? Dans sa performance ? Dans son choix de stratégie dans le jeu ? Dans son choix de représentation en tant que personnage ?
Et sur leur carrière en générale ? Que se passe d'un joueur après avoir quitté le jeu ? Sont-ils pénalisés ou privilégiés par rapport à d'autres parcours qu'ils avaient à leur disposition ? Comment être joueur d'e-sports a impacté leur vie ? Comment ça change par rapport à ce qu'on connaît déjà sur d'autres sports ?
Certes, ce troisième ensemble de questions est plus distante des données disponibles, mais pour les deux premiers, je pense qu'avec une petite enquête par entretien ou formulaire électronique tu pourrais atteindre des résultats assez intéressantes, combinant les jeux de données massifs que tu mentionnes dans ton sujet. S'il n'existe déjà quelque part des données socio-démographiques sur ses joueurs, ou qu'ils ne puissent pas être inférés indirectement.
Donc, pour toi le principal est de trouver un fil sociologique pour ton sujet. Après, par manque de ce fil, tu n'as pas pu décrire concrètement une démarche de collecte et analyse. Cela viendra au fur et à mesure de ton travail, mais je suggère au moins en présenter une réflexion dans le sujet rendu.
Alors bon travil, et à la rentrée,
Réponse e-mail 2020-02-04
modifierVoici quelques questions auxquelles penser :
1. Avec quelle langage de programmation tu te débrouilles mieux ? python ? javascript? R?
- - J'ai trouvé un site qui recense les bibliothèques pour l'API de Riot Games: https://riot-api-libraries.readthedocs.io/en/latest/libraries.html
- - Pour python, celle-ci me paraît assez bien faite et facile à utiliser : <https://github.com/meraki-analytics/cassiopeia>.
- - As tu déjà obtenu ta clé pour l'API?
- - Si tu as une liste de noms, tu pourrais déjà essayer de télécharger les profils des pros et faire des graphiques pour deux ou trois variables pour montrer lundi.
- - Si c'est le cas, explique-moi à quel point t'as besoin d'aide pour cela.
Pour la suite ...
2. L'idée alors serait d'utiliser les données pour élargir ton échantillon de joueuses et joueurs, cela me pose une question :
- - Dans une approche qualitative, c'est à dire allant rechercher des infos ou à la limite contactant la personne, à quel point on peut, ou pas, s'assurer qu'un profil découvert est fille ou garçon ? Cela sera important pour valider tes échantillons.
3. D'un point de vue méthodologique, tu te troues avec un problème qu'on appelle « échantillonnage de populations cachés ». Il y a un certain nombre de méthodes, mais pour ton problème je te suggère deux à considérer :
- - Prédiction. Utiliser des données volumineux dans une démarche de prédiction, à partir du groupe plus restreint de filles que tu aura pu identifier. Pour cela il faut récolter massivement des donnés par l'API, marquer les filles et les garçons connus, puis déployer des algos de prédiction pour prendre compte de leurs caractéristiques et catégoriser les restants.
- - RDS. C'est une démarche expérimentale fondé sur les propriétés des réseaux sociaux qui s'appelle « Respondent Driven Sampling ». Tu peux t'en familiariser par cet article qui l'a appliqué à des groupes de musiciens <https://journals.openedition.org/sociologie/3336>, l'annexe de l'article explique un peu mieux le côté statistique <https://journals.openedition.org/sociologie/3342>.