Modélisation des Réseaux (M1 SIREN, 2022)
Université Paris Dauphine - PSL, M1 SIREN 2021-2022
Enseignant: Ale Abdo
Orientations:
Introduction : Séance 1 (22/03)Modifier
Réseaux et graphesModifier
Qu'appelons-nous « réseaux » ?
Qu'est-ce que c'est une relation ?
Qu'est-ce que c'est un graphe ?
Quand représenter un système comme un graphe ?
Quelles choix dans la fabrique d'un « modèle de réseau » ?
Comment travailler projections et mesures ?
Phénomènes des et dans les réseaux.
Distance, dimension.
Réseaux plongés dans un espace.
Théorie des graphes, réseaux aléatoires, réseaux complexes.
Calculs et bases de données pour réseaux: ensembles, matrices d'adjacence, listes d'adjacence.
Réseaux et WebModifier
Navigation (HTML, hyperliens).
Données. Contenus. Traces.
Promenades. Flux. Diffusion.
Recherche.
Recommandation.
Sémantique (RDF, ontologies).
Techniques d'analyse et modélisationModifier
Statistique descriptive. Mesures locales et globales.
Processus dynamiques. Simulations.
Contraintes formelles et « modèles nuls ».
Modèles génératifs. Prédiction.
Fondamentaux de l'analyse de réseauxModifier
- Les éléments des graphes
- Variantes de graphes
- Cas notables
- Voisins et degrés
ActivitéModifier
Séance 2 (04/04)Modifier
Fondamentaux de l'analyse de réseauxModifier
- Voisins et degrés
- Chemin et distance
- Composantes d'un graphe
Analyse de réseauxModifier
- Statistiques descriptives
- Distributions et corrélations
ActivitéModifier
Séance 3 (25/04)Modifier
Analyse de réseauxModifier
- Transitivité et corrélations
- Transitivité et distances : le phénomène du petit monde
- Le concept et l'expérience originale
- La formalisation moderne chez Wikipédia, et l'article l'ayant introduite
- Une version moderne de l'expérience
- Proximité
Bases du WebModifier
- HTTP, HTML, ECMAScript et autres standards du Web
- Données et services: centralisation et décentralisation
- RDF et Ontologies, LinkedOpenData
- Schema.org, Wikidata, JoinUp, TourismData
- Le format RDF Turtle
- en pratique ...
ActivitéModifier
Séance 4 (02/05)Modifier
Analyse de réseauxModifier
- Proximité
- Intermédiarité
- Vecteur propre
- Vecteur propre cas non-orienté
- De vecteur propre à PageRank
Web SémantiqueModifier
- How an IBM Watson Health rescue mission collapsed (sur la valeur des ontologies et vocabulaires pour lier des données divers) :« The team was to be given nine months to turn things around and “improve accuracy,” “standardize terminology,” and “reduce overlap” among the groups working on a dozen different health products. » , « The document, dated April 26, 2017, also describes a troublesome “lack of standardization” among teams working on different projects, noting as an example, that four of Watson’s cancer products each defined a particular type of leukemia in different ways. », « It describes a plan to deploy employees to annotate medical records to develop a standardized dictionary that could be used to train a machine-learning-based system for use across the organization, instead of developing separate algorithms for each product ».
ActivitéModifier
Séance 5 (10/05)Modifier
Analyse de réseauxModifier
Centralités et modèles dynamiques
- Circulation (vecteur propre)
- Transfert (intermédiarité)
- Livraison (proximité)
- Percolation (distance max / médiane)
Un article qui discute cette correspondance entre centralité et dynamique, ainsi que les limites de ces mesures.
Contagion (SIR+) et contagion social (SIRT+)
Modèles génératifs
- Graphes aléatoires et modèle configurationnel
- Modèles à bloc stochastiques (SBM)
WebModifier
- Moteurs de recherche
- Les diapos (dans Diapos 3) sur les éléments et fonctionnement d'un moteur de recherche est basé sur cette présentation
ActivitéModifier
Séance 6 (17/05)Modifier
Analyse de réseauxModifier
- Modèle d'attachement préférentiel
- Réseaux et classification
- Classification, communautés, clusters, hiérarchies
- Motifs et assortativité
Pour plus d'infos sur ces topiques et bien d'autres, naviguez depuis la boîte d'index à droite dans la page Network Science chez Wikipédia.
WebModifier
Systèmes de recommandation
- Similarité et filtrage collaboratif
- Scores spécialisés et généralistes