Modélisation des Réseaux (M1 SIREN, 2020)
Université Paris Dauphine - PSL, M1 SIREN 2019-2020
Enseignant: Ale Abdo
Orientations:
Introduction (14/04) modifier
Réseaux modifier
Relations, mesures, épiphénomènes.
Réseaux et espaces, distance, dimension, projection.
Théorie des graphes, réseaux aléatoires, réseaux complexes.
Bases de données et réseaux, données éparses.
Réseaux et Web modifier
Navigation (HTML, hyperliens).
Traces. Données.
Promenades. Flux. Diffusion.
Recherche. Recommandation.
Sémantique (RDF, ontologies).
Techniques d'analyse et modélisation modifier
Statistique descriptive. Mesures nœud-centriques et globales.
Processus dynamiques. Simulations.
Modèles génératifs. Modèles prédictifs.
Contraintes formelles et modèles nuls.
Activité modifier
Séance 1 (21/04) modifier
Fondamentaux de l'analyse de réseaux modifier
- Les éléments des graphes
- Variantes de graphes
- Cas notables
- Voisins et degrés
- Chemin et distance
Activité modifier
Séance 2 (05/05) modifier
Analyse de réseaux modifier
- Statistiques descriptives
- Distributions et corrélations
- Transitivité
Bases du Web modifier
- HTTP, HTML, ECMAScript et autres standards du Web
- Données et services: centralisation et décentralisation
- RDF et Ontologies, LinkedOpenData
Activité modifier
Séance 3 (12/05) modifier
Analyse de réseaux modifier
- Transitivité et corrélations
- Transitivité et distances : le phénomène du petit monde
- chez Wikipédia, et l'article introduisant la formalisation moderne, mais pas le concept
- Proximité
- Intermédiarité
Web Sémantique modifier
- How an IBM Watson Health rescue mission collapsed (sur la valeur des ontologies et vocabulaires pour lier des données divers) : « The team was to be given nine months to turn things around and “improve accuracy,” “standardize terminology,” and “reduce overlap” among the groups working on a dozen different health products. » , « The document, dated April 26, 2017, also describes a troublesome “lack of standardization” among teams working on different projects, noting as an example, that four of Watson’s cancer products each defined a particular type of leukemia in different ways. », « It describes a plan to deploy employees to annotate medical records to develop a standardized dictionary that could be used to train a machine-learning-based system for use across the organization, instead of developing separate algorithms for each product ».
Activité modifier
Séance 4 (19/05) modifier
Analyse de réseaux modifier
- Vecteur propre
- De vecteur propre à PageRank
Web modifier
- Moteurs de recherche
- Le diapo sur le fonctionnement d'un moteur de recherche est basé sur cette présentation
- Mesures génériques et mesures personnalisés
Activité modifier
Séance 5 (26/05) modifier
Analyse de réseaux modifier
- Systèmes de recommandation
- Similarité et filtrage collaboratif
- Scores spécialisés et généralistes
- Réseaux et classification
- Classification, communautés, clusters, hiérarchies
- Modularité et motifs assortatifs
- Modèles à bloc stochastiques (SBM)
Web modifier
- Révision de concepts