Fiche de révision : Introduction aux variables en aménagement urbain

📋 Plan du Cours

  1. Importance des variables en aménagement urbain
  2. Présentation des données et choix de représentation
  3. Régression linéaire simple : modèle et MCO
  4. Coefficient de détermination et tests en régression
  5. Régression linéaire multiple : estimateurs et ajustement
  6. Diagnostics du modèle et tests de significativité
  7. Modèles de gradient de densité urbaine
  8. Modèle hédonique du prix foncier
  9. Accessibilité urbaine et indice de Hansen
  10. Statistiques spatiales : Moran et Clark-Evans
  11. Variogramme : erreurs, palier et portée
  12. Séries chronologiques en géographie urbaine

📖 1. Importance des variables en aménagement urbain

🔑 Notions clés & Définitions

  • Variable statistique : Une variable statistique est une caractéristique mesurable sur les unités étudiées, qui prend des valeurs différentes selon les observations.
  • Variable qualitative : Une variable qualitative décrit une catégorie ou un attribut, sans ordre numérique naturel entre les modalités.
  • Variable quantitative : Une variable quantitative correspond à une grandeur numérique, mesurée ou comptée, pouvant être traitée par des calculs statistiques.
  • Tableau de fréquences : Un tableau de fréquences regroupe les modalités ou classes d’une variable et indique leurs effectifs ou proportions.
  • Histogramme : Un histogramme représente la distribution d’une variable quantitative en regroupant les valeurs en classes et en affichant leurs effectifs.

📝 Points essentiels

  • En aménagement urbain, les variables servent à décrire et comparer des phénomènes (population, usage des sols, accessibilité, nuisances) à partir de données observées.
  • Les variables qualitatives permettent de classer des situations (types de quartiers, catégories d’équipements) pour cartographier et segmenter l’espace urbain.
  • Les variables quantitatives permettent de mesurer des niveaux et d’évaluer des écarts (densités, distances, volumes, temps), utiles pour quantifier les besoins.
  • Un tableau de fréquences synthétise rapidement la structure d’une variable en montrant la répartition des modalités ou des classes.
  • Un histogramme est adapté aux variables quantitatives car il visualise la forme de la distribution via des classes et des hauteurs d’effectifs.
  • Les représentations statistiques (tableaux, diagrammes, histogrammes, boîtes à moustaches, cartes choroplèthes) facilitent l’interprétation et la décision en planification urbaine.

💡 Astuce mémo

Qualitatif = catégories; Quantitatif = nombres; Fréquences = “combien”, Histogramme = “forme”.

📖 2. Présentation des données et choix de représentation

🔑 Notions clés & Définitions

  • Données géospatiales : Données décrivant des phénomènes avec une composante spatiale, souvent issues de capteurs, de cartes ou de télédétection.
  • Représentation graphique : Mode visuel qui transforme des données en formes (courbes, nuages de points, histogrammes) pour faciliter l’interprétation.
  • Représentation cartographique : Représentation des données sur une carte afin de mettre en évidence des structures spatiales et des contrastes géographiques.
  • Série chronologique : Suite ordonnée d’observations mesurées au cours du temps, utilisée pour analyser l’évolution d’un phénomène.
  • Autocorrélation spatiale : Dépendance entre valeurs observées en des lieux proches, utile pour détecter des régularités spatiales.

📝 Points essentiels

  • La statistique sert à quantifier l’incertitude inhérente aux phénomènes naturels et à exprimer des risques sous forme de probabilités.
  • Les données géospatiales et environnementales sont volumineuses, et la statistique permet de les synthétiser et d’en extraire des informations.
  • Le choix de représentation doit soutenir la décision territoriale en rendant lisibles les indicateurs pertinents pour planifier, gérer ou anticiper.
  • Pour communiquer scientifiquement, on privilégie des représentations graphiques et cartographiques adaptées au type de variable (valeurs, évolution, localisation).
  • Les séries chronologiques se lisent via des représentations temporelles pour repérer tendance, saisonnalité, cyclicité et bruit.
  • L’autocorrélation spatiale se met en évidence par des analyses spatiales, utiles quand les observations ne sont pas indépendantes entre lieux.

💡 Astuce mémo

Données → (graphique pour la forme) / (carte pour l’espace) / (temps pour la série) / (voisins pour l’autocorrélation).

📖 3. Régression linéaire simple : modèle et MCO

🔑 Notions clés & Définitions

  • Régression linéaire simple : Modèle statistique reliant une variable réponse à une seule variable explicative par une relation linéaire.
  • Variable réponse : Variable statistique que l’on cherche à expliquer ou à prédire à partir d’une ou plusieurs variables explicatives.
  • Variable explicative : Variable statistique utilisée pour expliquer la variation de la variable réponse dans un modèle de régression.
  • MCO : Méthode des moindres carrés ordinaires qui ajuste le modèle en minimisant la somme des carrés des écarts entre valeurs observées et prédites.

📝 Points essentiels

  • Le modèle de régression linéaire simple exprime la variable réponse comme une fonction linéaire de la variable explicative plus une composante d’erreur.
  • La logique MCO consiste à choisir les paramètres du modèle pour minimiser les écarts au carré entre observations et valeurs estimées.
  • Les écarts entre valeurs observées et prédites sont interprétés comme des erreurs, dont la structure influence la qualité de l’ajustement.
  • La présence d’une seule variable explicative implique que l’interprétation de la pente correspond à l’effet marginal de cette variable sur la réponse.
  • La comparaison des variables qualitatives et quantitatives conditionne l’usage de la régression : la régression linéaire s’appuie sur des variables numériques.

💡 Astuce mémo

MCO = « carrés des erreurs » : on choisit la droite qui rend la somme des carrés la plus petite.

📖 4. Coefficient de détermination et tests en régression

🔑 Notions clés & Définitions

  • Régression linéaire : Modèle statistique qui relie une variable quantitative à une ou plusieurs autres variables via une relation linéaire.
  • Coefficient de détermination : Mesure de la part de la variabilité expliquée par le modèle de régression par rapport à la variabilité totale.
  • Résidus : Écarts entre les valeurs observées et celles prédites par le modèle, utilisés pour diagnostiquer l’ajustement.
  • Test de significativité : Procédure statistique qui évalue si l’effet estimé (ou la relation) est compatible avec le hasard.

📖 5. Régression linéaire multiple : estimateurs et ajustement

🔑 Notions clés & Définitions

  • Moyenne arithmétique : La moyenne arithmétique est la somme des observations divisée par leur nombre, utilisée pour résumer une série quantitative.
  • Médiane : La médiane est la valeur qui partage une série ordonnée en deux groupes de même effectif.
  • Mode : Le mode est la valeur (ou la classe) la plus fréquente dans un ensemble de données.
  • Variance : La variance mesure la dispersion moyenne des observations autour de la moyenne.
  • Z-score : Le Z-score indique combien d’écarts-types sépare une valeur de la moyenne, après standardisation.

📝 Points essentiels

  • Moyenne arithmétique : xˉ=1ni=1nxi\bar{x}=\frac{1}{n}\sum_{i=1}^{n}x_i et pour données groupées xˉ=i=1kfimii=1kfi\bar{x}=\frac{\sum_{i=1}^{k} f_i m_i}{\sum_{i=1}^{k} f_i}.
  • Médiane si nn impair : Me=xn+12Me=x_{\frac{n+1}{2}} ; si nn pair : Me=xn2+xn2+12Me=\frac{x_{\frac{n}{2}}+x_{\frac{n}{2}+1}}{2}.
  • Le mode correspond à la valeur ou à la classe la plus fréquente et s’applique aux variables qualitatives comme quantitatives.
  • Étendue : E=xmaxxminE=x_{\max}-x_{\min}, et une étendue élevée traduit une forte variabilité entre unités spatiales.
  • Variance et écart-type : s2=1n1i=1n(xixˉ)2s^2=\frac{1}{n-1}\sum_{i=1}^{n}(x_i-\bar{x})^2 et s=s2s=\sqrt{s^2}.
  • Coefficient de variation : CV=sxˉ×100CV=\frac{s}{\bar{x}}\times 100 avec seuils CV<15%CV<15\%, 15%<CV<30%15\%<CV<30\%, et CV>30%CV>30\%.

💡 Astuce mémo

Médiane = milieu (partage en 2), Mode = le plus fréquent, Z-score = “écarts-types autour de la moyenne”.

📖 6. Diagnostics du modèle et tests de significativité

🔑 Notions clés & Définitions

  • Z-score : Le Z-score est une mesure standardisée qui exprime l’écart d’une observation à la moyenne en nombre d’écarts-types.
  • Valeur atypique : Une valeur atypique est une observation nettement éloignée du reste des données, révélée par des Z-scores très grands en valeur absolue.
  • Z-score médian : Le Z-score médian est une version robuste du Z-score basée sur la médiane et l’écart absolu médian (MAD) pour limiter l’effet des extrêmes.
  • MAD : Le MAD est l’écart absolu médian, utilisé pour standardiser des valeurs via le Z-score médian quand la dispersion est perturbée par des valeurs aberrantes.

📝 Points essentiels

  • Le Z-score se calcule comme (xi − x̄)/s, où x̄ est la moyenne et s l’écart-type estimé sur l’échantillon.
  • Dans l’exemple mobilité, le quartier 7 a un Z-score d’environ +2,46, soit plus de 2,4 écarts-types au-dessus de la moyenne.
  • Un Z-score proche de 0 indique que l’observation est près de la moyenne, tandis qu’un Z-score très éloigné signale une valeur atypique.
  • Le Z-score est particulièrement pertinent quand la distribution est normale ou proche de la normale.
  • Des valeurs aberrantes très extrêmes peuvent gonfler l’écart-type et rendre le Z-score moins sensible pour détecter d’autres anomalies.
  • En cas de forte asymétrie ou de sensibilité aux extrêmes, on peut préférer le Z-score médian : Zmad = (xi − Mdiane)/MAD.

💡 Astuce mémo

Z-score = écart à la moyenne en écarts-types ; Zmad = écart à la médiane en MAD (plus robuste aux extrêmes).

📖 7. Modèles de gradient de densité urbaine

🔑 Notions clés & Définitions

  • Population statistique : La population statistique est l’ensemble des unités concernées par l’étude urbaine.
  • Échantillon : L’échantillon est un sous-ensemble de la population choisi pour mener l’enquête statistique.
  • Unité statistique : L’unité statistique est l’élément de base observé ou mesuré dans l’étude.
  • Variable statistique : La variable statistique est la caractéristique mesurée sur chaque unité statistique.

📝 Points essentiels

  • On ne peut pas toujours observer toute la population urbaine à cause du coût, du temps, de la taille et des difficultés d’accès.
  • L’échantillonnage vise des résultats fiables tout en réduisant coûts et durée d’observation.
  • Le processus d’échantillonnage suit cinq étapes : définir la population, choisir les unités, fixer la taille, choisir la méthode, collecter les données.
  • Les méthodes d’échantillonnage se classent en probabilistes et non probabilistes, les probabilistes étant les plus utilisées en statistique urbaine.
  • En échantillonnage aléatoire simple, chaque unité a la même probabilité de sélection Pi=1NP_i=\frac{1}{N}, ce qui limite les biais mais exige une liste complète.
  • En échantillonnage stratifié, on prélève dans chaque strate homogène pour améliorer la précision et garantir la représentation des sous-groupes.

📖 8. Modèle hédonique du prix foncier

🔑 Notions clés & Définitions

  • Prix foncier : Le prix foncier est la valeur monétaire observée pour un bien immobilier, utilisée comme variable à expliquer dans l’analyse.
  • Modèle hédonique : Le modèle hédonique relie le prix d’un bien à ses caractéristiques, en décomposant le prix en effets attribuables aux attributs.
  • Caractéristiques du bien : Les caractéristiques du bien sont les variables décrivant le logement ou le terrain, dont l’effet individuel contribue au prix estimé.
  • Variable dépendante : La variable dépendante est la variable à expliquer par le modèle, notée Y dans la régression.
  • Variable explicative : La variable explicative est la variable utilisée pour expliquer Y, notée X dans la régression.

📝 Points essentiels

  • Le modèle hédonique vise à expliquer le prix foncier à partir de caractéristiques observables du bien.
  • La logique d’estimation repose sur une régression où Y est le prix et X regroupe les caractéristiques.
  • En régression linéaire simple, le modèle s’écrit Yi=β0+β1Xi+εiY_i=\beta_0+\beta_1X_i+\varepsilon_i avec un terme d’erreur εi\varepsilon_i.
  • En régression multiple, le modèle s’écrit Yi=β0+β1Xi1++βkXik+εiY_i=\beta_0+\beta_1X_{i1}+\cdots+\beta_kX_{ik}+\varepsilon_i pour plusieurs caractéristiques.
  • La droite de régression en simple passe toujours par le point (xˉ,yˉ)(\bar x,\bar y).
  • Le coefficient de détermination R2=SCESCT=1SCRSCTR^2=\dfrac{SCE}{SCT}=1-\dfrac{SCR}{SCT} mesure la part de la variance de Y expliquée par le modèle, et en simple R2=r2R^2=r^2.

💡 Astuce mémo

Prix = somme d’effets des caractéristiques (comme une régression : Y dépend de X).

📖 9. Accessibilité urbaine et indice de Hansen

🔑 Notions clés & Définitions

  • Indice d’accessibilité de Hansen : L’indice d’accessibilité de Hansen agrège les opportunités disponibles autour d’un lieu en tenant compte du frein de la distance.
  • Masse d’opportunité : La masse d’opportunité OjO_j mesure le poids (taille/importance) de l’opportunité située en jj.
  • Fonction d’impédance : La fonction d’impédance f(dij)f(d_{ij}) décrit comment l’accessibilité décroît avec la distance dijd_{ij}.
  • Décroissance exponentielle : La décroissance exponentielle est une forme d’impédance où l’effet de la distance suit f(d)=eβdf(d)=e^{-\beta d}.
  • Décroissance en puissance : La décroissance en puissance est une forme d’impédance où l’effet de la distance suit f(d)=dγf(d)=d^{-\gamma}.

📝 Points essentiels

  • L’indice de Hansen s’écrit Ai=j=1nOjf(dij)A_i=\sum_{j=1}^{n} O_j\,f(d_{ij}) et additionne les opportunités pondérées par la distance.
  • OjO_j représente la masse de l’opportunité au lieu jj, tandis que dijd_{ij} est la distance entre ii et jj.
  • Une impédance exponentielle utilise f(d)=eβdf(d)=e^{-\beta d} pour une décroissance rapide avec la distance.
  • Une impédance en puissance inverse utilise f(d)=dγf(d)=d^{-\gamma} pour une décroissance de type loi de puissance.
  • Une impédance gaussienne utilise f(d)=ed2/(2σ2)f(d)=e^{-d^2/(2\sigma^2)} pour une décroissance contrôlée par σ\sigma.
  • Le choix de f(d)f(d) change la façon dont les distances lointaines contribuent à l’accessibilité.

💡 Astuce mémo

Hansen = Somme des Opportunités freinées par la Distance : Ai=Oj×f(dij)A_i=\sum O_j\times f(d_{ij}) (impédance = exponentielle, puissance, gaussienne).

📖 10. Statistiques spatiales : Moran et Clark-Evans

🔑 Notions clés & Définitions

  • Indice de Clark-Evans : Indice de Clark-Evans : mesure la proximité moyenne observée des points par rapport à une proximité attendue sous un modèle aléatoire, via un ratio R.
  • Autocorrélation spatiale : Autocorrélation spatiale : mesure si des valeurs proches dans l’espace ont tendance à se regrouper (ou au contraire à se disperser) plutôt que d’être aléatoires.
  • Indice de Moran : Indice de Moran : statistique la plus utilisée pour quantifier l’autocorrélation spatiale à partir des écarts à la moyenne et d’une matrice de voisinage.
  • Centre moyen : Centre moyen : point de coordonnées obtenues en faisant la moyenne des abscisses et des ordonnées des points d’une distribution.
  • Centre médian : Centre médian : point qui minimise la somme des distances absolues aux points, donc plus robuste aux valeurs extrêmes.

📝 Points essentiels

  • Clark-Evans R compare la distance moyenne observée à la distance moyenne attendue sous aléa, avec dˉexp=12ρ\bar d_{exp}=\frac{1}{2\sqrt{\rho}} et ρ=nA\rho=\frac{n}{A}.
  • Pour Clark-Evans, R>1R>1 indique une proximité plus forte que l’aléatoire (tendance au regroupement), tandis que R<1R<1 indique une proximité plus faible (tendance à la dispersion).
  • L’indice de Moran s’interprète avec le signe : I>0I>0 pour regroupement spatial, I<0I<0 pour dispersion, et I0I\approx 0 pour une structure proche de l’aléatoire.
  • L’indice de Moran utilise une matrice de voisinage wijw_{ij} pour pondérer les paires de points et calcule des produits d’écarts (xixˉ)(xjxˉ)(x_i-\bar x)(x_j-\bar x).
  • Le centre moyen se calcule par xˉ=1ni=1nxi\bar x=\frac{1}{n}\sum_{i=1}^n x_i et yˉ=1ni=1nyi\bar y=\frac{1}{n}\sum_{i=1}^n y_i.
  • Le centre médian minimise i=1nppi\sum_{i=1}^n |p-p_i|, ce qui le relie directement à la minimisation des distances absolues.

💡 Astuce mémo

Clark-Evans : R = observé / attendu (aléa) ; Moran : I = signe du regroupement (positif) vs dispersion (négatif).

📖 11. Variogramme : erreurs, palier et portée

🔑 Notions clés & Définitions

  • Autocorrélation spatiale : Notion décrivant si des valeurs proches dans l’espace ont tendance à se ressembler ou à s’opposer.
  • Indice de Moran : Statistique mesurant l’autocorrélation spatiale en comparant les valeurs observées à une structure de voisinage via une matrice de poids.
  • Variogramme : Outil de géostatistique reliant la dissimilarité entre valeurs à la distance, pour analyser la dépendance spatiale.
  • Palier du variogramme : Niveau de stabilisation du variogramme quand la distance augmente, indiquant une dépendance qui devient négligeable.
  • Portée du variogramme : Distance au-delà de laquelle la dépendance spatiale décroît fortement et le variogramme tend vers son palier.

📝 Points essentiels

  • Autocorrélation positive : Moran I > 0 indique un regroupement spatial des valeurs similaires.
  • Autocorrélation négative : Moran I < 0 indique une dispersion spatiale (valeurs proches de signes opposés).
  • Absence de structure : Moran I ≈ 0 correspond à une distribution spatiale proche du hasard.
  • Interprétation pratique : un Moran I = 0,65 traduit une autocorrélation spatiale positive forte (clustering).
  • Mécanisme variogramme : le variogramme augmente avec la distance tant que la dépendance spatiale existe, puis se stabilise au palier.
  • Portée : la portée correspond à la distance à partir de laquelle le variogramme atteint (ou approche) le palier, signalant la fin de la dépendance.

💡 Astuce mémo

Moran I : signe = sens ( + clustering, − dispersion ) ; variogramme : distance = dépendance (jusqu’à la portée), puis palier = plus de dépendance.

📖 12. Séries chronologiques en géographie urbaine

🔑 Notions clés & Définitions

  • Corrélation de Pearson : La corrélation de Pearson mesure l’intensité et le sens de la relation linéaire entre deux variables quantitatives.
  • Droite de régression : La droite de régression relie une variable expliquée à une variable explicative via un modèle linéaire ajusté aux données.
  • Régression multiple : La régression multiple estime une variable cible à partir de plusieurs variables explicatives simultanément.
  • Indice de Moran : L’indice de Moran quantifie l’autocorrélation spatiale d’une variable entre zones voisines.
  • Variogramme expérimental : Le variogramme expérimental décrit comment la semi-variance change avec la distance entre observations.

📝 Points essentiels

  • Pour la régression simple, on calcule a=(xixˉ)(yiyˉ)(xixˉ)2a=\frac{\sum (x_i-\bar x)(y_i-\bar y)}{\sum (x_i-\bar x)^2} et b=yˉaxˉb=\bar y-a\bar x pour obtenir y^=ax+b\hat y=ax+b.
  • Dans l’exercice 8, on obtient a=8a=8, b=205b=205 et y^=8x+205\hat y=8x+205 à partir des sommes (xixˉ)(yiyˉ)=4000\sum (x_i-\bar x)(y_i-\bar y)=4000 et (xixˉ)2=500\sum (x_i-\bar x)^2=500.
  • Dans l’exercice 8, le coefficient de corrélation vaut r0,992r\approx 0{,}992, ce qui correspond à une très forte corrélation positive.
  • En régression multiple, le modèle de l’exercice 9 est eˊnergie=120+0,5×surface0,8×anneˊe+2×occupants\text{énergie}=120+0{,}5\times\text{surface}-0{,}8\times\text{année}+2\times\text{occupants}, donc l’année influence l’énergie via le terme $-0{,}8\times\text{année
  • Dans l’exercice 9, si l’année est codée directement (ex. 1990), le calcul donne une valeur incohérente (énergie négative), ce qui signale un problème de codage de la variable année.
  • Dans l’exercice 9, avec un codage “année - 2000” (1990 → −10), on obtient eˊnergie=120+50+8+8=186\text{énergie}=120+50+8+8=186 kWh/mois pour surface 100 et 4 occupants.

💡 Astuce mémo

Pearson→Pearson = “plus c’est proche de 1, plus la droite colle”; Moran→Moran = “voisins qui se ressemblent (ou s’opposent)”; Variogramme→Variogramme = “distance → différence moyenne au carré”.

📊 Tableaux de synthèse

Types de variables et caractéristiques

CatégorieSous-typeCaractéristiques clésExemples urbains
QualitativeNominaleCatégories sans ordre hiérarchiqueUsage du sol, type d’habitat
QualitativeOrdinaleCatégories classées, écarts non mesurablesNiveau d’équipement, état du logement
QuantitativeDiscrèteValeurs entières dénombrables (comptage)Nombre d’habitants, logements
QuantitativeContinueValeurs mesurables continues (infinité dans un intervalle)Superficie, distance, densité

Représentations statistiques : quand les utiliser

ReprésentationType de variableCe que ça montreForme
Tableau de fréquencesQualitative ou quantitative (modalités/classes)Répartition (effectifs, fréquences, pourcentages)Modalités/classes
Diagramme en barresQualitative ou quantitative discrèteComparaison par catégoriesBarres séparées
HistogrammeQuantitative continue (classes)Distribution (concentrations, asymétries)Barres accolées
Diagramme circulaireQualitativeProportions relativesSecteurs proportionnels
Boîte à moustachesQuantitativeDispersion : médiane, quartiles, étendue, extrêmesBoîte + moustaches
Carte choroplètheVariable (souvent quantitative) par zonesIntensité par espaceCouleurs/nuances par unités spatiales

⚠️ Pièges & confusions fréquents

  1. Confondre variable qualitative et quantitative : coder des catégories comme des nombres peut faire croire à un ordre ou permettre des calculs arithmétiques qui ne sont pas justifiés.
  2. Utiliser un histogramme pour une variable qualitative nominale : l’histogramme suppose des classes et une continuité, alors que les modalités nominales n’ont pas de sens numérique.
  3. Interpréter le Z-score sans tenir compte de la distribution : il est surtout pertinent quand la distribution est normale ou proche de la normale.
  4. Se tromper sur la formule du Z-score : oublier que Z=(xi−x̄)/s (avec s l’écart-type) et confondre avec une simple différence à la moyenne.
  5. Lire Clark-Evans à l’envers : R>1 signifie proximité plus forte que l’aléatoire (regroupement/proximité), alors que R<1 indique une proximité plus faible (dispersion).
  6. Interpréter Moran I sans le signe : I>0 correspond à regroupement spatial (valeurs similaires proches), I<0 à dispersion (opposition).
  7. En régression multiple, mal coder l’année : si l’année est codée directement (ex. 1990), le modèle peut produire des valeurs incohérentes (ex. énergie négative), signalant un problème de codage.

✅ Checklist Examen

  1. Distinguer variables qualitatives (nominales/ordinales) et quantitatives (discrètes/continues) et donner les traitements/indicateurs associés.
  2. Choisir la représentation adaptée : tableau de fréquences, diagrammes en barres, histogramme, diagramme circulaire, boîte à moustaches, carte choroplèthe, et justifier selon le type de variable.
  3. Calculer et interpréter les mesures de tendance centrale : moyenne arithmétique, médiane (n impair/pair), mode (valeur ou classe).
  4. Calculer et interpréter les mesures de dispersion : étendue, variance/écart-type, coefficient de variation (avec seuils CV<15%, 15–30%, >30%).
  5. Calculer un Z-score et interpréter : proche de 0, modérément éloigné, très éloigné, et citer la limite liée aux valeurs aberrantes (préférence pour Zmad).
  6. Maîtriser le processus d’échantillonnage en 5 étapes et comparer les méthodes : aléatoire simple, stratifié, systématique (pas k), en grappes.
  7. Écrire le modèle de régression linéaire simple et appliquer MCO : minimiser la somme des carrés des résidus, obtenir la pente et l’ordonnée, et rappeler que la droite passe par (x̄,ȳ).
  8. Calculer/interpréter le coefficient de détermination R² en régression simple (R²=r²) et relier R² à la part de variance expliquée.
  9. En régression multiple, écrire le modèle (notation matricielle possible), utiliser R² ajusté, et rappeler les tests : Fisher global et Student individuels.
  10. Connaître les diagnostics et hypothèses du modèle : linéarité, homoscédasticité, normalité des résidus, indépendance, non-multicolinéarité (VIF).
  11. Appliquer les modèles d’aménagement : gradient de densité (Clark), modèle hédonique (prix ~ caractéristiques), indice d’accessibilité de Hansen (impédance), et interpréter les paramètres de décroissance.
  12. Calculer/interpréter les statistiques spatiales : Clark-Evans (R avec d̄exp), Moran I (signe), et lire variogramme (effet de pépite, palier, portée).
  13. Traiter les séries chronologiques : définir une série, identifier tendance/saisonnalité/cyclicité/bruit, choisir additif vs multiplicatif, et faire un lissage par moyenne mobile.
  14. Utiliser les paramètres géométriques : centre moyen et centre médian (minimise somme des distances absolues).

Testez vos connaissances

Testez vos connaissances sur Introduction aux variables en aménagement urbain avec 24 questions à choix multiples avec corrections détaillées.

1. Quelle distinction décrit le mieux une variable qualitative en aménagement urbain ?

2. Quel outil est le plus adapté pour visualiser la distribution d’une variable quantitative en classes ?

Faire le QCM →

Révisez avec les flashcards

Mémorisez les concepts clés de Introduction aux variables en aménagement urbain avec 24 flashcards interactives.

Variables en aménagement urbain — rôle ?

Décrire, comparer phénomènes urbains.

Données géospatiales — représentation ?

Graphiques, cartes, séries temporelles.

Régression linéaire simple — modèle ?

Y = aX + b + erreur.

Voir les flashcards →

Cours similaires

Crée tes propres fiches de révision

Importe ton cours et l'IA génère fiches, QCM et flashcards en 30 secondes.

Générateur de fiches