L’évaluation de la qualité subjective de l’espace urbain est traditionnellement réalisée au moyen d’audits sur site et d’entretiens avec les piétons. Des travaux récents ont tiré parti de la grande disponibilité des images Street View pour développer des techniques automatiques permettant de prédire la façon dont les piétons perçoivent l’espace urbain à partir d’images. Cette thèse examine comment les modèles et les plateformes de collecte de données actuels peuvent être améliorés pour produire des résultats plus proches de l’expérience du piéton. Pour ce faire, nous introduisons l’utilisation d’images à 360°, qui n’ont jamais été utilisées dans ce contexte auparavant. Ces images offrent une expérience plus immersive aux participants tout en restant sur un écran d’ordinateur, ce qui permet d’obtenir des résultats plus précis et plus fiables. Nous montrons d’abord l’importance du contenu sémantique des images pour prédire la perception d’un lieu. Nous examinons ensuite les modèles actuels et démontrons leurs limites dans le contexte de la perception panoramique. Suite à ce travail, nous évaluons la faisabilité d’utiliser un site web de crowdsourcing pour évaluer les images panoramiques selon des dimensions perceptuelles telles que le sentiment de sécurité. Enfin, nous démontrons l’importance d’avoir des images qui reflètent l’expérience des piétons en comparant la perception des lieux urbains à l’aide d’images capturées depuis une voiture et sur le trottoir. Ce travail souligne l’importance de développer des expériences de collecte de données qui correspondent à l’expérience des piétons afin de fournir des modèles précis et fiables qui peuvent servir d’aide à la décision pour les urbanistes.
Mots-clés : Perception Visuelle Urbaine, Imagerie Street View, Crowdsourcing, Apprentissage Profond, Vision par Ordinateur