Precise and Eﬃcient Memory Analysis of Low-level Languages

Julien Simonnet

Le moteur de recherche
des thèses françaises

Désactiver l'aide à la saisie

Analyse mémoire précise et efficace pour les languages de bas niveau

FR |

EN

Auteur / Autrice :	Julien Simonnet
Direction :	Mihaela Sighireanu, Matthieu Lemerre
Type :	Thèse de doctorat
Discipline(s) :	Informatique
Date :	Soutenance le 17/12/2025
Etablissement(s) :	université Paris-Saclay
Ecole(s) doctorale(s) :	École doctorale Sciences et technologies de l'information et de la communication (Orsay, Essonne ; 2015-....)
Partenaire(s) de recherche :	Laboratoire : Laboratoire Méthodes formelles (Gif-sur-Yvette, Essonne ; 2021-....)
	Référent : École normale supérieure Paris-Saclay (Gif-sur-Yvette, Essonne ; 1912-....)
	graduate school : Université Paris-Saclay. Graduate School Informatique et sciences du numérique (2020-....)
Jury :	Président / Présidente : Xavier Rival
	Examinateurs / Examinatrices : Xavier Rival, Thomas Jensen, Antoine Miné, Isabella Mastroeni, Tomáš Vojnar
	Rapporteurs / Rapporteuses : Thomas Jensen, Antoine Miné

Mots clés

FR |

EN

Mots clés contrôlés

Systèmes informatiques -- Mesures de sûreté

Logiciels -- Vérification

Mots clés libres

Analyse statique

Analyse mémoire

Interprétation abstraite

Vérification de types

Résumé

FR |

EN

La sécurité mémoire est essentielle pour les codes critiques tels que les logiciels embarqués et les systèmes d'exploitation. Les erreurs mémoire telles que les débordements de tampon (buffer overflows), la déréférencement de pointeurs nuls et les erreurs d'utilisation de mémoire après libération (use-after-free) sont parmis les principales causes de vulnérabilités en cybersécurité. Les analyses statiques de code bas niveau visent à détecter de telles erreurs sans exécuter les programmes. Cette thèse définit une méthode d'analyse statique solide, automatique, pratique et efficace pour prouver la sécurité spatiale de la mémoire des codes binaires ou des programmes C de bas niveau. Cette analyse repose sur un nouveau système de types dépendants appelé TypedC, qui étend le système de types du langage C et est capable de capturer des propriétés complexes concernant la disposition et le contenu de la mémoire. Ces propriétés incluent celles de idiomes de programmation de bas niveau tels que le bit-stealing, les pointeurs intérieurs ou les tableaux flexibles (flexible array members). L'analyse utilise l'interprétation abstraite pour effectuer automatiquement la vérification de types, prouvant ainsi la sécurité spatiale des accès à la mémoire comme conséquence du typage correct. L'analyse est inter-procédurale, c'est-à-dire qu'elle exploite des résumés de fonctions au lieu d'analyser chaque fonction individuellement. L'analyse ne nécessite pas la modification du code source - ce qui serait impossible pour le code binaire - mais exploite à la place une spécification des types fournie par l'utilisateur et décrivant les prototypes de fonctions.Un autre apport de cette thèse est un cadre général appelé abstract abstract data types (AADT) permettant de construire des analyses précises et polyvalentes pour traiter des structures de données complexes obtenues en combinant des types de pointeurs, d'unions, de structures et de tableaux. Dans ce cadre, un domaine abstrait pour un type de données fixé est construit de manière compositionnelle par dessus un domaine abstrait relationnel de valeurs, et à partir des domaines abstraits correspondant à chacun des composants du type de données. Pour cela, un AADT raffine une interface générique, que nous formalisons dans cette thèse, et il fournit un équivalent abstrait des opérations du type de données. Nous définissons formellement plusieurs domaines abstraits comme AADT, par exemple des AADT de tableaux, des AADT de tuples, des AADT de types de données variants, et des AADT de blocs mémoire.Nous avons implémenté l'analyse basée sur le système de types dépendants proposé et sur le cadre des AADT dans Codex, une plateforme d'analyse de code binaire et C basée sur l'interprétation abstraite. L'analyse a été appliquée à une base de tests complexes comprenant des extraits de systèmes d'exploitation, du code binaire d'Emacs et de bibliothèques de structure de données. Les résultats expérimentaux obtenus démontrent que l'approche proposée dans cette thèse est efficace pour prouver la sécurité spatiale de la mémoire dans du code de bas niveau.

Le moteur de recherche
des thèses françaises

Les thèses

Les personnes
liées aux thèses

Analyse mémoire précise et efficace pour les languages de bas niveau

Mots clés

Mots clés contrôlés

Mots clés libres

Résumé

Le moteur de recherche des thèses françaises

Les thèses

Les personnes liées aux thèses

Recherche Avancée

Analyse mémoire précise et efficace pour les languages de bas niveau

Mots clés

Mots clés contrôlés

Mots clés libres

Résumé

Le moteur de recherche
des thèses françaises

Les personnes
liées aux thèses