Test en ligne pour la détection des fautes intermittentes dans les architectures multiprocesseurs embarquées

par Julien Guilhemsang

Thèse de doctorat en Électronique

Sous la direction de Alain Giulieri.

Soutenue en 2011

à Nice .


  • Résumé

    Aujourd’hui les systèmes embarqués sont partout et requièrent de plus en plus de puissance de calcul. Pour cela, ces dernières années, les progrès d’intégration ont permis de diminuer la taille des transistors, d’augmenter la fréquence de fonctionnement et de diminuer la tension d’alimentation. Tout cela en augmentant progressivement le nombre de processeurs dans une même puce. Mais cette évolution a un impact négatif sur la fiabilité. D’une part, les systèmes deviennent de plus en plus sensibles à leur environnement, ce qui conduit à un taux plus important des fautes transitoires. D’autre part, les variations de procédés de fabrication dans les technologies actuelles, induisent de plus en plus de variations à l’intérieur même des composants. E phénomène, combiné à la hausse des tensions d’alimentation et la température, augmente progressivement la probabilité d’occurrence des fautes intermittentes voire permanentes. De plus, le vieillissement des composants semble s’accélérer avec la diminution du facteur d’échelle et la diminution non uniforme des tensions d’alimentation, causant l’apparition prématurée des fautes intermittentes voire permanentes. Si les fautes transitoires et permanentes sont étudiées depuis plusieurs années, ce n’est pas le cas des fautes intermittentes. Or, pour tenter de se prémunir de ces fautes, il est important de comprendre leur comportement, ainsi que leur impact sur le système et les applications. Pour cela, nous avons défini une plateforme expérimentale capable d’observer des erreurs intermittentes. Pour cela, des processeurs en technologie 65nm sont soumis, d’une part à une température supérieure à 160° C et d’autre part à l’exécution d’un ensemble d’applications. Nous avons ainsi, pu confirmer que les erreurs intermittentes peuvent être observées avant l’apparition d’erreurs permanentes. Nos résultats confirment la présence de défauts intermittents très tôt avant la période d’usur du circuit. De plus, nous montrons que les circuits intégrés soumis à la plus forte activité présentent le plus grand nombre d’erreurs intermittentes. Cette étude confirme qu’il est possible d’observer des erreurs intermittentes et donc qu’il est possible de les détecter en ligne. Cependant, aucun solution de détection en ligne des erreurs proposées dans la littérature ne convient à la fois aux erreurs intermittentes et aux architectures multiprocesseur. Ainsi, nous avons développé une méthode de test périodique pour répondre à ces contraintes. En particulier, nous avons montré que le test ne doit pas nécessairement être prioritaire devant les applications. Cela nous a permis de conclure qu’une politique d’ordonnancement des tests pseudo-périodiques, prenant en compte les processeurs au repos et la priorité des tâches, offrent le meilleur compromis entre performance et probabilité de détection.

  • Titre traduit

    Online test for the detection of intermittent faults in embedded multiprocessor architectures


  • Pas de résumé disponible.


  • Résumé

    Nowadays embedded systems are everywhere and require always more computing power. But the evolution of technologies has a negative impact on reliability. In particular, it is expected an increase in the number of intermittent faults in future technologies. However, we do not have the benefit of detailed experimental study for this type of fault. But, to try to prevent these errors, it is important to understand their behavior and their impact on the system and applications. For this, we define an experimental platform able to observe intermittent errors. We confirm that intermittent errors can be observed very early before the wear-out period of the circuit. Moreover, these errors appear in bursts until the processor does not stop. Therefore, we confirm that it necessary to develop online methods for the detection of intermittent errors in deep submicron integrated circuits. However, no proposed solution in the literature is appropriate for both intermittent errors and multiprocessor architectures. Thus, we developed a method for periodic testing to meet these constraints. In particular, we show that the test should not necessarily have priority to applications. This allowed us to conclude that a scheduling policy of pseudo-periodic tests, taking into account the idle processors and prioritizes tasks, provide the best compromise between performance and detection probability.

Consulter en bibliothèque

La version de soutenance existe sous forme papier

Informations

  • Détails : 1 vol. (xv-135 p.)
  • Annexes : Bibliogr. p. 129-135. Résumé en français

Où se trouve cette thèse ?

  • Bibliothèque : Université Nice Sophia Antipolis. Service commun de la documentation. Section Sciences.
  • Non disponible pour le PEB
  • Cote : 11NICE4026
Voir dans le Sudoc, catalogue collectif des bibliothèques de l'enseignement supérieur et de la recherche.