Détection de Vulnérabilités avec VulTrial

Source: https://arxiv.org/html/2505.10961v1

Ce document présente VulTrial, un nouveau cadre d’agents multiples alimenté par des grands modèles de langage (LLM) pour la détection automatisée des vulnérabilités du code source, inspiré d’un scénario de salle d’audience. Il utilise quatre agents spécialisés : un chercheur en sécurité, un auteur de code, un modérateur et un comité d’examen. Les expériences montrent que VulTrial surpasse les modèles de référence à agent unique et à agents multiples, avec des améliorations de performance significatives utilisant GPT-3.5 et GPT-4o. Le réglage des instructions de l’agent modérateur a été particulièrement efficace, et les résultats indiquent que chaque agent est crucial pour la performance globale. Bien que les systèmes multi-agents augmentent les coûts, l’utilisation de VulTrial avec GPT-3.5 peut offrir une performance supérieure à moindre coût par rapport à un agent unique avec GPT-4o.

Détection de Vulnérabilités avec VulTrial

Episode description

Audio File

Persons