Source: https://arxiv.org/html/2505.14608v1
Cette source examine si les modèles linguistiques optimisés pour tromper les détecteurs peuvent être rendus indiscernables de l’écriture humaine. Les auteurs identifient que les détecteurs basés sur le style sont plus robustes que les détecteurs traditionnels, même après optimisation, en raison de la diversité des styles d’écriture humains. Ils introduisent une nouvelle approche de paraphrase stylistique qui vise à combler l’écart entre l’écriture humaine et machine, réussissant à éviter la détection avec un seul échantillon. Cependant, avec plus d’échantillons, les distributions humaines et machines redeviennent distinctes. Pour quantifier cet écart, ils proposent une nouvelle métrique, AURA, qui estime le chevauchement distributionnel maximal à mesure que le nombre d’échantillons augmente, suggérant que l’on ne devrait pas s’appuyer uniquement sur la détection de texte généré par machine.