Chaîne de Pensée Latérale Diffuse

Chaîne de Pensée Latérale Diffuse

Episode description

Source: https://arxiv.org/html/2505.10446v1

Ces documents introduisent le Diffusion Chain of Lateral Thought (DCoLT), un cadre de raisonnement conçu pour les modèles de langage de diffusion (DLMs). Contrairement aux méthodes traditionnelles de Chain-of-Thought (CoT) qui suivent un processus de pensée linéaire et causal, DCoLT permet un raisonnement bidirectionnel et non linéaire. Ce nouveau cadre optimise l’ensemble du processus de diffusion inverse en le considérant comme une série d’actions de “pensée” et en utilisant l’apprentissage par renforcement basé uniquement sur la correction de la réponse finale. Les expériences sur des tâches de génération de mathématiques et de code montrent que les DLMs renforcés par DCoLT surpassent les modèles existants entraînés par d’autres méthodes.

Audio File

Download