TL;DR: 학습 없이, 보조 모델 없이, 내부 상태 접근 없이. 미리 계산한 토큰 점수를 매 디노이징 step의 logit에 더해, Diffusion 언어 모델(DLM)의 출력 스타일을 직접 조종한다.
📄 Paper: https://arxiv.org/pdf/2605.29626 💻 Code: https://github.com/hsannn/swai
언어 모델을 실제로 배포할 때는 내용이 맞는 것만으로 부족하다. 독자 수준에 맞춘 글의 난이도, 사용자를 대하는 상황의 공손한 어투, 안전이 중요한 곳에서의 유해 표현 회피처럼 "무엇을 말하는가"가 아니라 *"어떻게 말하는가"*를 제어해야 한다. 이런 controllable generation은 이제 부가 기능이 아니라 핵심 역량이다.
그중 inference-time steering은 매력적이다. 베이스 모델을 재학습하지 않고 사후에 붙일 수 있고, 여러 속성에 재사용 가능하며, 파인튜닝보다 비용이 훨씬 낮다. 문제는 기존 기법 대부분이 autoregressive(AR) 모델을 전제한다는 점이다. 좌→우 next-token 디코딩을 가정하거나 보조 모델에 의존하는데, 이런 가정은 부분 마스킹된 시퀀스를 반복 디노이징하며 문장을 드러내는 Diffusion 언어 모델(DLM)에는 자연스럽게 옮겨오지 못한다.

DLM-SWAI는 위 세 조건을 모두 만족하는, 디자인 공간의 빈 자리를 채운다.
DLM-SWAI(*Statistical Writing style Aligned Inference for Diffusion Language Models)*는 두 단계로 구성된다. (1) 오프라인에서 통계적 토큰 점수표를 구축하고, (2) 디코딩 중 매 디노이징 step의 logit에 그 점수를 더해 출력을 목표 특성 쪽으로 이동시킨다. 모델 파라미터와 내부 표현은 일절 건드리지 않는다.

각 토큰이 목표 특성을 얼마나 특징짓는지를 하나의 점수로 정량화한다.
각 디노이징 step에서 다음을 수행한다.