TL;DR

언어 모델이 아무리 발전하더라도 그 성능의 한계는 결국 학습 데이터의 품질에 달려있습니다. 특히, 혐오 표현 탐지처럼 데이터가 모호하거나 주관적인 판단이 요구되는 작업에서는 데이터 품질이 더욱 중요합니다. 이러한 점을 고려하여, 저희는 학습 동역학(Training dynamics)과 데이터셋 내 인간 주석자의 합의 정보를 활용해 데이터를 정제하는 혁신적인 접근법인 CONELA를 개발했습니다.

해당 연구는 그 기여를 인정받아 COLING 2025에 채택되어 발표될 예정입니다.

주석자 의견 차이를 활용한 데이터 품질 향상

주석자 간 합의 수준(Annotator agreement level)은 주어진 데이터샘플에 대해 주석자들이 얼마나 동일한 레이블을 부여했는지를 나타냅니다. 해당 연구에서는 합의 수준을 크게 두 가지로 나누었습니다.

image.png

이러한 합의 수준은 데이터 품질을 평가하고, 모델이 학습 중 혼란을 겪을 가능성을 줄이는 데 중요한 기준으로 작용합니다. 특히, 비합의 데이터를 모델 학습에 그대로 사용하면 잘못된 패턴을 학습할 위험이 있습니다. CONELA는 이를 해결하기 위해 주석자 간 합의 수준과 모델 학습 동역학을 결합한 새로운 데이터 정제 전략을 제안합니다.

학습 동역학이란?

학습 동역학(Training dynamics)는 모델이 특정 데이터를 학습하는 과정에서 보이는 행동을 관찰하고 분석하는 개념입니다. 구체적으로, 모델이 학습 데이터에 대해 정답을 예측하는 확률(Confidence)과 그 확률의 변동성(Variability) 등의 정보를 통해 해당 데이터가 모델 학습에 미치는 영향을 분석합니다. 이를 통해, 해당 데이터가 모델 학습에 얼마나 기여하는지 파악할 수 있습니다.

이러한 정보는 데이터를 쉽게 학습 가능한 데이터와 학습하기 어려운 데이터로 분류할 수 있는 중요한 단서를 제공합니다. CONELA는 학습 동역학 정보를 기반으로 데이터를 세분화하고, 모델 학습에 유익한 데이터를 유지하면서도 방해가 되는 데이터를 제거하는 전략을 도입합니다.

효율적인 데이터 정제 전략의 설계와 평가

image.png

CONELA는 데이터 품질과 학습 효율성을 개선하기 위해 다음 세 가지 주요 단계로 구성됩니다: