BART 논문 정리

카테고리 없음

뿅삥 2021. 12. 23. 17:22

BART: Denoising Sequence-to-Sequence Pre-training for Natural Language Generation, Translation, and Comprehension

1. Token Masking

Original Text : "날씨가 좋다. 학교에 간다."
Token Masking : "날씨가 [MASK]. 학교에 간다."

Original Text로 복구되게 학습 + [MASK]에 어떤 토큰(텍스트)이 들어올지 맞출 수 있게 학습

2. Token Deletion

Original Text : "날씨가 좋다. 학교에 간다."
Token Deletion : "날씨가. 학교에 간다."

Original Text로 복구되게 학습 + 토큰(텍스트)이 사라진 위치가 어디인지 맞출 수 있게 학습함

3. Text Infilling

토큰(텍스트) 여러개에 [MASK]를 한 번에 부여

Original Text : "날씨가 좋다. 학교에 간다."
Text Infilling : "날씨가 [MASK] 간다."

Original Text로 복구되게 학습 + [MASK] 자리에 몇 개의 토큰이 있는지 맞출 수 있게 학습함

4. Sentence Permutation

Original Text : "날씨가 좋다. 학교에 간다."
Sentence Permutation : "학교에 간다. 날씨가 좋다."

이 경우 어떤 방식으로 학습 하는지 명확하게 명시되어있지 않음

따라서, Original Text로 복구하는 방식으로만 학습 되지 않을까 예상함

5. Document Rotation

Original Text : "날씨가 좋다. 학교에 간다."
Document Rotation : "간다. 날씨가 좋다. 학교에"

Original Text로 복구되게 학습 + 텍스트의 시작 지점이 어디 인지 맞출 수 있게 학습

* 참고

BERT vs GPT vs BART

Pretrain 방식