Paper Review
[Paper Review] WizardLM: Empowering Large Language Models to Follow Complex Instructions
인간개발자
2024. 7. 3. 23:10
Evol-Instruct 논문
저자: Microsoft
Abstract
- 배경
- LLM을 오픈 도메인 instruction 데이터로 훈련하는건 크게 성공함
- 허나, 높은 복잡성을 가진 데이터를 생성하는건 사람에게 힘들고 시간이 드는 일임
- Evol-Instruct
- 인간 대신 LLM을 사용하여 다양한 수준의 복잡성을 지닌 대량의 instruction 데이터를 생성하는 방법
- Evol-Instruct를 사용하여 initial instruction 셋에서 점점 복잡한 instruction을 생성함
- WizardLM
- Evol-Instruct로 만든 데이터를 섞어서 LLaMa를 fine-tuning한 모델
2 Related Work
- Self-Instruct와 차이점
- Evol-Instruct는 생성되는 데이터의 어려움, 복잡성 난이도를 조절할 수 있음
3 Approach
instruction-evolution은 1. instruction 진화 2. 답변 생성 3. 제거 진화 세 단계로 구성
5 Conclusion
- 한계
- 확장성과 신뢰성에 어려움
공식 코드가 있는 점은 좋으나, 완성도가 떨어지는 부분이 아쉽다..
제거 진화 부분과 세대 진화 부분이 구현이 안되어 있다.