인간지능 : HI (Human Intelligence

인간지능 : HI (Human Intelligence

  • 분류 전체보기 (11)
    • Paper Review (2)
    • Diary (9)
  • 홈
  • 태그
  • 방명록
RSS 피드
로그인
로그아웃 글쓰기 관리

인간지능 : HI (Human Intelligence

컨텐츠 검색

태그

일상 논문 논문리뷰 리뷰 llm데이터처리 Falcon 개발자일상 데이터처리

최근글

댓글

공지사항

아카이브

llm데이터처리(1)

  • [Paper Review] The RefinedWeb Dataset for Falcon LLM: Outperforming Curated Corpora with Web Data, and Web Data Only (2023)

    저자 : The Falcon LLM teamAbstract 핵심적절히 필터링 & 중복제거한 웹 데이터는 좋은 모델을 만들 수 있게 한다 !we show that properly filtered and deduplicated web data alone can lead to powerful models배경 as larger models requiring pretraining on trillions of tokens are considered, it is unclear how scalable is curation and whether we will run out of unique high-quality data soon 1. IntroductionContributions.We introduce REFINEDW..

    2024.05.22
이전
1
다음
티스토리
© 2018 TISTORY. All rights reserved.

티스토리툴바