인간지능 : HI (Human Intelligence

인간지능 : HI (Human Intelligence

  • 분류 전체보기 (11)
    • Paper Review (2)
    • Diary (9)
  • 홈
  • 태그
  • 방명록
RSS 피드
로그인
로그아웃 글쓰기 관리

인간지능 : HI (Human Intelligence

컨텐츠 검색

태그

데이터처리 개발자일상 논문 Falcon llm데이터처리 일상 리뷰 논문리뷰

최근글

댓글

공지사항

아카이브

데이터처리(1)

  • [Paper Review] The RefinedWeb Dataset for Falcon LLM: Outperforming Curated Corpora with Web Data, and Web Data Only (2023)

    저자 : The Falcon LLM teamAbstract 핵심적절히 필터링 & 중복제거한 웹 데이터는 좋은 모델을 만들 수 있게 한다 !we show that properly filtered and deduplicated web data alone can lead to powerful models배경 as larger models requiring pretraining on trillions of tokens are considered, it is unclear how scalable is curation and whether we will run out of unique high-quality data soon 1. IntroductionContributions.We introduce REFINEDW..

    2024.05.22
이전
1
다음
티스토리
© 2018 TISTORY. All rights reserved.

티스토리툴바

단축키

내 블로그

내 블로그 - 관리자 홈 전환
Q
Q
새 글 쓰기
W
W

블로그 게시글

글 수정 (권한 있는 경우)
E
E
댓글 영역으로 이동
C
C

모든 영역

이 페이지의 URL 복사
S
S
맨 위로 이동
T
T
티스토리 홈 이동
H
H
단축키 안내
Shift + /
⇧ + /

* 단축키는 한글/영문 대소문자로 이용 가능하며, 티스토리 기본 도메인에서만 동작합니다.