본문 바로가기

questionet

검색하기
questionet
프로필사진 orthanc

  • 분류 전체보기
    • Deep learning
      • NLP 모델 설명
      • NLP 주요 논문
      • 딥러닝 학습기법
      • 강화학습
      • 논문 abstract
    • Learning questions
      • 자료구조 - 알고리즘
      • 기초 개념
      • 헷갈리는 것들
      • 쉽게 이해되지 않는 것들
    • Deep questions
      • 수학적 바탕
      • 시간을 두고 답해 볼 문제들
    • Idea
      • diary
      • 무엇을 개발할까?
      • 급진적인 혹은 극단적인
Guestbook
Recent Posts
Recent Comments
Link
  • 저의 깃허브입니다
Today
Total
관리 메뉴
  • 글쓰기
  • 방명록
  • RSS
  • 관리

목록prefix tuning (1)

questionet

delve into LoRA # 로라 파헤치기 (1)

두 가지 방향을 놓고 고민하고 있었습니다. Single Machine(Single Device) 에서 LLM을 학습시키고 추론해낼 수 있는 PEFT(Parameter Efficient Fine-Tuning) 기법 내지 경량화 기법들을 파고들까 e.g. LoRA, QLoRA, Accelerate Multi Machine(Multiple GPUs)에서 데이터와 모델을 분산(Distributed), 병렬(Parallel) 학습시키는 기법들을 파고들까 e.g. DDP, FairScale, DeepSpeed 이런 류의 고민은 대개 그렇듯 둘다 해야지로 귀결되는 것 같습니다. 이름이 예쁜 LoRA 부터 시작해보겠습니다. 일단 Medium 에서 LoRA 관련 글들을 싹다 긁어 모아 읽어보는 걸로 출발해볼까 합니다. ..

Deep learning/딥러닝 학습기법 2023. 11. 11. 08:19
Prev 1 Next

Blog is powered by kakao / Designed by Tistory

티스토리툴바