에이군의 소프트웨어 엔지니어링 연구실

고정 헤더 영역

글 제목

메뉴 레이어

에이군의 소프트웨어 엔지니어링 연구실

메뉴 리스트

  • 홈
  • 태그
  • 방명록
  • 분류 전체보기 (19)
    • CTO개발이야기 (4)
    • 프로그래밍 강좌 (4)
    • 데이터분석 (0)
    • AI엔지니어링 (11)

검색 레이어

에이군의 소프트웨어 엔지니어링 연구실

검색 영역

컨텐츠 검색

nlp

  • 개발자를 위한 LLM 엔지니어링- 4. LLM의 학습

    2024.10.22 by 에이군

  • 개발자를 위한 LLM 엔지니어링- 3. LLM의 동작 tokenizer

    2024.09.11 by 에이군

개발자를 위한 LLM 엔지니어링- 4. LLM의 학습

이번글에서는 LLM의 학습에 대해서 정리할까 합니다. 이전 글에서  위 그림처럼 LLM은 먼저 모델을 학습하는 과정을 거치고 학습이 완료된 모델을 사용하여 tokenizer 로 입력값을 만들어서 모델에 입력하여 값을 예측하여 사용한다고 했습니다. 그렇다면 맨땅에 모델을 학습하려고 하면 어떤 과정을 거쳐야 할까요? 아마도 아래의 프로세스와 유사하게 진행해야 할것입니다. 먼저 당연히 학습할 데이터를 먼저 준비해야 하고 우리가 학습에 사용할 모델을 선별해야 합니다. 그리고 우리는 pre training 단계로 아무 지식이 없는 백지의 모델을 학습하게 됩니다.  그 다음에는 조금더 도메인에 맞게 fine tuning 이라는 단계를 진행하여 모델을 좀더 학습한 다음에 해당 모델을 배포해서 사용 합니다.  최근에 ..

AI엔지니어링 2024. 10. 22. 10:14

개발자를 위한 LLM 엔지니어링- 3. LLM의 동작 tokenizer

이전글에는 LLM 동작에 대한 아주 기초적인 학습 개념에 대해서 작성했었습니다.  이번글에서는 한단계 더 들어가서 실제로 LLM 이 데이터를 어떻게 인식하고 처리하는지에 대한 파이프라인을 살펴보겠습니다.결국은 LLM도 컴퓨터가 처리하는 것이기 때문에 입력 받는 문자열을 수치화 하여 입력을 해야 합니다.LLM에 원하는 입력을 하기 위해서는 데이터 전처리 단계가 필요하며 이 전처리가 끝나면 수치값으로 변환 됩니다.위처럼 문장을 데이터 전처리를 하여 수치화로 변환하는 작업은 tokenizer 가 진행 합니다.이런 tokenizer 는 다시 정규화 -> 사전토큰화 -> 학습 -> 사후처리 프로세스로 구분됩니다.정규화 단계에서는 공백 제거, 소문자 변환 및 악센트 제거 등과 같이 문자열의 일반적인 정제 작업을 진..

AI엔지니어링 2024. 9. 11. 14:31

추가 정보

인기글

최신글

페이징

이전
1
다음
TISTORY
에이군의 소프트웨어 엔지니어링 연구실 © Magazine Lab
페이스북 트위터 인스타그램 유투브 메일

티스토리툴바