2023. 7. 19. 09:44ㆍAWS 기반 데이터분석 처리 고급 SW 클라우드 개발자 양성과정
Azure OpenAI
GPT-3: 텍스트 생성 및 이해
Codex: 코드 생성 및 이해 (프롬프트를 텍스트형태나 쿼리형태로 날리면, Response를 쿼리나 Python 코드 같이 코드를 생성하고 이해할 수 있는 모델
DALL-E: 텍스트 프롬프트로 이미지 생성
OpenAI | GPT-3
Generative pre-trained transformer 3 (GPT-3)
- 인간과 유사한 텍스트를 생성하기 위해 딥러닝을 사용하는 자동 회귀 언어 모델
- 700GB 정도의 텍스트, 수조 개의 단어에 대한 사전 학습된 모
- 1750억 개의 파라미터
- 입력 테스트를 기반으로 가능성이 가장 높은 다음 단어 예측
- 일반 텍스트 입력/텍스트 출력 인터페이스
ChatGPT란?
Chatbot +
Generative: "생성하는" 문장
Pretrained: '사전 학습된' 사전 학습된 정보를 기반한
Transformer: "변환" 글의 맥락을 이해할 수 있는 언어모델
ChatGPT를 어떻게 만들었나?
1. 샘플 데이터를 기반으로 지도학습 수행
2. 비교 데이터 수집 / 보상 모델 훈련
3. 강화학습 모델을 활용하여 보상모델 최적화
GPT-3.5 Large Language Model을 기반으로 강화학습 활용 및 최적화
Chat GPT 활용 기본 개념
- 사용자 질의(Prompt)는 거대 언어 모델(Large Language Model: LLM)로부터 응답을 생성하기 위한 입력값을 의미, 답변되는 텍스트값을 답변(Completion)이라고 명명함.
※ 향후 Prompt Engineering이라는 영역의 하나의 전문영역으로 각광 받을 것으로 예상됨
Prompt Engineering: 답변을 맞춤형으로 만들 수 있습니다.
ex) 고객이 원하는 상품에 대해 요약해서 설명하는 email을 작성해줘
Parameter Tunning: 모델 성능을 최적화 할 수 있습니다.
ex) Temperature: 창의성 범주를 설정할 수 있다(0~1)
Top-p: 다음 단어를 생성할 때, 연관 단어 후보군의 범위를 설정할 수 있다.(0~1)
Max length: 모델 Completion(답변)마다 Token(토큰)수에 대한 제한을 설정
Large Language Model(LLM)에 프롬프트를 Input, Output으로 넣고
지시하고 작업에 대해 설명, 샘플질문-답변세트를 기반으로 답변을 생성함.
임베딩모델-문제에 대한 백터값을 계산해서 결과값을 던져줌
Fine Tunning: LLM(기본값) 바로 활용하거나, 추가적으로 나중에 서비스를 고도화하겠다, 질의응답세트가 많아지고, 좀더 커스텀화 하고 싶을때(AWS의 슬롯추가와 유사함)
- 세멘틱이란? 코드의 조각을 나타냄. 화면에서 어떻게 보여지는게 중요한 것이 아닌 역할이 무엇이며, 기능이 무엇인지를 나타내는 것.
백터서치:의미까지 추출해서 연관 검색어를 더 자세하게 추출해주는 검색 방법
'AWS 기반 데이터분석 처리 고급 SW 클라우드 개발자 양성과정' 카테고리의 다른 글
lex_chatbot (0) | 2023.07.20 |
---|---|
React 강의 (0) | 2023.07.20 |
HTML/CSS (0) | 2023.07.17 |
도커 (0) | 2023.07.16 |
유스케이스 다이어그램 (0) | 2023.07.14 |