파이널 Azure OpenAI

2023. 7. 19. 09:44AWS 기반 데이터분석 처리 고급 SW 클라우드 개발자 양성과정

Azure OpenAI

GPT-3: 텍스트 생성 및 이해

Codex: 코드 생성 및 이해 (프롬프트를 텍스트형태나 쿼리형태로 날리면, Response를 쿼리나 Python 코드 같이 코드를 생성하고 이해할 수 있는 모델

DALL-E: 텍스트 프롬프트로 이미지 생성


OpenAI | GPT-3

Generative pre-trained transformer 3 (GPT-3)

- 인간과 유사한 텍스트를 생성하기 위해 딥러닝을 사용하는 자동 회귀 언어 모델

- 700GB 정도의 텍스트, 수조 개의 단어에 대한 사전 학습된 모

- 1750억 개의 파라미터

- 입력 테스트를 기반으로 가능성이 가장 높은 다음 단어 예측

- 일반 텍스트 입력/텍스트 출력 인터페이스

 

ChatGPT란?

Chatbot +

Generative: "생성하는" 문장

Pretrained: '사전 학습된' 사전 학습된 정보를 기반한

Transformer: "변환" 글의 맥락을 이해할 수 있는 언어모델

 

ChatGPT를 어떻게 만들었나?

1. 샘플 데이터를 기반으로 지도학습 수행

2. 비교 데이터 수집 / 보상 모델 훈련

3. 강화학습 모델을 활용하여 보상모델 최적화

GPT-3.5 Large Language Model을 기반으로 강화학습 활용 및 최적화

 

Chat GPT 활용 기본 개념

- 사용자 질의(Prompt)는 거대 언어 모델(Large Language Model: LLM)로부터 응답을 생성하기 위한 입력값을 의미, 답변되는 텍스트값을 답변(Completion)이라고 명명함.

※ 향후 Prompt Engineering이라는 영역의 하나의 전문영역으로 각광 받을 것으로 예상됨

Prompt Engineering: 답변을 맞춤형으로 만들 수 있습니다.

ex) 고객이 원하는 상품에 대해 요약해서 설명하는 email을 작성해줘

Parameter Tunning: 모델 성능을 최적화 할 수 있습니다.

ex) Temperature: 창의성 범주를 설정할 수 있다(0~1)

Top-p: 다음 단어를 생성할 때, 연관 단어 후보군의 범위를 설정할 수 있다.(0~1)

Max length: 모델 Completion(답변)마다 Token(토큰)수에 대한 제한을 설정


Large Language Model(LLM)에 프롬프트를 Input, Output으로 넣고 

지시하고 작업에 대해 설명, 샘플질문-답변세트를 기반으로 답변을 생성함.

임베딩모델-문제에 대한 백터값을 계산해서 결과값을 던져줌

Fine Tunning: LLM(기본값) 바로 활용하거나, 추가적으로 나중에 서비스를 고도화하겠다, 질의응답세트가 많아지고, 좀더 커스텀화 하고 싶을때(AWS의 슬롯추가와 유사함)

- 세멘틱이란? 코드의 조각을 나타냄. 화면에서 어떻게 보여지는게 중요한 것이 아닌 역할이 무엇이며, 기능이 무엇인지를 나타내는 것.

백터서치:의미까지 추출해서 연관 검색어를 더 자세하게 추출해주는 검색 방법

'AWS 기반 데이터분석 처리 고급 SW 클라우드 개발자 양성과정' 카테고리의 다른 글

lex_chatbot  (0) 2023.07.20
React 강의  (0) 2023.07.20
HTML/CSS  (0) 2023.07.17
도커  (0) 2023.07.16
유스케이스 다이어그램  (0) 2023.07.14