ChatGPT(3, 3.5, 4Ο)
ChatGPT 3 or 3.5정의- GPT-4Ο를 기반으로 사람과 자연스럽게 대화하는 것처럼 상호작용을 구현, 대화에 최적화된 대화전 문 인공지능 키워드- SFT모델, 보상모델, PPO, 생성적 AI, 트랜스포머, Attention Mechanisms, 파인튜닝, 프롬프 트 엔지니어링 메커니즘 기술요소 RLHFReinforcement Learning with Human Feedback - 강화 학습의 방법을 사용하여 사람의 피드백으로 언어 모델 을 직접 최적화 수행 PPOProximal Policy Optimization- OpenAI에서 개발한 모델 없는 강화 학습 알고리즘ChatGPT 4 정의- OpenAI에서 출시한 현재 가장 창의적이며, 일반지식과 문제해결력을 갖춘 모델- 기존 모델(ChatGPT..
2024. 9. 20.