반응형 diffusion models1 생성형 AI 모델, LLM 모델 생성 및 구조부터 성능 최적화와 학습 전략 방법 #1 이번 글에서는 생성형 AI 모델의 기본적인 구조와 모델을 생성하고, 모델의 성능을 향상하기 위해 효율적으로 훈련하는 다양한 학습 방법과 최적화 기법들을 정리해 보겠습니다. 생성형 AI 모델의 핵심 아키텍처 LLM의 기반 트랜스포머 (Transformer)현재 대규모 언어 모델(LLM)의 핵심 아키텍처입니다. '어텐션 메커니즘'을 통해 입력 시퀀스 내의 요소들 간의 관계를 효율적으로 학습하며, 텍스트 생성에서 압도적인 성능을 보여줍니다. 최근에는 이미지(비전 트랜스포머, ViT), 음성, 비디오 생성 분야로도 활용 범위가 확장되고 있습니다.GAN (Generative Adversarial Networks)생성자(Generator)와 판별자(Discriminator)라는 두 개의 신경망이 서로 경쟁하며.. 2025. 6. 16. 이전 1 다음 반응형