본문 바로가기

News/IT

요즘 많이 나오는 말, LLM이 무엇일까?

LLM은 "Large Language Model"의 약어로, 대규모 언어 모델을 가리킵니다.
 
LLM(Large Language Model)은 딥러닝 기술과 대량의 데이터 셋을 사용하여 새로운 콘텐츠를 이해, 요약, 생성 및 예측하는 인공 지능(AI) 알고리즘의 한 유형입니다. 생성형 AI(generative AI)라는 용어는 LLM과도 밀접하게 관련되어 있습니다. 사실 LLM은 텍스트 기반 콘텐츠 생성을 돕기 위해 특별히 설계된 생성형 AI(generative AI) 입니다.

수천 년 동안, 인간은 의사소통을 위해 말하는 언어를 개발했습니다. 언어는 모든 형태의 인간 및 기술적 의사소통의 핵심입니다. 언어는 아이디어와 개념을 전달하는 데 필요한 단어, 의미론 및 문법을 제공합니다. AI 세계에서 언어 모델은 의사소통하고 새로운 개념을 생성할 수 있는 기반을 제공하면서 유사한 목적을 수행합니다.

최초의 인공지능 언어 모델은 그들의 뿌리를 인공지능의 초기 시대로 거슬러 올라갑니다. ELIZA 언어 모델은 1966년 MIT에서 처음 선보였으며 AI 언어 모델의 가장 초기 사례 중 하나입니다. 모든 언어 모델은 먼저 일련의 데이터에 대해 훈련된 다음 다양한 기술을 사용하여 관계를 추론한 다음 훈련된 데이터를 기반으로 새로운 콘텐츠를 생성합니다. 언어 모델은 사용자가 결과를 생성하기 위해 자연어로 쿼리를 입력하는 자연어 처리(NLP) 응용 프로그램에서 일반적으로 사용됩니다.

LLM은 훈련과 추론에 사용되는 데이터를 극적으로 확장하는 AI의 언어 모델 개념의 진화입니다. 결과적으로, 그것은 AI 모델의 능력을 크게 향상시킵니다. 교육용 데이터 세트의 크기에 대한 일반적으로 인정되는 수치는 없지만 LLM에는 일반적으로 최소 10억 개 이상의 매개 변수가 있습니다. 매개 변수는 새로운 내용을 추론하는 데 사용할 수 있는 훈련된 모델에 존재하는 변수에 대한 기계 학습 용어입니다.
 
 

What is a large language model (LLM)? – TechTarget Definition

Learn how the AI algorithm known as a large language model, or LLM, uses deep learning and large data sets to understand and generate new content.

www.techtarget.com