대학교 관련 질의응답을 제공하는 챗봇을 개발할 때, 단순한 언어 생성 모델(LLM)을 사용하면 환각 현상과 같은 오류가 발생할 위험이 있다. 이 문제를 해결하기 위해 'Langchain'이라는 기술을 활용해 볼 수 있다.
Langchain
언어 모델을 기반으로 하는 애플리케이션을 개발하기 위한 프레임워크이다.
메모리를 사용하여 챗봇이 과거 상호 작용을 기억할 수 있고, 검색을 통해 챗봇에 최신 정보를 제공할 수 있다.
Word Embedding은 자연어 처리(NLP)에서 텍스트 데이터를 수치형 벡터로 변환하는 기술이다. 이러한 변환을 통해 컴퓨터는 단어나 문장 간의 유사성을 측정하거나, 머신 러닝 모델에 입력으로 사용할 수 있다. Embedding은 주로 신경망 모델을 사용하여 단어를 고차원의 벡터로 매핑한다. 이 벡터는 단어의 문맥, 의미, 품사 등 다양한 정보를 포함할 수 있다. 예를 들어, "왕"과 "여왕"이라는 단어는 유사한 벡터 값을 가질 것이다.