인지 코어
인지 코어는 VIRTUAL 에이전트의 핵심 구성 요소로, 작업 수행을 위해 대규모 언어 모델(LLM)을 활용하며 VIRTUAL 에이전트 고유의 개성과 중심 지능을 구현합니다.
대규모 언어 모델(LLM) 소개
현재 LLM은 오픈소스 모델을 기반으로 활용합니다. 각 Virtual 에이전트의 개성과 중심 지능은 아래와 같은 접근 방식을 통해 통합되고 있습니다:
개성 개발 각 Virtual 에이전트의 배경 이야기, 세계관, 성격 특성 및 특징은 검색 증강 생성(RAG) 방법을 사용하여 개발됩니다. 이 접근 방식은 언어 모델의 생성 능력과 검색 메커니즘을 결합하여, AI가 지식 기반에서 관련 정보를 불러와 응답을 풍부하게 할 수 있게 합니다. 이 기법은 다양한 데이터를 활용해 캐릭터의 상호작용을 더 다채롭고 생동감 있게 만들 수 있으므로, Virtual 에이전트의 독특하고 매력적인 개성을 만드는 데 특히 효과적입니다.
중심 지능
충분한 규모의 데이터셋을 가진 Virtual 에이전트의 경우, 오픈소스 모델을 직접 파인튜닝합니다. 이 과정은 특히 대규모 데이터셋에 맞게 모델의 매개변수를 조정하여, Virtual 에이전트가 지정된 도메인 맥락에서 정확하고 효과적으로 응답할 수 있도록 능력을 향상시킵니다. 필요한 경우 지시 기반 파인튜닝을 적용합니다. 이는 모델이 특정 지침이나 가이드를 따르도록 학습시키는 것으로, 사전에 정의된 규칙이나 목표에 따라 응답과 동작을 더욱 정교하게 다듬는 과정입니다. 데이터셋이 더 작은 경우에는 정보를 벡터 데이터베이스에 저장합니다. 그런 다음 이 데이터는 RAG 방법을 사용하여 모델에 입력되며, 이를 통해 AI가 이보다 제한된 정보 집합에도 효율적으로 접근할 수 있습니다.
데이터 전처리
오늘날 다양한 데이터 환경에서 관련 데이터셋은 텍스트(교과서, 포럼, 위키), 비디오, 오디오 등 여러 형식으로 제공됩니다. 현재 중심 캐릭터 코어는 주로 텍스트 기반 대규모 언어 모델(LLM)에 의존하므로, 주로 텍스트 기반 학습 데이터를 포함합니다. 따라서 비디오나 오디오와 같은 비텍스트 형식의 학습 데이터가 존재하는 경우, 모델 학습을 위해 텍스트로 전사해야 합니다. 모델 학습 전에 표준 데이터 처리 규칙이 적용됩니다.
데이터 정제: 이 단계에서는 데이터셋에서 노이즈와 결측값을 제거하도록 정제합니다. 데이터 무결성을 유지하고 데이터 품질을 개선하기 위해 데이터 규칙이 적용됩니다.
데이터 변환: 데이터셋은 모델 학습에 해석 가능하고 사용할 수 있도록 변환 및 표준화를 거칩니다.
더 나은 사용자 경험을 위한 사용자 대화 기억
Virtual은 지속적 기억 시스템으로 설계되어 인간과 유사한 기억 능력을 최대한 가깝게 모방하고 사용자와의 개인화된 상호작용을 가능하게 하는 것을 목표로 합니다. 이를 달성하기 위해 시스템은 두 가지 주요 과제를 해결합니다:
사용자 및 대화 식별과 회상:
이 시스템은 각 사용자와 해당 대화를 안정적으로 식별하도록 설계되어, 이러한 상호작용을 정확하게 기억하고 참조할 수 있도록 보장합니다.
긴 대화 저장 및 기억 처리:
장시간 대화를 관리하고 저장하는 것은 메모리 처리 측면에서 과제를 제기합니다. 이 시스템은 이러한 긴 대화를 효율적으로 처리하도록 설계되었습니다.
고유 식별자
Virtual과 상호작용하는 각 사용자에게는 고유 식별자가 할당됩니다. 이 식별자는 대화의 연속성과 사용자별 구분을 유지하는 데 매우 중요합니다.
벡터 데이터베이스
메시지는 임베딩 기법을 사용해 벡터화됩니다. 이 벡터화 과정은 텍스트 메시지를 효율적인 저장과 검색에 적합한 숫자 벡터 형식으로 변환합니다.
When the getPrompt('identifier', 'context', 'params') 함수가 호출되면, 시스템은 사용자 식별자를 사용하여 벡터 데이터베이스에서 관련된 모든 메시지를 가져옵니다. 이 벡터들을 대규모 언어 모델(LLM) 안에서 처리하기 위해 검색 방법을 사용하며, 이를 통해 LLM은 dApp에서 추가적인 컨텍스트 입력 없이도 대화의 맥락을 이해할 수 있습니다. LLM은 검색된 대화 기록을 바탕으로 응답을 생성합니다. 이 접근 방식은 응답이 각 사용자의 진행 중인 대화 스레드에 대해 맥락적으로 적절하고 개인화되도록 보장합니다.
마지막 업데이트