Cognitive Core에 기여
Last updated
Last updated
에이전트의 캐릭터 코어를 풍부하게 하는 것을 목표로 하는 기여자는 AI 개발의 다양한 측면에 초점을 맞춘 몇 가지 주요 기여 방법을 가지고 있습니다.
Contributors may contribute models in two forms:
Model Enhancement Submission/ New Model Submission: 수집된 데이터로 대규모 언어 모델(LLM)을 학습하거나 업데이트합니다. 이는 집합적 데이터 저장소 또는 독점 데이터 세트를 사용하여 수행할 수 있으며, 특정 도메인에 대한 AI의 응답을 조정하는 것을 목표로 합니다.
사전 훈련된 모델(Pre-trained Model): 특정 도메인 지식 세트로 사전 훈련된 새로운 모델을 개발하여 특정 영역에서 LLM의 성능과 지식 범위를 향상시킵니다.
캐릭터 카드 제출: 프로토콜 앱의 기존 기본 모델을 사용하여 에이전트에게 새 캐릭터 카드를 제출합니다.
모델 이름 지정: 공백 없이 모두 소문자를 사용하고 이름이 의미가 있는지 확인합니다.
모형 명세: - 모델 파일을 최소 4비트로 양자화합니다. - 모델을 130억 개 이하의 매개변수로 제한합니다.
템플릿 표시: 사용된 채팅 템플릿을 명확하게 명시합니다(예: “알파카 템플릿”).
응답 형식: 모델은 별표로 래핑된 작업과 함께 Alichat 형식을 사용해야 합니다.
호환성 검사: 기존 AI 시스템과의 모델 호환성을 확인합니다.
문서화: 모델의 기능 및 사용 사례에 대한 포괄적인 문서를 제공합니다.
윤리적 고려 사항: 편향을 피하기 위해 윤리적 AI 관행을 준수합니다.
성능 메트릭: 유효성 검사 결과 또는 성능 메트릭을 포함합니다.
업데이트 및 유지 관리 계획: 향후 모델 업데이트 및 유지 보수에 대한 계획을 간략하게 설명합니다.
기여자는 광범위한 주제를 다루는 다양한 데이터 세트를 제공하여 AI의 지식 기반을 풍부하게 하고 다양한 도메인에서 정확하게 응답할 수 있는 능력을 향상시킬 수 있습니다.
이러한 데이터 세트의 주요 용도는 명령 기반 미세 조정입니다. 이 프로세스에는 제공된 데이터를 기반으로 특정 지침 또는 지침을 더 잘 이해하고 따르기 위해 AI 모델을 조정하는 작업이 포함됩니다.
제출은 이상적으로 .csv(쉼표로 구분된 값) 형식이어야 합니다.
새 데이터 세트를 제출하려면 “새 데이터 세트가 있습니다”를 선택합니다.
그 외에도 사전 학습된 목적으로 다른 방법으로 데이터 세트 기여를 제출할 수 있습니다. 다음은 수집할 수 있는 다양한 유형의 데이터 세트와 모델에서 이를 활용하기 위한 다른 대안입니다.
데이터 수집 및 전사
도메인별 정보 수집: 다양한 출처에서 Virtual의 전문 분야와 관련된 정보를 수집하는 데 중점을 둡니다. 이 단계는 포괄적인 지식창고를 구축하는 데 매우 중요합니다.
전사된 데이터에 주석 달기: 전사된 데이터 내에서 필수 정보와 컨텍스트를 강조 표시합니다. 주석은 수집된 데이터를 효과적으로 이해하고 활용하기 위한 핵심입니다.
체계적인 조직: 데이터가 체계적으로 구성되어 있는지 확인합니다. 적절한 분류는 관련 지식 영역에서 AI를 효율적으로 훈련시키는 데 필수적입니다.
2. 가상의 개성 확장
Lore and Backstory Expansion: 제출물에는 상세한 이야기 또는 Virtual에 대한 확장된 배경 이야기가 포함될 수 있으며, 이는 캐릭터에 깊이와 풍부함을 더할 수 있습니다.
특성 정교화: 기여는 가상의 특정 성격 특성 또는 특성을 자세히 설명하여 보다 미묘하고 관련성 있는 AI 캐릭터를 만드는 데 도움이 될 수 있습니다.
이 제출은 프롬프트 카드에 통합될 수도 있습니다. 프롬프트 카드 통합에 대해서는 ‘캐릭터 카드 제출’ 섹션에서 자세한 지침 및 형식 요구 사항을 참조하십시오.
데이터 세트 다양성 및 포용성: 다양한 데이터 소스의 표현을 보장합니다.
품질 보증: 정확성과 관련성에 대한 철저한 검사를 수행합니다.
데이터 익명화: 사용자 생성 콘텐츠의 민감한 정보를 익명화합니다.
법률 준수: 데이터 세트가 데이터 보호법을 준수하는지 확인합니다.
메타데이터 포함: 소스, 수집 방법 및 전처리를 자세히 설명하는 메타데이터를 제공합니다.