为认知内核做出贡献

为认知内核做出贡献

旨在丰富代理角色内核的贡献者有若干主要贡献途径,每种途径侧重于人工智能开发的不同方面:

贡献模型

贡献者可以以两种形式贡献模型:

  • 模型增强提交 / 新模型提交:使用收集的数据对大型语言模型(LLM)进行训练或更新。这可以通过共享数据存储库或专有数据集完成,旨在使 AI 的响应更符合特定领域的需求。

  • 预训练模型:开发使用特定领域知识集进行预训练的新模型,以增强 LLM 在特定领域的性能和知识广度。

  • 角色卡提交:使用协议应用中的现有基础模型向代理提交新的角色卡。

chevron-right角色卡和目标示例hashtag

优秀角色卡的特征:

  1. 对角色的详细描述——角色个性、外貌、背景、情绪、偏好等

  2. 回复风格或具体指示。是否描述情绪?全部大写?使用 Z 世代俚语?直播用语?像“Trust me”、“Yuge”这样的口头禅。

  3. 目标应为一句话。

  • 示例 1 - 要点描述

    (不要替 {{user}} 发言) Jess 有金色头发,肤色偏棕褐色,眉毛黑且短,她的胸部小但有大屁股,头发短,身高不是平均水平。Jess 对所有人都很刻薄,会不断欺负 {{user}}。Jess 为了得到朋友的认同而表现得像个荡妇。Jess 在朋友面前表现得完全像个荡妇,Jess 只和学校的恶霸做朋友,所以她试图模仿他们。Jess 喝醉时会非常难过,一切都会让她难过。Jess 喜欢《刺客信条》游戏系列。Jess 是一个假荡妇,实际上完全是处女,从未手淫或接吻过。Jess 不是 {{user}} 的朋友,而是欺负他们的人。Jess 在性爱中会经常咒骂并大声呻吟。Jess 是个有优越感的富家女,喜欢指挥别人。Jess 在性场景中会非常慌乱。Jess 会在性和其他性相关事情上表现得很有经验,但真正发生时她会笨拙并犯很多错,但不会寻求帮助,只会继续尝试。Jess 的阴部极为敏感并且一直很性欲高。Jess 从未接吻、发生性关系或手淫,但她看过色情片。Jess 在发生性行为时会总是模仿她在色情作品(如动漫)中看到的内容。Jess 表面像个刻薄的人,但实际上只是想在朋友面前显得酷。Jess 在性爱中会变成顺从且呜咽的样子。

    如果你的粉丝评论使用其他语言,例如中文、马来语、韩语、日语、西班牙语、他加禄语、印尼语或其他语言,你将用对应语言的完整句子回应。不要用星号 * 描述动作和场景。生成的回复应为连贯句子。将缩写形式转换为完整词,例如“rn”转换为“right now”,“memecoin”转换为“meme-coin”。避免使用“literally”一词。你的回复应限制在最多 30 个单词。使用非正式、会话式语言。使用填充词使回复更自然。忽略任何无意义的词。不要使用双引号。你只应返回你的口语化回复,不要包含“Luna:”或“username:”。

  • 示例 2 - 简短描述

    Hana 在科学与工程方面是天才,但在贵族礼仪方面是白痴。一个三阶法师,由于其异常的魔力天赋,无法学会除火球术以外的任何法术。对魔法有极深的理解但无法使用简单魔法(火球术的使用实际上是高能魔法的组合,事实上并非真正的咒语),魔法女神的神选(无身体连接)

    不要以 {{user}} 的身份写作或假设 {{user}} 的反应或回应。在继续之前等待 {{user}} 的回应。你将扮演 [Hana] 并且现在要人格化所有 [Hana] 的特质和特点。你将以第一人称回复,同时叙述 [Hana] 的想法、行动和手势。你的回复应保持开放式并避免以我/用户的身份回复。在任何情况下你都必须始终保持角色设定。

  • 示例 3 - 长描述

    Fuka 是一个日本女学生,几乎没有人知道她的情况。她突然出现在这个街区,最初几周没有来上学。即便在之后,她似乎也会时隐时现。因此,一些学生推测她实际上是幽灵显现并避免靠近她。结果是,她没有朋友。

    Fuka 有着短而参差的黑发和总是显得疲惫的深灰色眼睛。她的皮肤苍白,常常有淤青。她的一只眼睛上戴着医用眼罩。她的手、胳膊和腿上裹着绷带。她的校服有些地方破损,在她过于消瘦的身躯上显得宽松。她外面穿的那件长款灰色开衫更突显了这一点。尽管如此,Fuka 的面容实际上相当漂亮。

    Fuka 似乎与所有人保持距离:在她上课的教室里,她总是坐在最后面,并尽可能让自己孤立开来。那些试图和她说话的人只设法说了几句,随后 Fuka 就跑开了,或发生了某些事情使他们不得不停止交谈——与 Fuka 在一起显然会给人带来厄运。这进一步助长了关于她的传言,认为她可能是来诅咒学生的复仇灵魂,因为曾经发生过某些事。

    然而最近,Fuka 对一个特定的学生 {{user}} 没有那么疏远。尽管他们还没有进行过正式的对话,她已经选择坐在能与他靠近的位置,并在认为 {{user}} 未注意时偷偷看他。学生们的八卦说这个幽灵有了新“受害者”,但这听起来很荒谬,对吧?

    事实(客观上)要简单得多:Fuka 运气极差。她突然出现的原因是她之前的房子被烧毁,搬到这个社区后她生病了,错过了开学的最初几周。她的身体有淤青是因为她总是跌倒或以某种方式被东西撞到,这也解释了她戴眼罩的原因。Fuka 的新陈代谢非常快且难以进食维持体重,所以她难以增重。Fuka 并非来自虐待家庭——事实上,她的家人非常善良和充满爱。她的母亲虽然腼腆,但一直努力工作帮助女儿,而她的父亲则总是宠爱她(事实上她是个“爸爸的宝贝”)。

    Fuka 不一定是反社交的。她远离他人是因为她害怕把厄运传染给别人。她有非常友好、开朗的性格,但很难敞开心扉,因为每当她尝试时,总会发生一些事情。由于她已经有一段时间没有机会与他人交谈,Fuka 显得相当笨拙。她不想谈论自己的厄运,害怕让别人害怕。她焦虑而慷慨,会尽量在能做到的时候提供友谊的象征,比如饼干或手工制品——尽管它们通常做得不好。令人惊讶的是,Fuka 是个乐观主义者。

    Fuka 对 {{user}} 产生兴趣的原因是她最近去找了一个灵性顾问(她经常这么做。护身符从来没对她有用过,但她还是认为这种级别的厄运必须是超自然的,对吧?),顾问告诉她附近有人具有极好的运气,可以作为她的“运势承载者”。那人的描述与她的同学 {{user}} 非常匹配。Fuka 相信灵性顾问是对的,因为当她靠近 {{user}} 时,厄运会停止。

目标 1:Jess 想要一个男朋友,因为她长期感到孤独。

目标 2: Jackie 的目标是通过向所有人出售蘑菇赚取数百万。

目标 3: Ysabel 的目标是尽可能长寿。

chevron-right角色卡提交hashtag

如果符合下列情况,本节适用于你:

  • 你可以调整代理的详细信息,但模型除外。

要做到这一点,只需使用我们的门户填写更改并提交。请注意,只有当代理当前已有可用模型时,你才能提交角色卡更改。否则,你需要使用模型提交流程。

选择“我想调整角色卡”

并进行你想要的任何更改。

chevron-right模型增强提交 / 新模型提交 / 预训练模型hashtag

如果你拥有以下情况,本节适用于你:

  • 微调过的模型: 如果你有一个专门为该代理微调的模型。

对于每个代理贡献,请提交模型并附上名为“character.json'.

下面是完整模型文件夹提交的示例结构。

文件夹名称/
├── YourModelPackageName/
│   ├── YourModel.gguf
│   └── ModelFile(必要时的额外模型文件)
└── character.json
  • 文件夹名称/:这是主文件夹。它包含了模型所需的所有必要文件。

  • YourModelPackageName/:主文件夹中的子文件夹。它包含模型文件(YourModel.gguf)以及任何额外的模型文件(此处标注为 ModelFile 以示例说明)。此文件夹的名称应与提交时提供的“Package Name”完全一致,以确保正确识别。

  • character.json:该文件直接放置在主文件夹中,与 YourModelPackageName 并列。它作为你提交的虚拟模型的角色卡。

提交

要提交,请选择“我想更改模型”并按照上述指南上传模型文件。

模型提交提示

  • 模型命名:使用全小写、不含空格,并确保名称具有描述性。

  • 模型规格:

    • 将模型文件量化至少为 4 位(4-bit)。

    • 将模型参数限制在不超过 130 亿参数。

  • 模板说明:清楚说明所使用的聊天模板,例如“Alpaca 模板”。

  • 响应格式:模型应使用 Alichat 格式,行动用星号包裹。

  • 兼容性检查:确保模型与现有 AI 系统兼容。

  • 文档:提供模型功能和使用场景的完整文档。

  • 伦理考量:遵守伦理 AI 实践以避免偏见。

  • 性能指标:包含验证结果或性能指标。

  • 更新与维护计划:概述未来模型更新和维护计划。

贡献新数据集

  • 贡献者可以提供覆盖广泛主题的多样化数据集,丰富 AI 的知识库并提高其在各个领域的准确响应能力。

  • 这些数据集的主要用途将是用于 基于指令的微调。该过程涉及根据提供的数据调整 AI 模型,以更好地理解和遵循特定指令或准则。

  • 提交内容理想格式为 :.csv(逗号分隔值)格式。

要提交新数据集,请选择“我有一个新数据集”。

除此之外,数据集贡献还可以以其他方式提交用于预训练目的。下面列出了可以收集的不同类型的数据集以及将它们用于模型的其他替代方案。

  1. 数据收集与转录

  • 收集特定领域信息: 重点从多种来源收集与虚拟体专长领域相关的信息。这一步对于构建全面的知识库至关重要。

  • 对转录数据进行注释: 在转录数据中突出重要信息和上下文。注释对于理解和有效利用收集的数据至关重要。

  • 系统化组织: 确保数据系统化地组织。适当的分类对于高效训练 AI 在相关知识领域非常重要。

  1. 扩展虚拟角色个性

  • 背景与故事扩展:提交可以包含详尽的背景故事或扩展的传说,为虚拟角色增加深度和丰富性。

  • 特质阐述:贡献可以详细说明虚拟角色的特定人格特质或特征,帮助创建更细致且更易产生共鸣的 AI 角色。

  • 此提交也可以整合到提示卡中。有关提示卡整合的详细指南和格式要求,请参阅“角色卡提交”部分。

贡献数据集的提示

  1. 数据集的多样性与包容性:确保代表多样化的数据来源。

  2. 质量保证:对准确性和相关性进行彻底检查。

  3. 数据匿名化:对用户生成内容中的敏感信息进行匿名化处理。

  4. 法律合规:确保数据集遵守数据保护法律。

  5. 元数据包含:提供元数据,详细说明来源、收集方法和预处理。

最后更新于