WikiChat 简介
WikiChat 是一个基于英文维基百科信息的高级聊天系统。它在回答问题时首先利用维基百科找到相关且准确的信息,确保回答的可靠性和实用性。在混合人类和大型语言模型(LLM)的评估中,WikiChat取得了高达97.3%的事实准确率,表现优于其他模型。此外,WikiChat在对话性、效率和减少“幻觉”上也表现出色。
主要特点
- 高度准确:直接依赖维基百科的权威信息源,确保提供准确的事实和数据。
- 减少“幻觉”:利用维基百科数据减少了LLM在讨论最新事件或非主流话题时产生错误信息的可能性。
- 对话性强:即便重视准确性,仍能维持流畅、自然的对话风格。
- 适应性强:能够适应多种类型的查询和对话场景。
- 高效性能:优化后的响应速度快,运行成本低。
工作原理
- 检索信息:首先判断是否需要访问外部信息,并生成搜索查询从维基百科检索相关信息。
- 摘要和过滤:提取相关信息,摘要成要点,过滤无关内容。
- 生成LLM响应:使用大型语言模型(如GPT-4)生成回应。
- 事实核查:将LLM的回应分解为多个声明,对每个声明进行事实核查。
- 形成回应:使用经过筛选和验证的信息形成吸引人的回应。
在评估方法中的表现
- 高事实准确性:达到97.3%的事实准确率。
- 与GPT-4比较:在处理常见主题、不常见主题和最新信息方面,均优于GPT-4。
- 与基于检索的聊天机器人比较:在事实准确性、信息量和用户参与方面表现更佳。
相关链接
- GitHub:WikiChat GitHub
- 论文:WikiChat 论文
- 在线体验:WikiChat 在线体验