Skip to content

索引中心

适用读者:Halo 站长、RAG 运维人员

索引中心管理文章切片、关键词、向量和同步状态。文章是事实来源,Lucene 索引是可以重新生成的派生数据。

索引中心

状态流转

索引生命周期

什么时候全量重建

  • 第一次启用插件。
  • 更换 Embedding 模型或向量维度。
  • 修改切片策略并希望所有旧文章生效。
  • 升级后索引结构发生变化。
  • 索引统计明显与公开文章不一致。

什么时候单篇重建

  • 某篇文章检索不到。
  • 修改文章后自动同步未完成。
  • 只调整少量文章,不希望产生全站 Embedding 成本。

页面检查重点

  • 已索引文章数、切片数和失败文章数。
  • 每篇文章的状态、切片、关键词和截断提示。
  • 全量/单篇任务进度。
  • 失败信息与最后更新时间。

清除索引

清除某篇文章索引后,它不会再进入 RAG 或插件关键词搜索。清除不会删除 Halo 原文章;重新执行单篇索引即可恢复。

成本控制

全量重建会批量调用 Embedding;开启自动关键词后还会增加模型调用。生产站点建议先估算文章量、切片数量和每日限额,避免重建中途被限额截断。

验证

  1. 打开一篇已索引文章的切片。
  2. 从切片中选择一个专有词。
  3. 在调试问答中提问。
  4. 检查 Trace 是否命中对应文章。

底层流程见 RAG 管线

基于 GPL-3.0 许可发布