实验目标
西九河收录实验室用于观察同一服务器、同一技术栈、不同内容赛道在百度中的发现和收录速度。实验不会使用隐藏文本、桥页或采集内容,而是通过结构化原创页面、sitemap 和主动提交来减少变量。
记录口径
记录项包括页面发布时间、sitemap 出现时间、主动提交时间、Baiduspider 首次访问时间、后续状态码和唯一文本可搜索时间。
子域名设计
当前实验拆分为成语、谜语、方志三个子域名。成语和谜语用于观察高结构化文化内容,方志用于观察地域与姓氏组合内容。
收录观察
实验记录编号:xijiuhe-index-test-20260625-www-001。该编号用于后续检索唯一文本,帮助区分“页面已抓取”和“页面已进入可搜索索引”两个阶段。
