保哥笔记

ChatGPT购物轮播的秘密:83%商品数据来自Google Shopping

引言:AI购物时代,你的商品被谁"选中"?

各位做电商和SEO的朋友,保哥今天要跟大家聊一个对电商行业影响深远的发现。

2026年3月,一项覆盖超过43,000个ChatGPT购物轮播商品、横跨10个垂直行业的大规模研究,揭示了一个令人震惊的事实——ChatGPT购物轮播中83%以上的商品,直接来源于Google Shopping的自然排名结果。而Bing Shopping的贡献率仅为11%,且其中仅有70个商品(占比0.16%)是Bing独有的。

这意味着什么?如果你是电商从业者、品牌方、或数字营销人,你在Google Shopping上的排名直接决定了你的产品能否出现在ChatGPT的购物推荐中。这不是猜测,这是由43,000+商品数据支撑的系统性架构行为。

保哥今天将深入拆解这项研究的技术细节,分析Shopping Query Fan-out的工作机制,并给出一套可落地的优化策略,帮助你的产品在AI购物时代抢占先机。


一、背景:ChatGPT搜索的"隐秘管道"

1.1 ChatGPT并非自建搜索引擎

很多人以为ChatGPT有自己独立的搜索索引,但事实远非如此。OpenAI的产品负责人Nick Turley在美国司法部诉Google的反垄断案中承认,OpenAI距离用自有索引回答80%的搜索查询"还有数年之遥"。

那ChatGPT的搜索数据从哪来?早在2025年8月,业内就已发现OpenAI通过一家名为SerpApi的第三方服务抓取Google搜索结果,用于支撑ChatGPT的实时信息检索。Google甚至在2024年12月对SerpApi提起诉讼,指控其每天抓取数亿次搜索请求。

讽刺的是,Google曾在2024年明确拒绝了OpenAI直接使用其Search API的请求,但OpenAI转而通过SerpApi间接获取了同样的数据。这是AI搜索竞争中最耐人寻味的一个侧面。

1.2 神秘字段 id_to_token_map 的发现

2025年11月,多位AI逆向工程研究者在ChatGPT的源代码中发现了一个名为 id_to_token_map 的字段。对其进行Base64解码后,发现其中包含了Google Shopping的标准参数结构,如 productidofferid,以及语言/地区参数。更关键的是,该字段还暴露了用于查询该商品的搜索词。

研究者通过这些参数成功还原了完整的Google Shopping链接,并验证这些链接指向的商品与ChatGPT轮播中展示的商品完全一致。这是第一个直接证据,表明ChatGPT的购物轮播在底层就是从Google Shopping拉取数据。


二、Shopping Query Fan-out机制深度解析

2.1 什么是Query Fan-out?

Query Fan-out(查询扇出)是ChatGPT处理用户提问时的核心机制。当用户输入一个Prompt,ChatGPT并不会直接用原始提问去检索——它会将用户的意图拆解为多个子查询,分别发送到搜索引擎,收集结果后再综合生成回答。

保哥举个例子:当你问ChatGPT"推荐500美元以下的最佳智能手机",它在后台可能会生成这样几组搜索:

前者是Shopping Fan-out,后两者是Search Fan-out。它们是两条完全独立的检索管道。

2.2 两种Fan-out的本质区别

这项研究分析了110万条Shopping Query Fan-out数据,与同一Prompt对应的普通Search Fan-out进行了比较。结论非常清晰:

维度Shopping Fan-outSearch Fan-out
与用户原始Prompt不同的比例99.70%
与普通Search Fan-out不同的比例98.31%
平均查询词数7个词12个词
每个Prompt平均使用次数1.16次2.4次

这组数据说明什么?

Shopping Fan-out是一条专门的商品检索管道,它与负责生成文字回答的Search Fan-out在架构上是完全分离的。Shopping Fan-out更短、更精准,因为它的目标很明确——在Google Shopping的商品索引中检索结构化的商品列表。而Search Fan-out更长、更具上下文性,因为它需要检索足够丰富的网页内容,以支撑向量搜索和重排序(Re-ranking)。

保哥的理解是:ChatGPT实际上运行着一个"双管道"架构——一条管道负责"找商品"(Shopping Fan-out → Google Shopping),另一条负责"找信息"(Search Fan-out → Google Web Search)。最终的轮播商品选择,很可能是先通过Shopping Fan-out获取候选商品集,再结合Search Fan-out中获取的商品口碑、评测信息进行最终排序。

2.3 一页Google Shopping结果就够了

研究还发现,平均每个Prompt只触发1.16次Shopping Fan-out。也就是说,ChatGPT通常只用一次Google Shopping搜索,就能填满8个商品的轮播位。这进一步验证了Google Shopping自然排名前40位是ChatGPT选品的主要候选池。


三、核心发现:83%匹配率背后的数据真相

3.1 研究方法论

为了确保结论的可靠性,研究团队采用了严谨的三阶段匹配算法:

  1. 精确匹配(Stage 1):去除空格后大小写不敏感的字符串完全相等,得分1.0
  2. 近似精确匹配(Stage 2):使用Python SequenceMatcher,相似度≥0.95即视为匹配,用于捕捉标点、连字符等微小差异
  3. 混合匹配(Stage 3):40%字符相似度 + 60%词汇重叠度的加权得分

最终以0.8分作为"强匹配"阈值——在实际数据中,0.8分基本对应"相同品牌 + 相同产品"的匹配精度。

3.2 核心数据

研究从约5,000个ChatGPT轮播中提取了43,000个商品,同时抓取了对应Shopping Fan-out在Google和Bing上各自前40名的自然购物结果(排除付费广告),进行交叉比对:

这意味着在几乎所有Bing找到匹配的案例中,Google已经提供了相同的商品。ChatGPT从Bing Shopping获取商品数据的可能性极低。

3.3 位置偏好:Google Shopping排名越高,越容易入选

研究进一步分析了ChatGPT轮播位置与Google Shopping排名的关系:

保哥划重点:如果你的产品能稳定在Google Shopping自然排名前10,那么被ChatGPT推荐的概率会大幅提升。前20名是基本门槛,前10名是核心竞争区。

3.4 品牌词与非品牌词的表现差异

研究还对比了品牌词(如"Nike跑鞋")和非品牌词(如"最佳跑步耳机")的匹配表现,发现两者的匹配率差异很小,非品牌词略高。这意味着这种从Google Shopping获取商品数据的行为是系统性的架构设计,不因查询类型或品类而改变。


四、技术架构推演:ChatGPT的购物推荐是怎么工作的

基于上述研究数据和行业逆向工程发现,保哥梳理出ChatGPT购物推荐的完整技术流程:

用户输入Prompt(如"推荐一款500美元以下的智能手机")
    │
    ▼
┌─────────────────────────────────┐
│  Sonic Classifier(意图分类器)    │
│  判断是否为购物意图               │
└──────────┬──────────────────────┘
           │
    ┌──────┴──────┐
    ▼              ▼
[Search Fan-out]  [Shopping Fan-out]
    │              │
    ▼              ▼
Google Web Search  Google Shopping
(检索评测、口碑)  (检索商品列表)
    │              │
    ▼              ▼
┌─────────────────────────────────┐
│  RRF Fusion(综合排序)           │
│  结合商品数据 + 上下文情感/口碑    │
│  生成最终轮播排序                 │
└─────────────────────────────────┘
    │
    ▼
输出:8个商品的轮播 + 文字推荐理由

关键技术组件包括:

这套架构在过去至少4个月内保持稳定,横跨服饰鞋类、母婴、美妆、电子产品、家居、办公用品、宠物用品、运动户外、玩具等10个垂直领域。


五、实战策略:电商品牌如何优化AI购物可见性

理解了底层机制,保哥接下来给出一套完整的优化策略框架。核心逻辑很简单:优化Google Shopping排名 = 优化ChatGPT购物推荐入选率

5.1 Google Merchant Center产品数据优化

这是一切的基础。AI系统无法解析模糊的营销文案,它需要的是结构化、精确的产品数据。

标题优化公式品牌名 + 产品型号 + 核心属性(尺寸/颜色/材质)

例如:❌ "超值爆款轻薄笔记本" → ✅ "联想ThinkPad X1 Carbon Gen 12 14英寸 i7-1365U 16GB 512GB 黑色"

关键属性必须填写完整

保哥的建议:目标是让你的Top商品达到95%以上的属性完成度。Google Merchant Center有数百个可填属性,大多数卖家只填了10-15个,这就是你超越竞争对手的差异化空间。

5.2 产品Feed的持续维护

AI系统信任实时、准确的数据。产品Feed不是一次性工作,而是需要持续同步的运营任务。

5.3 面向AI的结构化内容策略

ChatGPT的Search Fan-out会检索评测、口碑、比较类内容,这些信息很可能影响最终的轮播排序。因此,传统SEO内容策略需要升级:

内容类型优先级(按AI引用权重排序):

  1. 用户生成内容(UGC):真实的用户评价和评分,这是LLM给予最高权重的内容类型
  2. 第三方评测和媒体报道:KOL评测、行业媒体的产品报道
  3. 品牌自有内容:产品页面、品牌博客——虽然权重最低,但仍然是基础

实操建议

5.4 理解Fan-out触发词,精准布局内容

研究表明,只有约31%的ChatGPT Prompt会触发网络搜索。以下是最容易触发搜索的关键词和场景:

保哥的策略:围绕这些触发模式创建内容矩阵。例如,如果你卖跑步耳机,就要确保你在"best running headphones 2026 review"、"running headphones comparison features"这类查询中有高质量内容。

5.5 监测你的AI购物可见性

2026年已经出现了一批专门追踪AI购物可见性的工具,能监测你的产品是否出现在ChatGPT、Perplexity、Google AI Overviews等平台的推荐中。保哥建议关注以下监测维度:


六、更大的棋局:AI购物生态的竞争格局

6.1 不只是ChatGPT

2026年3月,Meta也开始测试其AI购物助手功能,用户可以在Meta AI中通过对话方式获取商品推荐,展示形式同样是带有图片、品牌、价格的商品轮播。Google自身的AI Mode也在不断强化购物体验。

OpenAI推出了"Shopping Research"功能并与PayPal合作推进"Instant Checkout"——目标是让用户从提问到下单全部在ChatGPT内完成。Google则通过Universal Commerce Protocol(UCP)与Shopify合作,建立AI代理商务的标准化协议。

保哥的判断是:2026年的电商竞争焦点,正在从"哪个平台搜索体验更好"转向"哪个AI助手卖货更强"。无论哪个平台最终胜出,Google Shopping作为底层商品数据基础设施的地位只会更加重要

6.2 从"可搜索"到"AI就绪"

传统电商SEO关注的是关键词密度和外链质量。但在AI购物时代,你的产品数据需要满足一个新标准:机器可读性

LLM不会像人类一样浏览你的网页——它将你的产品信息转化为向量嵌入(Vector Embeddings),在高维语义空间中与用户查询进行匹配。这意味着你的产品描述需要:


七、保哥总结:现在就开始行动

让保哥用最简洁的方式总结本文的核心要点:

发现层面:ChatGPT购物轮播83%的商品来自Google Shopping前40名自然排名,60%来自前10名。这是跨品类、跨品牌词/非品牌词的系统性架构行为。

机制层面:ChatGPT运行独立的Shopping Query Fan-out管道,与文字内容检索完全分离。平均每个Prompt只需1次Shopping Fan-out即可填满轮播。

策略层面

  1. 首要任务——优化Google Merchant Center产品数据,目标95%+属性完成度
  2. 核心动作——提升Google Shopping自然排名,争进前10名
  3. 内容策略——围绕Fan-out触发词创建结构化评测、对比内容
  4. UGC建设——积极获取真实用户评价,在Reddit/YouTube等平台建立品牌讨论
  5. 持续监测——使用AI可见性工具追踪轮播出现率和位置变化

AI购物不是在颠覆产品搜索,而是在重新包装它。底层数据源没变——还是Google Shopping。变化的是入口和呈现方式。理解了这一点,你就有了在AI购物时代的竞争策略基础。

那些现在就开始优化Google Shopping数据、建设结构化内容、积累真实口碑的品牌,将在AI购物时代拥有显著的先发优势。就像SEO早期一样,先行者吃肉,后来者喝汤。

保哥建议:别再观望了,现在就去审查你的Google Merchant Center,把这篇文章的策略落地执行起来。