ChatGPT购物轮播的秘密：83%商品数据来自Google Shopping

引言：AI购物时代，你的商品被谁"选中"？

各位做电商和SEO的朋友，保哥今天要跟大家聊一个对电商行业影响深远的发现。

2026年3月，一项覆盖超过43,000个ChatGPT购物轮播商品、横跨10个垂直行业的大规模研究，揭示了一个令人震惊的事实——ChatGPT购物轮播中83%以上的商品，直接来源于Google Shopping的自然排名结果。而Bing Shopping的贡献率仅为11%，且其中仅有70个商品（占比0.16%）是Bing独有的。

这意味着什么？如果你是电商从业者、品牌方、或数字营销人，你在Google Shopping上的排名直接决定了你的产品能否出现在ChatGPT的购物推荐中。这不是猜测，这是由43,000+商品数据支撑的系统性架构行为。

保哥今天将深入拆解这项研究的技术细节，分析Shopping Query Fan-out的工作机制，并给出一套可落地的优化策略，帮助你的产品在AI购物时代抢占先机。

一、背景：ChatGPT搜索的"隐秘管道"

1.1 ChatGPT并非自建搜索引擎

很多人以为ChatGPT有自己独立的搜索索引，但事实远非如此。OpenAI的产品负责人Nick Turley在美国司法部诉Google的反垄断案中承认，OpenAI距离用自有索引回答80%的搜索查询"还有数年之遥"。

那ChatGPT的搜索数据从哪来？早在2025年8月，业内就已发现OpenAI通过一家名为SerpApi的第三方服务抓取Google搜索结果，用于支撑ChatGPT的实时信息检索。Google甚至在2024年12月对SerpApi提起诉讼，指控其每天抓取数亿次搜索请求。

讽刺的是，Google曾在2024年明确拒绝了OpenAI直接使用其Search API的请求，但OpenAI转而通过SerpApi间接获取了同样的数据。这是AI搜索竞争中最耐人寻味的一个侧面。

1.2 神秘字段 `id_to_token_map` 的发现

2025年11月，多位AI逆向工程研究者在ChatGPT的源代码中发现了一个名为 id_to_token_map 的字段。对其进行Base64解码后，发现其中包含了Google Shopping的标准参数结构，如 productid、offerid，以及语言/地区参数。更关键的是，该字段还暴露了用于查询该商品的搜索词。

研究者通过这些参数成功还原了完整的Google Shopping链接，并验证这些链接指向的商品与ChatGPT轮播中展示的商品完全一致。这是第一个直接证据，表明ChatGPT的购物轮播在底层就是从Google Shopping拉取数据。

二、Shopping Query Fan-out机制深度解析

2.1 什么是Query Fan-out？

Query Fan-out（查询扇出）是ChatGPT处理用户提问时的核心机制。当用户输入一个Prompt，ChatGPT并不会直接用原始提问去检索——它会将用户的意图拆解为多个子查询，分别发送到搜索引擎，收集结果后再综合生成回答。

保哥举个例子：当你问ChatGPT"推荐500美元以下的最佳智能手机"，它在后台可能会生成这样几组搜索：

smartphones under $500 usd → 发往Google Shopping
best budget smartphones 2026 reviews → 发往Google Web Search
smartphone comparison under 500 dollars features → 发往Google Web Search

前者是Shopping Fan-out，后两者是Search Fan-out。它们是两条完全独立的检索管道。

2.2 两种Fan-out的本质区别

这项研究分析了110万条Shopping Query Fan-out数据，与同一Prompt对应的普通Search Fan-out进行了比较。结论非常清晰：

维度	Shopping Fan-out	Search Fan-out
与用户原始Prompt不同的比例	99.70%	—
与普通Search Fan-out不同的比例	98.31%	—
平均查询词数	7个词	12个词
每个Prompt平均使用次数	1.16次	2.4次

这组数据说明什么？

Shopping Fan-out是一条专门的商品检索管道，它与负责生成文字回答的Search Fan-out在架构上是完全分离的。Shopping Fan-out更短、更精准，因为它的目标很明确——在Google Shopping的商品索引中检索结构化的商品列表。而Search Fan-out更长、更具上下文性，因为它需要检索足够丰富的网页内容，以支撑向量搜索和重排序（Re-ranking）。

保哥的理解是：ChatGPT实际上运行着一个"双管道"架构——一条管道负责"找商品"（Shopping Fan-out → Google Shopping），另一条负责"找信息"（Search Fan-out → Google Web Search）。最终的轮播商品选择，很可能是先通过Shopping Fan-out获取候选商品集，再结合Search Fan-out中获取的商品口碑、评测信息进行最终排序。

2.3 一页Google Shopping结果就够了

研究还发现，平均每个Prompt只触发1.16次Shopping Fan-out。也就是说，ChatGPT通常只用一次Google Shopping搜索，就能填满8个商品的轮播位。这进一步验证了Google Shopping自然排名前40位是ChatGPT选品的主要候选池。

三、核心发现：83%匹配率背后的数据真相

3.1 研究方法论

为了确保结论的可靠性，研究团队采用了严谨的三阶段匹配算法：

精确匹配（Stage 1）：去除空格后大小写不敏感的字符串完全相等，得分1.0
近似精确匹配（Stage 2）：使用Python SequenceMatcher，相似度≥0.95即视为匹配，用于捕捉标点、连字符等微小差异
混合匹配（Stage 3）：40%字符相似度 + 60%词汇重叠度的加权得分

最终以0.8分作为"强匹配"阈值——在实际数据中，0.8分基本对应"相同品牌 + 相同产品"的匹配精度。

3.2 核心数据

研究从约5,000个ChatGPT轮播中提取了43,000个商品，同时抓取了对应Shopping Fan-out在Google和Bing上各自前40名的自然购物结果（排除付费广告），进行交叉比对：

Google精确标题匹配率：45.8%
Google强匹配率（≥0.8）：83%以上
Bing精确标题匹配率：0.48%
Bing强匹配率：约11%
Bing独有商品数：仅70个（占总量0.16%）

这意味着在几乎所有Bing找到匹配的案例中，Google已经提供了相同的商品。ChatGPT从Bing Shopping获取商品数据的可能性极低。

3.3 位置偏好：Google Shopping排名越高，越容易入选

研究进一步分析了ChatGPT轮播位置与Google Shopping排名的关系：

轮播第1位的商品，平均对应Google Shopping第5名左右
60%的强匹配来自Google Shopping前10名
84%的强匹配来自Google Shopping前20名
轮播位置与Google Shopping排名呈明显正相关——排名越高的商品越容易出现在轮播靠前位置

保哥划重点：如果你的产品能稳定在Google Shopping自然排名前10，那么被ChatGPT推荐的概率会大幅提升。前20名是基本门槛，前10名是核心竞争区。

3.4 品牌词与非品牌词的表现差异

研究还对比了品牌词（如"Nike跑鞋"）和非品牌词（如"最佳跑步耳机"）的匹配表现，发现两者的匹配率差异很小，非品牌词略高。这意味着这种从Google Shopping获取商品数据的行为是系统性的架构设计，不因查询类型或品类而改变。

四、技术架构推演：ChatGPT的购物推荐是怎么工作的

基于上述研究数据和行业逆向工程发现，保哥梳理出ChatGPT购物推荐的完整技术流程：

用户输入Prompt（如"推荐一款500美元以下的智能手机"）
    │
    ▼
┌─────────────────────────────────┐
│  Sonic Classifier（意图分类器）    │
│  判断是否为购物意图               │
└──────────┬──────────────────────┘
           │
    ┌──────┴──────┐
    ▼              ▼
[Search Fan-out]  [Shopping Fan-out]
    │              │
    ▼              ▼
Google Web Search  Google Shopping
（检索评测、口碑）  （检索商品列表）
    │              │
    ▼              ▼
┌─────────────────────────────────┐
│  RRF Fusion（综合排序）           │
│  结合商品数据 + 上下文情感/口碑    │
│  生成最终轮播排序                 │
└─────────────────────────────────┘
    │
    ▼
输出：8个商品的轮播 + 文字推荐理由

关键技术组件包括：

Mercury Shopping模块：负责处理购物类请求和商品轮播渲染
RRF（Reciprocal Rank Fusion）：将来自不同搜索源的结果进行综合排序
Entity Linking（实体链接）：将商品与Google Shopping中的结构化数据进行匹配

这套架构在过去至少4个月内保持稳定，横跨服饰鞋类、母婴、美妆、电子产品、家居、办公用品、宠物用品、运动户外、玩具等10个垂直领域。

五、实战策略：电商品牌如何优化AI购物可见性

理解了底层机制，保哥接下来给出一套完整的优化策略框架。核心逻辑很简单：优化Google Shopping排名 = 优化ChatGPT购物推荐入选率。

5.1 Google Merchant Center产品数据优化

这是一切的基础。AI系统无法解析模糊的营销文案，它需要的是结构化、精确的产品数据。

标题优化公式：品牌名 + 产品型号 + 核心属性（尺寸/颜色/材质）

例如：❌ "超值爆款轻薄笔记本" → ✅ "联想ThinkPad X1 Carbon Gen 12 14英寸 i7-1365U 16GB 512GB 黑色"

关键属性必须填写完整：

GTIN（全球贸易项目代码）：正确填写可提升28%的合格流量
material（材质）：回答"这个是什么材质的？"
product_weight（重量）：回答"有轻量款吗？"
product_detail（产品细节）：提供AI可解析的规格信息
shipping（配送信息）：准确的时效和费用，可触发"免费快速配送"标签
return_policy（退货政策）：可触发"免费退货"标签

保哥的建议：目标是让你的Top商品达到95%以上的属性完成度。Google Merchant Center有数百个可填属性，大多数卖家只填了10-15个，这就是你超越竞争对手的差异化空间。

5.2 产品Feed的持续维护

AI系统信任实时、准确的数据。产品Feed不是一次性工作，而是需要持续同步的运营任务。

开启Google Merchant Center的自动商品更新（Automatic Item Updates），防止因价格或库存不匹配导致商品被下架
定期审查"需要关注（Needs Attention）"面板，及时修复数据错误和政策违规
确保Landing Page上的Schema标记与Feed数据一致
使用补充Feed为特定商品添加自定义标签和促销ID

5.3 面向AI的结构化内容策略

ChatGPT的Search Fan-out会检索评测、口碑、比较类内容，这些信息很可能影响最终的轮播排序。因此，传统SEO内容策略需要升级：

内容类型优先级（按AI引用权重排序）：

用户生成内容（UGC）：真实的用户评价和评分，这是LLM给予最高权重的内容类型
第三方评测和媒体报道：KOL评测、行业媒体的产品报道
品牌自有内容：产品页面、品牌博客——虽然权重最低，但仍然是基础

实操建议：

在产品页面使用HTML表格和JSON-LD Schema呈现产品规格，而非将规格藏在图片或折叠面板中
围绕"best + 品类 + 年份"、"品类 + 对比"、"品类 + 评测"等Fan-out高频触发词创建内容
积极鼓励真实用户评价，尤其是包含具体使用场景描述的评价
在Reddit、YouTube等平台建立真实的产品讨论和评测内容——AI系统会主动检索这些平台

5.4 理解Fan-out触发词，精准布局内容

研究表明，只有约31%的ChatGPT Prompt会触发网络搜索。以下是最容易触发搜索的关键词和场景：

高频触发词：reviews、2026、free、features、comparison
本地意图查询：59%的触发率（最高类别）
购物意图查询：包含价格、预算、推荐等词的Prompt几乎必定触发Shopping Fan-out

保哥的策略：围绕这些触发模式创建内容矩阵。例如，如果你卖跑步耳机，就要确保你在"best running headphones 2026 review"、"running headphones comparison features"这类查询中有高质量内容。

5.5 监测你的AI购物可见性

2026年已经出现了一批专门追踪AI购物可见性的工具，能监测你的产品是否出现在ChatGPT、Perplexity、Google AI Overviews等平台的推荐中。保哥建议关注以下监测维度：

轮播出现率：你的产品在多少比例的相关查询中出现在ChatGPT轮播
轮播位置：出现在第几位（前4位价值远高于后4位）
引用来源追踪：AI推荐你的产品时引用了哪些信息源
竞品对比：竞争对手在相同查询中的轮播表现

六、更大的棋局：AI购物生态的竞争格局

6.1 不只是ChatGPT

2026年3月，Meta也开始测试其AI购物助手功能，用户可以在Meta AI中通过对话方式获取商品推荐，展示形式同样是带有图片、品牌、价格的商品轮播。Google自身的AI Mode也在不断强化购物体验。

OpenAI推出了"Shopping Research"功能并与PayPal合作推进"Instant Checkout"——目标是让用户从提问到下单全部在ChatGPT内完成。Google则通过Universal Commerce Protocol（UCP）与Shopify合作，建立AI代理商务的标准化协议。

保哥的判断是：2026年的电商竞争焦点，正在从"哪个平台搜索体验更好"转向"哪个AI助手卖货更强"。无论哪个平台最终胜出，Google Shopping作为底层商品数据基础设施的地位只会更加重要。

6.2 从"可搜索"到"AI就绪"

传统电商SEO关注的是关键词密度和外链质量。但在AI购物时代，你的产品数据需要满足一个新标准：机器可读性。

LLM不会像人类一样浏览你的网页——它将你的产品信息转化为向量嵌入（Vector Embeddings），在高维语义空间中与用户查询进行匹配。这意味着你的产品描述需要：

包含精确的、可量化的属性（"1200支埃及棉"而非"高品质面料"）
使用结构化数据格式（Schema.org标记、JSON-LD）
覆盖真实的用户使用场景和FAQ
在多个高权威的第三方平台上有一致的正面信息

七、保哥总结：现在就开始行动

让保哥用最简洁的方式总结本文的核心要点：

发现层面：ChatGPT购物轮播83%的商品来自Google Shopping前40名自然排名，60%来自前10名。这是跨品类、跨品牌词/非品牌词的系统性架构行为。

机制层面：ChatGPT运行独立的Shopping Query Fan-out管道，与文字内容检索完全分离。平均每个Prompt只需1次Shopping Fan-out即可填满轮播。

策略层面：

首要任务——优化Google Merchant Center产品数据，目标95%+属性完成度
核心动作——提升Google Shopping自然排名，争进前10名
内容策略——围绕Fan-out触发词创建结构化评测、对比内容
UGC建设——积极获取真实用户评价，在Reddit/YouTube等平台建立品牌讨论
持续监测——使用AI可见性工具追踪轮播出现率和位置变化

AI购物不是在颠覆产品搜索，而是在重新包装它。底层数据源没变——还是Google Shopping。变化的是入口和呈现方式。理解了这一点，你就有了在AI购物时代的竞争策略基础。

那些现在就开始优化Google Shopping数据、建设结构化内容、积累真实口碑的品牌，将在AI购物时代拥有显著的先发优势。就像SEO早期一样，先行者吃肉，后来者喝汤。

保哥建议：别再观望了，现在就去审查你的Google Merchant Center，把这篇文章的策略落地执行起来。