ChatGPT购物轮播的秘密:83%商品数据来自Google Shopping
引言:AI购物时代,你的商品被谁"选中"?
各位做电商和SEO的朋友,保哥今天要跟大家聊一个对电商行业影响深远的发现。
2026年3月,一项覆盖超过43,000个ChatGPT购物轮播商品、横跨10个垂直行业的大规模研究,揭示了一个令人震惊的事实——ChatGPT购物轮播中83%以上的商品,直接来源于Google Shopping的自然排名结果。而Bing Shopping的贡献率仅为11%,且其中仅有70个商品(占比0.16%)是Bing独有的。
这意味着什么?如果你是电商从业者、品牌方、或数字营销人,你在Google Shopping上的排名直接决定了你的产品能否出现在ChatGPT的购物推荐中。这不是猜测,这是由43,000+商品数据支撑的系统性架构行为。
保哥今天将深入拆解这项研究的技术细节,分析Shopping Query Fan-out的工作机制,并给出一套可落地的优化策略,帮助你的产品在AI购物时代抢占先机。
一、背景:ChatGPT搜索的"隐秘管道"
1.1 ChatGPT并非自建搜索引擎
很多人以为ChatGPT有自己独立的搜索索引,但事实远非如此。OpenAI的产品负责人Nick Turley在美国司法部诉Google的反垄断案中承认,OpenAI距离用自有索引回答80%的搜索查询"还有数年之遥"。
那ChatGPT的搜索数据从哪来?早在2025年8月,业内就已发现OpenAI通过一家名为SerpApi的第三方服务抓取Google搜索结果,用于支撑ChatGPT的实时信息检索。Google甚至在2024年12月对SerpApi提起诉讼,指控其每天抓取数亿次搜索请求。
讽刺的是,Google曾在2024年明确拒绝了OpenAI直接使用其Search API的请求,但OpenAI转而通过SerpApi间接获取了同样的数据。这是AI搜索竞争中最耐人寻味的一个侧面。
1.2 神秘字段 id_to_token_map 的发现
2025年11月,多位AI逆向工程研究者在ChatGPT的源代码中发现了一个名为 id_to_token_map 的字段。对其进行Base64解码后,发现其中包含了Google Shopping的标准参数结构,如 productid、offerid,以及语言/地区参数。更关键的是,该字段还暴露了用于查询该商品的搜索词。
研究者通过这些参数成功还原了完整的Google Shopping链接,并验证这些链接指向的商品与ChatGPT轮播中展示的商品完全一致。这是第一个直接证据,表明ChatGPT的购物轮播在底层就是从Google Shopping拉取数据。
二、Shopping Query Fan-out机制深度解析
2.1 什么是Query Fan-out?
Query Fan-out(查询扇出)是ChatGPT处理用户提问时的核心机制。当用户输入一个Prompt,ChatGPT并不会直接用原始提问去检索——它会将用户的意图拆解为多个子查询,分别发送到搜索引擎,收集结果后再综合生成回答。
保哥举个例子:当你问ChatGPT"推荐500美元以下的最佳智能手机",它在后台可能会生成这样几组搜索:
smartphones under $500 usd→ 发往Google Shoppingbest budget smartphones 2026 reviews→ 发往Google Web Searchsmartphone comparison under 500 dollars features→ 发往Google Web Search
前者是Shopping Fan-out,后两者是Search Fan-out。它们是两条完全独立的检索管道。
2.2 两种Fan-out的本质区别
这项研究分析了110万条Shopping Query Fan-out数据,与同一Prompt对应的普通Search Fan-out进行了比较。结论非常清晰:
| 维度 | Shopping Fan-out | Search Fan-out |
|---|---|---|
| 与用户原始Prompt不同的比例 | 99.70% | — |
| 与普通Search Fan-out不同的比例 | 98.31% | — |
| 平均查询词数 | 7个词 | 12个词 |
| 每个Prompt平均使用次数 | 1.16次 | 2.4次 |
这组数据说明什么?
Shopping Fan-out是一条专门的商品检索管道,它与负责生成文字回答的Search Fan-out在架构上是完全分离的。Shopping Fan-out更短、更精准,因为它的目标很明确——在Google Shopping的商品索引中检索结构化的商品列表。而Search Fan-out更长、更具上下文性,因为它需要检索足够丰富的网页内容,以支撑向量搜索和重排序(Re-ranking)。
保哥的理解是:ChatGPT实际上运行着一个"双管道"架构——一条管道负责"找商品"(Shopping Fan-out → Google Shopping),另一条负责"找信息"(Search Fan-out → Google Web Search)。最终的轮播商品选择,很可能是先通过Shopping Fan-out获取候选商品集,再结合Search Fan-out中获取的商品口碑、评测信息进行最终排序。
2.3 一页Google Shopping结果就够了
研究还发现,平均每个Prompt只触发1.16次Shopping Fan-out。也就是说,ChatGPT通常只用一次Google Shopping搜索,就能填满8个商品的轮播位。这进一步验证了Google Shopping自然排名前40位是ChatGPT选品的主要候选池。
三、核心发现:83%匹配率背后的数据真相
3.1 研究方法论
为了确保结论的可靠性,研究团队采用了严谨的三阶段匹配算法:
- 精确匹配(Stage 1):去除空格后大小写不敏感的字符串完全相等,得分1.0
- 近似精确匹配(Stage 2):使用Python SequenceMatcher,相似度≥0.95即视为匹配,用于捕捉标点、连字符等微小差异
- 混合匹配(Stage 3):40%字符相似度 + 60%词汇重叠度的加权得分
最终以0.8分作为"强匹配"阈值——在实际数据中,0.8分基本对应"相同品牌 + 相同产品"的匹配精度。
3.2 核心数据
研究从约5,000个ChatGPT轮播中提取了43,000个商品,同时抓取了对应Shopping Fan-out在Google和Bing上各自前40名的自然购物结果(排除付费广告),进行交叉比对:
- Google精确标题匹配率:45.8%
- Google强匹配率(≥0.8):83%以上
- Bing精确标题匹配率:0.48%
- Bing强匹配率:约11%
- Bing独有商品数:仅70个(占总量0.16%)
这意味着在几乎所有Bing找到匹配的案例中,Google已经提供了相同的商品。ChatGPT从Bing Shopping获取商品数据的可能性极低。
3.3 位置偏好:Google Shopping排名越高,越容易入选
研究进一步分析了ChatGPT轮播位置与Google Shopping排名的关系:
- 轮播第1位的商品,平均对应Google Shopping第5名左右
- 60%的强匹配来自Google Shopping前10名
- 84%的强匹配来自Google Shopping前20名
- 轮播位置与Google Shopping排名呈明显正相关——排名越高的商品越容易出现在轮播靠前位置
保哥划重点:如果你的产品能稳定在Google Shopping自然排名前10,那么被ChatGPT推荐的概率会大幅提升。前20名是基本门槛,前10名是核心竞争区。
3.4 品牌词与非品牌词的表现差异
研究还对比了品牌词(如"Nike跑鞋")和非品牌词(如"最佳跑步耳机")的匹配表现,发现两者的匹配率差异很小,非品牌词略高。这意味着这种从Google Shopping获取商品数据的行为是系统性的架构设计,不因查询类型或品类而改变。
四、技术架构推演:ChatGPT的购物推荐是怎么工作的
基于上述研究数据和行业逆向工程发现,保哥梳理出ChatGPT购物推荐的完整技术流程:
用户输入Prompt(如"推荐一款500美元以下的智能手机")
│
▼
┌─────────────────────────────────┐
│ Sonic Classifier(意图分类器) │
│ 判断是否为购物意图 │
└──────────┬──────────────────────┘
│
┌──────┴──────┐
▼ ▼
[Search Fan-out] [Shopping Fan-out]
│ │
▼ ▼
Google Web Search Google Shopping
(检索评测、口碑) (检索商品列表)
│ │
▼ ▼
┌─────────────────────────────────┐
│ RRF Fusion(综合排序) │
│ 结合商品数据 + 上下文情感/口碑 │
│ 生成最终轮播排序 │
└─────────────────────────────────┘
│
▼
输出:8个商品的轮播 + 文字推荐理由关键技术组件包括:
- Mercury Shopping模块:负责处理购物类请求和商品轮播渲染
- RRF(Reciprocal Rank Fusion):将来自不同搜索源的结果进行综合排序
- Entity Linking(实体链接):将商品与Google Shopping中的结构化数据进行匹配
这套架构在过去至少4个月内保持稳定,横跨服饰鞋类、母婴、美妆、电子产品、家居、办公用品、宠物用品、运动户外、玩具等10个垂直领域。
五、实战策略:电商品牌如何优化AI购物可见性
理解了底层机制,保哥接下来给出一套完整的优化策略框架。核心逻辑很简单:优化Google Shopping排名 = 优化ChatGPT购物推荐入选率。
5.1 Google Merchant Center产品数据优化
这是一切的基础。AI系统无法解析模糊的营销文案,它需要的是结构化、精确的产品数据。
标题优化公式:品牌名 + 产品型号 + 核心属性(尺寸/颜色/材质)
例如:❌ "超值爆款轻薄笔记本" → ✅ "联想ThinkPad X1 Carbon Gen 12 14英寸 i7-1365U 16GB 512GB 黑色"
关键属性必须填写完整:
- GTIN(全球贸易项目代码):正确填写可提升28%的合格流量
- material(材质):回答"这个是什么材质的?"
- product_weight(重量):回答"有轻量款吗?"
- product_detail(产品细节):提供AI可解析的规格信息
- shipping(配送信息):准确的时效和费用,可触发"免费快速配送"标签
- return_policy(退货政策):可触发"免费退货"标签
保哥的建议:目标是让你的Top商品达到95%以上的属性完成度。Google Merchant Center有数百个可填属性,大多数卖家只填了10-15个,这就是你超越竞争对手的差异化空间。
5.2 产品Feed的持续维护
AI系统信任实时、准确的数据。产品Feed不是一次性工作,而是需要持续同步的运营任务。
- 开启Google Merchant Center的自动商品更新(Automatic Item Updates),防止因价格或库存不匹配导致商品被下架
- 定期审查"需要关注(Needs Attention)"面板,及时修复数据错误和政策违规
- 确保Landing Page上的Schema标记与Feed数据一致
- 使用补充Feed为特定商品添加自定义标签和促销ID
5.3 面向AI的结构化内容策略
ChatGPT的Search Fan-out会检索评测、口碑、比较类内容,这些信息很可能影响最终的轮播排序。因此,传统SEO内容策略需要升级:
内容类型优先级(按AI引用权重排序):
- 用户生成内容(UGC):真实的用户评价和评分,这是LLM给予最高权重的内容类型
- 第三方评测和媒体报道:KOL评测、行业媒体的产品报道
- 品牌自有内容:产品页面、品牌博客——虽然权重最低,但仍然是基础
实操建议:
- 在产品页面使用HTML表格和JSON-LD Schema呈现产品规格,而非将规格藏在图片或折叠面板中
- 围绕"best + 品类 + 年份"、"品类 + 对比"、"品类 + 评测"等Fan-out高频触发词创建内容
- 积极鼓励真实用户评价,尤其是包含具体使用场景描述的评价
- 在Reddit、YouTube等平台建立真实的产品讨论和评测内容——AI系统会主动检索这些平台
5.4 理解Fan-out触发词,精准布局内容
研究表明,只有约31%的ChatGPT Prompt会触发网络搜索。以下是最容易触发搜索的关键词和场景:
- 高频触发词:reviews、2026、free、features、comparison
- 本地意图查询:59%的触发率(最高类别)
- 购物意图查询:包含价格、预算、推荐等词的Prompt几乎必定触发Shopping Fan-out
保哥的策略:围绕这些触发模式创建内容矩阵。例如,如果你卖跑步耳机,就要确保你在"best running headphones 2026 review"、"running headphones comparison features"这类查询中有高质量内容。
5.5 监测你的AI购物可见性
2026年已经出现了一批专门追踪AI购物可见性的工具,能监测你的产品是否出现在ChatGPT、Perplexity、Google AI Overviews等平台的推荐中。保哥建议关注以下监测维度:
- 轮播出现率:你的产品在多少比例的相关查询中出现在ChatGPT轮播
- 轮播位置:出现在第几位(前4位价值远高于后4位)
- 引用来源追踪:AI推荐你的产品时引用了哪些信息源
- 竞品对比:竞争对手在相同查询中的轮播表现
六、更大的棋局:AI购物生态的竞争格局
6.1 不只是ChatGPT
2026年3月,Meta也开始测试其AI购物助手功能,用户可以在Meta AI中通过对话方式获取商品推荐,展示形式同样是带有图片、品牌、价格的商品轮播。Google自身的AI Mode也在不断强化购物体验。
OpenAI推出了"Shopping Research"功能并与PayPal合作推进"Instant Checkout"——目标是让用户从提问到下单全部在ChatGPT内完成。Google则通过Universal Commerce Protocol(UCP)与Shopify合作,建立AI代理商务的标准化协议。
保哥的判断是:2026年的电商竞争焦点,正在从"哪个平台搜索体验更好"转向"哪个AI助手卖货更强"。无论哪个平台最终胜出,Google Shopping作为底层商品数据基础设施的地位只会更加重要。
6.2 从"可搜索"到"AI就绪"
传统电商SEO关注的是关键词密度和外链质量。但在AI购物时代,你的产品数据需要满足一个新标准:机器可读性。
LLM不会像人类一样浏览你的网页——它将你的产品信息转化为向量嵌入(Vector Embeddings),在高维语义空间中与用户查询进行匹配。这意味着你的产品描述需要:
- 包含精确的、可量化的属性("1200支埃及棉"而非"高品质面料")
- 使用结构化数据格式(Schema.org标记、JSON-LD)
- 覆盖真实的用户使用场景和FAQ
- 在多个高权威的第三方平台上有一致的正面信息
七、保哥总结:现在就开始行动
让保哥用最简洁的方式总结本文的核心要点:
发现层面:ChatGPT购物轮播83%的商品来自Google Shopping前40名自然排名,60%来自前10名。这是跨品类、跨品牌词/非品牌词的系统性架构行为。
机制层面:ChatGPT运行独立的Shopping Query Fan-out管道,与文字内容检索完全分离。平均每个Prompt只需1次Shopping Fan-out即可填满轮播。
策略层面:
- 首要任务——优化Google Merchant Center产品数据,目标95%+属性完成度
- 核心动作——提升Google Shopping自然排名,争进前10名
- 内容策略——围绕Fan-out触发词创建结构化评测、对比内容
- UGC建设——积极获取真实用户评价,在Reddit/YouTube等平台建立品牌讨论
- 持续监测——使用AI可见性工具追踪轮播出现率和位置变化
AI购物不是在颠覆产品搜索,而是在重新包装它。底层数据源没变——还是Google Shopping。变化的是入口和呈现方式。理解了这一点,你就有了在AI购物时代的竞争策略基础。
那些现在就开始优化Google Shopping数据、建设结构化内容、积累真实口碑的品牌,将在AI购物时代拥有显著的先发优势。就像SEO早期一样,先行者吃肉,后来者喝汤。
保哥建议:别再观望了,现在就去审查你的Google Merchant Center,把这篇文章的策略落地执行起来。