AI会不会推荐根本不存在的品牌?虚构品牌与幻觉商品的实测和应对
本文目录
- 先讲个真事:AI张口就来一个查无此人的品牌
- “虚构品牌”到底长什么样——三种形态
- 有多普遍?把公开研究里的数字摆出来
- 分引擎差异:开源模型比商用模型能编得多
- 换个问法,AI反而能编得更凶
- 品牌是怎么被“揉坏”的:省略、拼接、说错规格
- 为什么AI会凭空造出一个品牌?
- 最危险的是“可复现的幻觉”:43%每次都编同一个名字
- slopsquatting:黑产已经在抢注这些幻觉名字了
- 这跟做品牌的你到底有什么关系?三条真实威胁
- 反过来看:虚构品牌其实是一张“需求地图”
- 算笔账:一个品类里每五个推荐有一个是编的,意味着什么
- 应对第一步:让AI认识真实的你——实体grounding
- 应对第二步:抢占品类实体空位,别让幻觉替你回答
- 应对第三步:监测“AI版的你”——品牌幻觉审计怎么做
- 应对第四步:被张冠李戴时,主动纠偏
- 落地节奏:一个季度把品牌幻觉审计跑起来
- 一个容易踩的误区:别把所有没听过的名字都当幻觉
- 这事会越来越严重,而不是自己好转
- 保哥的判断清单:遇到AI给的品牌/产品名,先过这几关
- 写在最后:把幻觉从威胁翻译成动作
- 常见问题解答
- AI推荐的品牌不存在,是模型太差还是普遍现象?
- 我的品牌被AI改写或和别人搞混了,能改吗?
- 虚构品牌对我的SEO/GEO到底有没有实质伤害?
- 什么是slopsquatting,和我做电商有关系吗?
- 怎么找出AI在我品类里最容易编造品牌的地方?
- 把自己的实体做清晰,真能减少被幻觉替代吗?
- 权威参考资料
摘要:AI助手不只会编造不存在的链接,它还会张口就来一个查无此人的品牌、报出一款根本没上市的型号。这不是偶发的口误,而是可测、可复现、甚至已经被黑产盯上的系统性现象。公开研究里,代码大模型给出的包名有19.7%是凭空捏造的,商用模型平均5.2%、开源模型高达21.7%;把大模型当商品推荐器用时,个别引擎在美妆品类的虚构商品率能冲到22.88%。本文把这些可核实的数字摆清楚,拆开AI为什么会造出一个品牌的底层机制,再从做品牌、做独立站的角度讲清楚:虚构品牌对你既是威胁,也是一张标好了空位的需求地图,以及怎么用实体优化把这张地图变成自己的入口。
先讲个真事:AI张口就来一个查无此人的品牌
去年帮一个做户外储能的客户看AI搜索表现,保哥随手问了句“预算3000以内有哪些便携电站值得买”。答案列了六个品牌,前五个都认识,第六个叫得有模有样、参数写得头头是道,容量、循环次数、质保年限一应俱全,唯独——这个牌子在全网任何地方都不存在。不是小众、不是刚成立,是彻底的无中生有。追问一句“官网地址给一下”,它又利索地编了个域名,点进去404。
这事第一反应是好笑,笑完后背有点凉。因为在那个消费者眼里,这个虚构品牌和真实存在的五个品牌被摆在了同一张推荐名单上,享受了同等的信任待遇。它凭空占了一个本该属于某个真品牌的坑位。如果你是那个“本该被推荐却没进名单”的真品牌,你连自己输给了谁都不知道——因为对手根本不存在。
AI会编造不存在的链接,这件事我们在另一篇里已经拆过:断链、张冠李戴、虚构出处。而编造品牌和商品,是同一台机器同一套毛病落在了“实体”这个更要命的地方——链接编错了顶多点不开,品牌编错了,是直接改写了用户对整个品类的认知。
“虚构品牌”到底长什么样——三种形态
把这一年攒下来的案例归归类,AI编造品牌和商品大致三种形态,威胁程度递增:
- 完全捏造型:品牌名、型号、参数全是无中生有,现实里没有任何对应实体。上面那个储能品牌就是。这种最好识别,一搜就穿帮。
- 张冠李戴型:品牌是真的,但被安上了它根本没有的产品、没做过的功能、没说过的承诺。比如把A品牌的旗舰型号说成B品牌出的,或者给一个真实工具编了个它没有的定价套餐。这种最阴险,因为半真半假,用户核到品牌是真的就放松了警惕。
- 嫁接混淆型:把两个真实品牌的名字揉成一个新词,或者把你的品牌名拼错、改写成一个相近的名字。你叫NorthPeak,它推荐成NorthPeak Pro或者NorthPeaks——听着像你,用户也以为是你,实际指向一个不存在的实体。
这三种里,后两种和真品牌的关系最紧。它们不是在真空里瞎编,而是在你的实体信息不够清晰、不够完整的地方,AI自己脑补了一块填进去。哪里信息稀薄,哪里就容易长出幻觉——这句话记住,后面讲应对全靠它。
有多普遍?把公开研究里的数字摆出来
光讲故事没用,会显得像个例。好在这方面已经有相当扎实的量化研究,数字比直觉吓人得多。
最系统的一份来自2025年USENIX安全会议上那篇《We Have a Package for You!》,研究者用16个主流代码大模型生成了57.6万份代码样本,一共223万次软件包推荐。结果是:其中 440,445次(19.7%)推荐的包名根本不存在,去重之后是 205,474个唯一的虚构包名。你没看错,二十多万个被AI凭空造出来、却被它当真货推荐出去的名字。这项由多所大学团队完成的研究,正式发表在2025年USENIX安全会议上,这篇论文完整披露了机制和数据,是目前这个领域被引用最多的一手来源之一。
软件包是“品牌/产品”在代码世界里的等价物——你pip install一个包,本质和消费者“买某个牌子”是一样的动作:信任一个名字,去一个地方拿东西。这个19.7%的坏账率,就是AI在实体推荐上出错的一个硬指标。
再看更贴近电商的场景。另一篇评估大模型当商品推荐器的研究把不存在的商品率单独拎出来测:多数模型控制在5%以下,GPT-4o只有0.46%、Claude 3 Haiku 0.88%、Qwen2-7b 1.66%、Llama3-70b 3.44%——但Mistral-7b是个异类,在美妆品类的虚构商品率飙到约22.88%。也就是说,你随便问一个跑在这类开源模型上的导购助手,它给你的每五个商品名里,可能就有一个是编的。
分引擎差异:开源模型比商用模型能编得多
上面两组数字其实指向同一个规律——不同引擎的编造能力差着一个数量级。USENIX那篇把模型分成两拨对比得很清楚:
| 模型类别 | 虚构实体率(约) | 说明 |
|---|---|---|
| 商用闭源模型 | 5.2% | 训练更精、对齐更狠,克制得多 |
| 开源模型 | 21.7% | 平均值,是商用的四倍多 |
| 个别开源模型(如Mistral系) | 最高22%+ | 某些品类里近乎每五个推荐一个假 |
这个差异对做出海、做GEO的人有直接的战术含义:你的目标用户在用哪个引擎,决定了你面对的幻觉密度。如果你的品类里大量用户在用便宜的开源模型驱动的比价工具、导购插件,那这些工具编造竞品、编造你的假型号的概率,比ChatGPT官方版要高好几倍。别只盯着头部那几个模型的表现,长尾工具才是幻觉泛滥的重灾区。
顺带说一句,这也解释了为什么同一个问题在不同AI里答案差那么远——不是它们对你的评价不同,而是它们编东西的手松手紧不同。多引擎布局这件事,我们在“被检索和被引用”那篇里讲过分渠道打法,这里再加一条:还得分渠道估幻觉风险。
换个问法,AI反而能编得更凶
还有个反直觉的发现,值得单独拎出来:给AI更多示例、把问题问得更“专业”,有时候不但不会降低幻觉,反而会放大它。
那篇评估大模型当推荐器的研究测了一个对比——同样的模型,在零样本(直接问)和少样本(给几个示例再问)两种设定下的虚构商品率。结果是有些模型在少样本设定下的幻觉率显著飙升,个别模型在美妆和本地生活品类分别冲到约16.58%和17.52%,比它们在简单问法下高出一大截。原因不难理解:你给的示例本身给了模型一个“照着这个格式往下编”的模板,它会顺着模板把细节填满,哪怕这些细节根本没有真实对应。
这对做内容和做导购工具的人是个实在的提醒:问法越复杂、上下文越长,不等于答案越可靠,有时恰恰相反。如果你在自己的站点里接了AI导购、AI客服,喂给它的商品示例和提示词模板,本身就可能是在教它怎么编得更像。示例要给真货、给全信息,别给一个漂亮的空壳让它照着造。
品牌是怎么被“揉坏”的:省略、拼接、说错规格
嫁接混淆型幻觉不是随机乱来,它有几个稳定的“变形手法”。同一份推荐器研究把AI说错商品的典型错误归了类,搬到品牌上一样成立:
- 省略:把你的完整品牌名或型号砍掉一截。“NorthPeak Outdoor Pro” 被说成 “NorthPeak”,听着还是你,指向的却可能是另一个实体或一个不完整、搜不到的名字。
- 拼接:把两个真实名字揉成一个。你的品牌加上另一个热门品牌的后缀,拼出一个既不是你也不是它的四不像,用户以为是某种联名或子系列。
- 说错规格:品牌是对的,参数是编的。容量、尺寸、续航、材质被随手改掉一个数,看着专业,实则误导。用户按这个错参数去比价、去决策,最后失望还算在你头上。
这三种变形之所以危险,是因为它们都以一个真实锚点为起点,再往外长歪。防它们的办法,还是回到实体的一致性:你的品牌名、型号、核心规格在全网写法越统一、结构化程度越高,模型能揉坏的空间就越小。反过来,你自己的页面上型号写法都五花八门,就别怪AI帮你再乱一手。
为什么AI会凭空造出一个品牌?
要应对,先得懂它的病理。AI编造品牌不是“记错了”,而是它的生成方式决定的,主要四个原因叠在一起:
- 它本质是在猜下一个字,不是在查数据库。大模型生成品牌名时,走的是“这个位置最像出现什么词”的概率路径,而不是“数据库里有没有这个实体”的检索路径。一个符合命名习惯的假品牌,在概率上和真品牌几乎没区别。
- 品牌名太好编了。North + Peak、Aqua + Flow、Eco + Volt,英文品牌命名本身就有强烈的构词规律,模型学到这套规律后,造一个以假乱真的名字毫不费力。这也是为什么幻觉品牌听着都特别“正经”。
- 训练数据稀疏的地方,脑补最凶。冷门品类、新兴市场、小众细分,真实实体在训练语料里出现得少,模型没有足够的真实锚点,就更倾向于自己填空。你所在的品类越窄,越容易被幻觉品牌“占坑”。
- 自回归会自我强化。模型前半句编了个品牌名,为了让后半句读起来连贯,它会顺着继续编参数、编卖点、编官网,一步错步步错,最后拼出一个细节丰满的假货。
把这四条连起来看,一个残酷的结论浮出来:幻觉品牌恰恰爱长在真实信息最稀薄的地方。而“真实信息稀薄”这件事,正是你可以下手改变的——这就是GEO应对的立足点。
最危险的是“可复现的幻觉”:43%每次都编同一个名字
如果幻觉只是随机噪声,那还好办,多问几次就露馅。真正让人后背发凉的是:这些幻觉是可复现的。
还是USENIX那篇,研究者把会触发幻觉的相同提示词重复跑了10次,结果是——43%的虚构包名每一次都会原样冒出来,58%至少复现不止一次,只有39%是真正的一次性随机。换句话说,同一个模型对同一个问题,会稳定地推荐同一个不存在的名字。这个稳定性,把一个“AI犯迷糊”的技术小毛病,直接升级成了一个可被利用的攻击面。
随机的错误只是噪声,可复现的错误就是接口。一旦幻觉稳定下来,任何人都能提前知道AI会推荐哪个假名字,然后——去把它变成真的。
slopsquatting:黑产已经在抢注这些幻觉名字了
顺着上面那个逻辑,坏人已经动手了。安全圈给这套打法起了个名字叫slopsquatting——AI稳定幻觉出某个不存在的包名,攻击者就抢先把这个名字在公共仓库里注册成真包,塞进恶意代码,坐等开发者照着AI的推荐install。
云安全联盟(CSA)那份研究简报详细记录了这条攻击链:攻击者先摸清哪些名字某个模型会反复幻觉出来,再抢注、投毒。已经有真实案例——一个叫unused-imports的恶意包,即便被npm标记冻结,仍在以每周约233次的下载量被真实开发者装进项目,来源就是AI的推荐。这不是理论推演,是正在发生的供应链攻击。
把这套逻辑平移到消费端,画面同样成立:AI稳定地幻觉出某个不存在的“品牌”或“型号”,投机者去把这个名字注册成域名、开个店、上个仿冒页,专门承接AI送来的、以为自己在买真货的流量。今天发生在npm上的事,明天就会发生在你的品类里。实体链接与消歧这个原本很学术的概念,一下子变成了品牌安全的前线问题。
这跟做品牌的你到底有什么关系?三条真实威胁
讲到这,得把镜头拉回到独立站主、DTC品牌、做GEO的人身上。虚构品牌不是别人的热闹,它至少从三个方向啃你的生意:
- 虚构竞品来占坑。你所在的品类里,AI每编出一个不存在的品牌塞进推荐名单,就少了一个真品牌(很可能是你)进名单的位置。你的曝光被一个空气对手偷走了。
- 你的品牌名被改写。嫁接混淆型幻觉会把你的名字拼错、加后缀、揉进别的词,用户以为找到了你,其实被导向一个不存在的实体,或者更糟——一个抢注了这个幻觉名的仿冒站。这类品牌被仿冒抢排名的攻防,我们在讲怎么把自己写成可信实体那篇里提过防御思路,AI时代它只会更常见。
- 张冠李戴毁口碑。AI把你没做过的差劲功能、没承诺过的政策安到你头上,用户信了、失望了,账却记在你的真品牌身上。你为一个自己从没说过的话背了锅。
三条里没有一条是你主动犯的错,但每一条的损失都由你真实承担。这就是AI幻觉最不讲理的地方。
反过来看:虚构品牌其实是一张“需求地图”
威胁讲完,换个角度——这也可能是这篇里最值钱的一句话。前面说过,幻觉爱长在真实信息最稀薄的地方。反过来推:AI在哪个品类、哪个细分需求上开始编品牌,就说明那个位置存在一个没被真实实体填满的空位。
这等于AI免费替你做了一次需求勘探。它编造品牌的每一处,都是在标注“这里有需求、但供给的实体信号不足,所以我只能自己造一个”。对一个想切入新品类、新市场的品牌来说,这是一张现成的、按机会密度标好的地图:
- 系统性地问AI你所在品类的各种购买场景,记录它开始编造品牌/型号的那些查询。
- 这些查询就是你的“实体真空区”——真实供给不足、AI被迫脑补的地方。
- 用真实的产品、真实的内容、清晰的实体信号去把这些空位填上,抢在幻觉和抢注者之前。
把AI的错误当成内容缺口的线索,这个思路我们在讲幻觉链接时用过一次,放到品牌上同样成立,而且价值更高——因为品牌层的空位,填进去就是一个可长期占据的心智入口。
算笔账:一个品类里每五个推荐有一个是编的,意味着什么
抽象的百分比没感觉,落到生意上算笔账。假设你的品类里,用户主要通过一个跑在开源模型上的导购工具做初筛,参照公开研究,这类场景的虚构实体率保守按20%估。一个月这个工具吐出10万次品牌推荐,那就是——
- 约2万次推荐指向了不存在的品牌或型号;
- 这2万次里,有相当一部分本可以是真实品牌(包括你)的曝光机会,被空气竞品截走;
- 其中稳定复现的那批(参照43%的复现率),随时可能被抢注者变成真实的仿冒落地页,把你品类的意向流量收走。
这笔账不需要精确到小数点,量级本身就足够说明问题:幻觉品牌不是零星意外,它在你品类里持续、稳定地漏走一部分本该属于真实供给的注意力和信任。而你之前可能连它存在都不知道,因为传统的排名监控、流量统计里,根本没有“我被一个不存在的对手打败了”这一栏。这也是为什么AI时代的SEO目标要从关键词转向“教AI认识你是谁”——你得先成为一个AI认得清、编不歪的实体,才谈得上不被空气对手替代。
应对第一步:让AI认识真实的你——实体grounding
治本的思路只有一个方向:把你这个真实实体的信号做强、做清晰,让模型在你这个位置有足够的真实锚点,不需要靠脑补填空。这在技术上叫实体grounding,落地有几件实事:
- 把Organization结构化数据做扎实。用Schema的 Organization类型把品牌名、别名(alternateName)、logo、创立信息、官方渠道都标清楚,尤其是sameAs——把你在维基数据、领英、各大平台的官方主页全部串起来,形成一个交叉验证的实体身份。
- 照Google的官方要求补齐组织标记。Google明确说过,Organization结构化数据能帮它理解并在搜索里消歧你的组织。消歧(disambiguation)这个词是关键——它正是幻觉的反义词。你把消歧信号喂够,模型就没那么容易把你和别人搞混、或者干脆编一个。
- 让品牌名和核心产品名在权威语料里反复、一致地出现。实体的可信度来自一致性。你的品牌名如果在不同页面写法不一、参数说法各异,等于亲手给幻觉留了缝。
一句话:你不做实体建设,AI就替你做,而且做得错漏百出。这块的完整审计方法,包括实体之间的关系怎么查,值得单独展开,这里先立住方向。
应对第二步:抢占品类实体空位,别让幻觉替你回答
光把自己做清晰还不够,还得主动去填前面那张需求地图上的空位。做法上:
- 针对那些AI会编造品牌的查询场景,做出真实、具体、可验证的内容——真实的选型指南、真实的对比、真实的规格页,让AI在这个位置有真货可引,而不是自己造。
- 把你的产品线覆盖到这些空位对应的细分需求上,哪怕先用一篇深度内容占住,也比让位给空气竞品强。
- 持续喂新,保持信息新鲜。实体真空区一旦被真实供给填满,模型自然就没了脑补的动机。
这一步的心法是:幻觉是供给不足的信号,最好的反制不是删幻觉,而是补供给。你没法直接编辑AI的脑子,但你能改变它读到的现实。
应对第三步:监测“AI版的你”——品牌幻觉审计怎么做
你没法管理你看不见的东西。所以得定期给“AI眼里的你”做体检,这套动作保哥团队内部叫品牌幻觉审计,不复杂:
- 建一组标准问题:围绕你的品牌名、核心产品、所在品类的典型购买场景,列20到50个问题。
- 跨引擎、按周问:在ChatGPT、Gemini、Perplexity以及你用户实际会用的那些垂直工具上都问一遍,记录答案。重点看三件事——它有没有编造竞品、有没有说错你的信息、有没有把你的名字改写。
- 标注和归档:把每一次幻觉记下来,分成“虚构竞品/张冠李戴/名字改写”三类,看哪类高发、在哪个引擎高发、随时间是好转还是恶化。
- 反推内容动作:每一处稳定的幻觉,都对应一个你要补的实体信号或内容空位。审计的产出不是一份焦虑报告,而是一张下个月的内容排期表。
这套审计和传统的排名监控是两码事。排名监控回答“我在第几位”,品牌幻觉审计回答“AI有没有在拿一个假的我糊弄用户”。AI时代,后一个问题往往更致命,可惜大多数人的监控仪表盘里根本没有这一栏。
应对第四步:被张冠李戴时,主动纠偏
如果审计发现AI把不属于你的东西安在了你头上,别干等它自己好。能做的事有先后:
- 正面权威页面把事实说清楚、说到位。在你自己的高权重页面上,用清晰、结构化、机器可读的方式把正确事实讲明白——你有什么、没有什么、承诺什么。给模型一个比幻觉更强、更一致的真实版本去覆盖。
- 用官方反馈渠道纠错。主流AI产品大多有内容反馈入口,发现明显的事实错误,正式提交纠正。单次可能没用,但同一个错误被多方持续纠正,会进入它们的评估和修正流程。
- 盯紧抢注。定期查那些嫁接混淆型幻觉对应的域名、店铺有没有被抢注仿冒,发现苗头及早用品牌保护和法律手段处理,别等它做大。
纠偏是场持久战,不会一次搞定,但方向清楚:你提供的真实信号越强、越一致、越权威,幻觉的生存空间就越小。
落地节奏:一个季度把品牌幻觉审计跑起来
方法讲了一堆,怕的是听着有理、动不了手。给一个能直接照搬的季度节奏,让这套东西从概念变成排期:
- 第1周,建基线:列出20到50个覆盖品牌名、核心产品、典型购买场景的问题,在3到4个主流引擎加上你用户实际会用的垂直工具上各问一遍,把答案原样存档。这就是你的第一份“AI眼里的我”。
- 第2到3周,标注定级:把每一处幻觉按“虚构竞品/名字改写/张冠李戴/说错规格”分类,标出高发引擎和高发场景,排出优先级——先治那些出现在高意向购买查询上的。
- 第4到8周,补供给补信号:针对高优先幻觉,一边补结构化数据和跨源一致的实体信息,一边产出真实内容去填对应的实体空位。这一步是主体工程,也是真正改变AI读到的现实的地方。
- 第9到12周,复测看趋势:把第1周那组问题原样再问一遍,对比幻觉是减少了、转移了还是恶化了。重点不是单次数字,是趋势——你的动作有没有让“AI版的你”更接近真实的你。
跑完一个季度,你手里会多两样东西:一张持续更新的品牌幻觉地图,和一套被验证过有没有用的应对动作。这比任何一次性的报告都值钱,因为它是活的。
再补个真实感的画面。前面那个户外储能客户,后来照这套节奏跑了一轮:先揪出AI在“露营用大容量电站”这个场景上反复编造的几个不存在的型号,确认这正是它产品线覆盖不够、内容也稀薄的空位;接着补了一组真实的选型对比和规格页,把Organization标记和sameAs补齐。一个季度后复测,那几个高频购买场景里,AI开始稳定地引到它的真实产品页,而不是继续报那个查无此人的假牌子。没有魔法,就是把真实信号做到了比幻觉更强而已。
一个容易踩的误区:别把所有没听过的名字都当幻觉
提醒一句反向的坑。做幻觉审计做出经验后,容易走到另一个极端——看见任何不认识的品牌名就判定是AI编的。这会误伤两类真实存在的东西:
- 新兴真品牌。市场每天都在冒新牌子,尤其在增长快的出海品类里,一个你没听过的名字很可能是刚起来的真实竞品,不查清楚就当幻觉,会让你错判竞争格局。
- 私有品牌和区域品牌。很多品牌只在特定渠道、特定地区存在,全网搜索证据薄,但它是真的。
所以判断一个AI给出的品牌是真是假,不能靠“我认不认识”,得靠可核实的证据链:有没有独立来源、有没有真实的商业实体痕迹、有没有一致的信息。这和识别AI幻觉的通用原则一致——不预设,只核验。
这事会越来越严重,而不是自己好转
有人可能想,模型一代代变强,幻觉是不是会慢慢消失?别太乐观。有几个结构性的原因,让品牌幻觉短期内更可能加剧而不是缓解:
- AI生成内容正在反哺训练语料。越来越多的网页本身就是AI写的,其中难免夹带幻觉品牌和错误参数。这些内容被抓进下一代模型的训练集,等于让模型跟着自己的错误学,形成一个越滚越大的污染循环。
- 新品类新品牌的产生速度,远快于模型的更新节奏。你所在的细分赛道每天都在冒新实体,而模型的知识有截止日期,中间这段真空期,正是它最爱脑补的地方。增长越快的市场,实体真空越普遍。
- 抢注者的动机在变强。只要AI送来的流量还在涨,把幻觉名字抢注成仿冒落地页的生意就有利可图,slopsquatting那套打法从代码世界蔓延到消费品世界,只是时间问题。
把这三条放一起看,结论很清楚:指望模型自己变好来解决品牌幻觉,是把自己的生意赌在别人的路线图上。真正能握在手里的,只有主动把自己的实体信号做强、做清晰、做到抢在幻觉前面。这不是一次性的项目,是AI时代品牌要长期做的基本功。
保哥的判断清单:遇到AI给的品牌/产品名,先过这几关
把上面的东西压缩成一张可以随手用的清单。下次AI甩给你一个品牌或型号,尤其是你打算据此做决策或写进内容时,先过这五关:
| 关卡 | 问自己 | 红旗信号 |
|---|---|---|
| 存在性 | 全网搜得到这个实体的独立证据吗? | 只有AI提过,别处零踪迹 |
| 一致性 | 不同来源对它的描述对得上吗? | 参数、定价各家说法打架 |
| 可达性 | 官网、店铺点得进去、是真的吗? | 域名404或刚注册的空壳 |
| 归属 | 安在某品牌头上的信息,官方认吗? | 官方渠道查无此说 |
| 复现性 | 换个引擎、换种问法还这么说吗? | 只有一个模型稳定这么说 |
五关里只要有两关亮红旗,就别急着信。这张清单不光防你自己被幻觉带偏,也是你给用户建立信任的机会——把“怎么辨别真假品牌”讲清楚,本身就是一种可信实体才做得出来的内容。
写在最后:把幻觉从威胁翻译成动作
这篇讲了不少数字和机制,但真正要带走的其实就三句话。第一,AI编造品牌和商品不是偶发失误,而是可测、可复现、已被黑产盯上的系统性现象——公开研究里的19.7%、21.7%、22.88%这些数字,都是硬指标,不是危言耸听。第二,幻觉爱长在真实信息最稀薄的地方,所以它每编一次,都在替你标注一个没被真实实体填满的需求空位——这是威胁,更是一张免费的机会地图。第三,你没法直接编辑AI的脑子,但你能改变它读到的现实:把实体信号做强做一致、把真实内容补到空位上、定期审计“AI版的你”并主动纠偏。
说到底,AI时代的品牌竞争,多了一个隐形赛道——不是和真实对手抢排名,而是和一个不断被凭空造出来的假版本抢“谁才是那个真的你”。谁把自己的实体做得更清晰、更权威、更难被揉坏,谁就更不容易被空气对手替代。这件事没有捷径,但方向足够清楚,早做早占位。
常见问题解答
AI推荐的品牌不存在,是模型太差还是普遍现象?
是普遍现象,且和模型档次相关但不由它单独决定。公开研究里,代码大模型的虚构实体率商用模型约5.2%、开源模型约21.7%,当推荐器用时个别开源模型在某些品类能到22%以上,头部商用模型则低于1%。所以既不能说“AI都不靠谱”,也不能盲信——取决于你用户在用哪个引擎,长尾垂直工具的幻觉密度往往远高于头部产品。
我的品牌被AI改写或和别人搞混了,能改吗?
能改善,很难瞬间根除。核心是做强实体信号:把Organization结构化数据、sameAs交叉链接、各渠道一致的品牌信息补齐,让模型在你这个位置有清晰的真实锚点。同时用官方反馈渠道持续纠错。这是场持久战,你提供的真实信号越强越一致,幻觉的空间就越小。
虚构品牌对我的SEO/GEO到底有没有实质伤害?
有,而且是隐形的。它偷走你本可获得的推荐位、可能把你的名字导向仿冒站、还可能把你没做过的差评安到你头上。麻烦在于这些损失不出现在传统排名和流量报表里,你往往连自己输给了一个不存在的对手都不知道,得靠专门的品牌幻觉审计才看得见。
什么是slopsquatting,和我做电商有关系吗?
slopsquatting是攻击者利用AI稳定幻觉出的名字,抢先注册成真包/真域名投毒的手法,最早在软件供应链里爆发。对电商的直接启示是:AI幻觉出的品牌名、型号名同样可能被抢注成仿冒店铺或域名,专门承接被AI误导的意向流量。定期监测和你品牌相关的幻觉名字有没有被抢注,是新的品牌保护动作。
怎么找出AI在我品类里最容易编造品牌的地方?
系统性地问。围绕你品类的各种购买场景列一组问题,跨多个引擎逐个问,记录AI开始编造品牌或型号的那些查询。这些查询就是你的“实体真空区”——真实供给不足、AI被迫脑补的地方,也正是你用真实内容和产品去抢占的机会点。等于AI免费帮你做了一次需求勘探。
把自己的实体做清晰,真能减少被幻觉替代吗?
能,这是目前最治本的方向。幻觉的病根是模型在真实信息稀薄处自己填空,你把这个位置的真实锚点做足——结构化数据、跨源一致的信息、持续更新的权威内容——模型就有真货可用,不必也不倾向于脑补。你没法直接编辑AI的记忆,但你能改变它读到的现实,这就是全部的着力点。
权威参考资料
- We Have a Package for You! A Comprehensive Analysis of Package Hallucinations by Code Generating LLMs——USENIX Security 2025论文,代码大模型虚构包名率19.7%、开源21.7% vs商用5.2%、20.5万个唯一幻觉名及43%复现率的一手数据来源。
- USENIX Security 2025官方会议页:Package Hallucinations研究报告——上述论文的会议正式发布页,含研究背景与作者信息,可核实这项包幻觉研究的权威出处。
- Beyond Utility: Evaluating LLM as Recommender——把大模型当商品推荐器时的虚构商品率评测,多数模型低于5%、Mistral在美妆品类约22.88%的分模型数据出处。
- Cloud Security Alliance:Slopsquatting与AI供应链攻击研究简报——云安全联盟对slopsquatting攻击链的系统梳理,含幻觉名被抢注投毒的真实案例,是理解虚构实体安全风险的权威来源。
- Google Search Central:Organization结构化数据文档——Google官方对组织结构化数据的落地要求,明确指出它用于帮助搜索理解并消歧你的组织,是实体grounding的官方依据。
- Schema.org:Organization类型定义——结构化数据Organization类型的官方规范,alternateName、sameAs等字段的权威定义,做品牌实体标记时的一手参照。
- Wikipedia:Entity Linking(实体链接与消歧)——实体链接与命名实体消歧的概念说明,理解AI为什么会把品牌搞混、以及消歧为何是幻觉反义词的背景知识。
本文标题:《AI会不会推荐根本不存在的品牌?虚构品牌与幻觉商品的实测和应对》
本文链接:https://zhangwenbao.com/ai-recommends-nonexistent-fake-brands-hallucinated-products-geo.html
版权声明:本文原创,转载与引用请注明作者与原文链接。许可协议: CC BY 4.0