保哥笔记

Google论坛和问答结构化数据新增AI标签:digitalSourceType实操指南

2026年3月底,Google悄悄更新了两份重要的结构化数据文档——Discussion Forum(论坛讨论)和Q&A Page(问答页面),新增了多个支持属性。其中最值得关注的,是一个名为 digitalSourceType 的新属性,它让论坛和问答网站第一次有了用结构化数据向Google声明「这条内容是AI生成的」的标准化方式。

这看上去是一个小更新,但保哥认为它释放的信号远比字面意思更深:Google正在构建一套区分人类内容和机器内容的技术基础设施,而结构化数据是这套基础设施的重要一环。

本文将从技术实现、标准背景、代码示例到SEO影响,全面拆解这次更新的每一个细节。


这次更新到底改了什么?

Google这次更新涉及三大类变化,下面逐一拆解。

新增digitalSourceType属性:标记AI和机器人内容

这是本次更新的核心。digitalSourceType 属性使用IPTC(国际新闻电信理事会)定义的数字来源类型枚举值,用来声明一条内容的创作来源。Google目前支持两个值:

TrainedAlgorithmicMediaDigitalSource(经训练的算法媒体)——适用于由训练过的AI模型生成的内容,典型场景是大语言模型(LLM)生成的回答或帖子。在Schema.org中,该值对应 https://schema.org/TrainedAlgorithmicMediaDigitalSource

AlgorithmicMediaDigitalSource(算法媒体)——适用于由简单算法过程生成的内容,比如自动回复机器人(Auto-reply Bot)发送的标准化消息。与前者的关键区别在于,它不依赖训练数据,而是基于预设规则或简单逻辑运行。

这两个值适用的结构化数据类型覆盖面很广:

结构化数据文档适用的Schema类型属性状态
Discussion ForumDiscussionForumPosting, Comment推荐(Recommended)
Q&A PageQuestion, Answer, Comment推荐(Recommended)

关键细节:这个属性是「推荐」而非「必须」。如果你不添加这个属性,Google会默认假设该内容是人类创作的。这意味着现有的结构化数据实现不会受到任何影响——你不需要紧急修改代码。

新增commentCount属性:评论数量声明

Google在两份文档中都新增了 commentCount 作为推荐属性,允许网站声明帖子或回答的评论总数,即使标记中没有列出所有评论。

在Q&A Page文档中,Google还给出了一个计算公式:answerCount + commentCount = 该问题下所有回复的总数

这个属性解决了一个实际痛点:很多论坛和问答站点做了评论分页或截断处理,标记中只放了前几条评论。有了 commentCount,Google可以知道「这个帖子其实有200条讨论,虽然标记里只展示了10条」,从而更准确地评估页面的讨论热度和内容深度。

扩展sharedContent属性:支持更多内容引用类型

Discussion Forum文档扩展了 sharedContent 属性的支持范围。之前只接受通用的 CreativeWork 类型,现在明确支持四种子类型:

最后一项特别值得注意——它意味着Google现在能理解论坛中的「引用回帖」和「跨帖转发」行为。Google的更新文档还提供了代码示例,展示如何标记被引用评论的URL、作者、日期和内容。

此外,image 属性的描述也做了调整:Google现在建议将链接预览图片放在 sharedContent 字段内的 WebPage 对象中,而非帖子本身的 image 字段。


IPTC数字来源类型标准:技术背景深度解读

要真正理解 digitalSourceType 的意义,需要了解它背后的IPTC标准体系。

IPTC是全球新闻媒体的标准制定机构,从1979年开始定义新闻元数据标准。Digital Source Type(数字来源类型)是IPTC定义的一套受控词汇表(Controlled Vocabulary),最初用于照片元数据领域,目的是标注一张图片的来源方式——是相机直接拍摄的?还是AI生成的?还是合成处理过的?

IPTC数字来源类型词汇表的完整地址是:http://cv.iptc.org/newscodes/digitalsourcetype/。其中包含的值远不止Google目前支持的两个。保哥从IPTC官方文档中整理了几个核心值供参考:

IPTC值人类可读标签含义
trainedAlgorithmicMediaCreated using Generative AI由生成式AI创建
algorithmicMediaCreated by algorithm由非训练算法创建
compositeWithTrainedAlgorithmicMediaEdited with Generative AI由人类创作但经AI编辑
digitalCaptureOriginal digital capture原始数字捕获(如相机直拍)
digitalArtDigital art数字艺术作品

Google目前只在论坛和问答结构化数据中支持前两个值,但Google在图片元数据文档中已经支持更多IPTC来源类型值(包括 CompositeSynthetic 等),用于标识AI生成的图片。这次更新实际上是将图片领域已有的AI来源标注机制扩展到了文本内容领域

这一标准也被C2PA(内容来源与真实性联盟)采纳,用于数字内容认证。Adobe、Google、微软等公司都是C2PA的成员。由此可见,digitalSourceType 不是Google的自创属性,而是全球数字内容认证体系的一部分。


完整JSON-LD代码示例

论坛帖子标记AI生成内容

以下是一个包含 digitalSourceType 的Discussion Forum结构化数据完整示例。场景设定:一个技术论坛中,某条回复是由AI助手生成的。

{
  "@context": "https://schema.org",
  "@type": "DiscussionForumPosting",
  "headline": "如何解决WordPress插件冲突问题",
  "url": "https://example.com/forum/post/12345",
  "datePublished": "2026-03-25T10:00:00+08:00",
  "author": {
    "@type": "Person",
    "name": "张三",
    "url": "https://example.com/user/zhangsan"
  },
  "commentCount": 15,
  "comment": [
    {
      "@type": "Comment",
      "text": "你可以尝试逐一禁用插件来排查冲突,具体步骤如下:首先进入WordPress后台,依次禁用每个插件并检查问题是否消失...",
      "datePublished": "2026-03-25T10:30:00+08:00",
      "author": {
        "@type": "Person",
        "name": "AI助手",
        "url": "https://example.com/user/ai-assistant"
      },
      "digitalSourceType": "https://schema.org/TrainedAlgorithmicMediaDigitalSource"
    },
    {
      "@type": "Comment",
      "text": "感谢AI助手的回复!我按照步骤操作后发现是缓存插件导致的问题。",
      "datePublished": "2026-03-25T11:00:00+08:00",
      "author": {
        "@type": "Person",
        "name": "李四",
        "url": "https://example.com/user/lisi"
      }
    }
  ]
}

注意上面的代码中,AI助手的回复添加了 digitalSourceType,而人类用户李四的回复没有添加——根据Google的规则,不添加即默认为人类内容。

Q&A页面标记机器人自动回答

{
  "@context": "https://schema.org",
  "@type": "QAPage",
  "mainEntity": {
    "@type": "Question",
    "name": "Shopify如何添加自定义结构化数据?",
    "text": "我想给我的Shopify产品页面添加自定义的Schema标记,应该怎么操作?",
    "datePublished": "2026-03-20T09:00:00+08:00",
    "author": {
      "@type": "Person",
      "name": "王五"
    },
    "answerCount": 2,
    "commentCount": 5,
    "acceptedAnswer": {
      "@type": "Answer",
      "text": "您可以通过编辑Shopify主题的theme.liquid文件来手动添加JSON-LD结构化数据...",
      "datePublished": "2026-03-20T09:15:00+08:00",
      "author": {
        "@type": "Person",
        "name": "客服机器人"
      },
      "digitalSourceType": "https://schema.org/AlgorithmicMediaDigitalSource"
    }
  }
}

在这个示例中,客服机器人的回答使用了 AlgorithmicMediaDigitalSource——因为它是基于预设规则的自动回复,而非经过训练的AI模型生成的内容。

论坛帖子中引用其他帖子的sharedContent示例

{
  "@context": "https://schema.org",
  "@type": "DiscussionForumPosting",
  "headline": "关于这个SEO问题,我引用一下之前的讨论",
  "url": "https://example.com/forum/post/67890",
  "datePublished": "2026-03-26T14:00:00+08:00",
  "author": {
    "@type": "Person",
    "name": "赵六"
  },
  "sharedContent": {
    "@type": "Comment",
    "url": "https://example.com/forum/post/11111#comment-42",
    "text": "结构化数据最重要的是确保@id的唯一性和一致性...",
    "datePublished": "2026-03-10T08:00:00+08:00",
    "author": {
      "@type": "Person",
      "name": "孙七"
    }
  }
}

对SEO和GEO的实际影响分析

Google会用这个数据做什么?

截至目前,Google没有明确说明 digitalSourceType 将如何影响排名或搜索结果的展示方式。文档只将其描述为「一种指明内容来源的方式」。

但保哥认为这里有几个值得关注的推演方向:

短期看:纯信号收集阶段。 Google大概率在用这个属性做数据收集和分析。它想了解的是:现在的论坛和问答网站中,AI生成内容的占比有多大?这些内容的质量分布如何?用户的互动行为(点赞、回复、采纳)有什么差异?

中期看:可能影响搜索结果展示。 Google已经在图片搜索中展示AI生成标签。论坛和问答内容出现在搜索结果中时,未来可能也会带上「AI生成」标签,帮助用户判断内容来源。这跟Discussion Forum和Q&A搜索功能(Perspectives和Discussions)的发展方向是一致的。

长期看:内容质量评估的维度之一。GEO(生成式引擎优化)策略的框架下,AI搜索引擎需要理解内容的来源和可信度。digitalSourceType 提供的正是这种元数据。当AI系统需要在AI生成的论坛回答和人类专家的论坛回答之间做选择时,来源标注可能成为一个判断因素。

不添加会不会有惩罚?

不会。 这是一个推荐属性,不是必须属性。不添加不会导致任何负面影响,现有实现完全不受影响。

但反过来想:如果你的论坛确实有AI生成的内容,主动标注可能是一种透明度信号。在Google越来越重视E-E-A-T(经验、专业、权威、可信度)的今天,内容来源的透明度本身就是可信度的一部分。

这跟结构化数据大清理的关系

2025年下半年到2026年初,Google经历了一轮结构化数据的大清理:移除了多个使用率低的结构化数据类型支持(Practice Problem、Dataset在常规搜索中的使用等)。Google的John Mueller也公开表示,结构化数据会「来来去去」,核心类型会一直保留。

这次Discussion Forum和Q&A Page不仅没有被裁减,反而获得了新属性支持。这说明Google将论坛和问答内容视为搜索生态中的高价值内容类型。在AI内容泛滥的时代,真实的社区讨论和问答互动对Google来说更加珍贵。


结构化数据在Agentic Web时代的新角色

如果只把 digitalSourceType 看作一个新的Schema属性,就低估了这次更新的战略意义。

保哥此前在Schema聚合与Agentic Web一文中分析过,结构化数据正在从「帮Google展示Rich Snippets」升级为「AI系统理解网站内容的核心接口」。digitalSourceType 完美印证了这个趋势——它不是为了触发某个富结果样式,而是为了给AI系统提供内容溯源的元数据。

实体SEO的理论框架中,每一条内容都是一个实体节点,而实体的属性(谁创作的、什么时候创作的、用什么方式创作的)是AI系统理解和信任该实体的基础。digitalSourceType 补全的正是「用什么方式创作的」这个关键属性。

未来,当AI Agent需要从论坛中提取答案时,它们不仅会评估内容本身的质量,还会参考内容的来源类型。一条标注了人类来源的专家回答,和一条标注了AI来源的自动回复,在AI系统的权重分配中可能会有差异。


落地实施清单:该怎么行动?

根据保哥的实践经验,以下是不同类型网站的建议行动方案:

如果你运营论坛或社区网站:

  1. 先审计你的站点中AI生成内容的占比和分布
  2. 评估是否需要在Comment或Post层级添加 digitalSourceType
  3. 如果你的站点使用了AI客服或AI助手自动回帖,优先为这些内容添加标注
  4. 同步添加 commentCount 属性,尤其是评论分页的页面
  5. 验证你的实现:使用Google的富结果测试工具或保哥开发的结构化数据相关工具来检测和验证JSON-LD代码

如果你运营问答网站:

  1. 重点关注 acceptedAnswer 中的内容来源——如果最佳答案是AI生成的,建议标注
  2. 利用新的 answerCount + commentCount 公式,确保你的数据完整反映页面的讨论量
  3. 考虑在用户界面上也同步展示AI来源标识(保持结构化数据与可见内容一致)

如果你是纯内容型网站(博客、新闻等):
这次更新不直接涉及Article或BlogPosting类型。但这个趋势值得关注——Google可能会在未来将 digitalSourceType 扩展到更多结构化数据类型。你现在可以做的是:用GEO内容分析优化工具检查你的内容结构是否符合AI搜索引擎的引用偏好,提前做好准备。


常见问题

digitalSourceType属性是必须添加的吗?

不是。digitalSourceType 是推荐属性(Recommended),不是必须属性(Required)。如果你不添加,Google会默认假设内容是人类创作的。现有的结构化数据实现不需要做任何修改,也不会受到负面影响。

TrainedAlgorithmicMediaDigitalSource和AlgorithmicMediaDigitalSource有什么区别?

TrainedAlgorithmicMediaDigitalSource 用于由经过训练的AI模型生成的内容,比如ChatGPT、Claude等大语言模型输出的文本。AlgorithmicMediaDigitalSource 用于由非训练型算法生成的内容,比如基于关键词匹配的自动回复机器人、基于规则的FAQ自动应答系统等。简单的判断标准:如果背后有一个训练过的神经网络模型,用前者;如果只是简单的if-else逻辑或模板替换,用后者。

如果帖子是人类写的但用了AI辅助修改,应该怎么标注?

目前Google在论坛和Q&A结构化数据中只支持上述两个值,没有提供「AI辅助编辑」的选项。IPTC标准中有一个 compositeWithTrainedAlgorithmicMedia(经AI编辑的人类创作内容)值,但Google暂未在这两个文档中支持它。保哥的建议是:如果内容主体是人类创作的,AI只做了语法修正或润色,那就不需要标注——Google的默认就是人类来源。

commentCount属性和实际标记的评论数量不一致可以吗?

可以,这正是 commentCount 的设计意图。很多论坛页面只在标记中展示前几条评论,但评论总数远大于标记中的数量。commentCount 让你声明真实的评论总数,帮助Google更全面地理解页面的讨论活跃度。

这次更新会影响Discussion Forum和Q&A的搜索结果展示吗?

Google目前没有说明会如何使用 digitalSourceType 数据来改变搜索结果的展示或排名。但参考Google在图片搜索中已经开始展示AI生成标签的做法,未来论坛和问答搜索结果中出现类似的AI来源标识是完全有可能的。

我的WordPress论坛用什么工具可以快速实现这些标记?

如果你使用的是bbPress或BuddyPress等WordPress论坛插件,目前主流SEO插件(如Yoast SEO)尚未内置 digitalSourceType 的支持。你可以通过自定义JSON-LD脚本或开发专用钩子(Hook)来手动实现。建议关注Yoast和Rank Math的后续更新,它们很可能会在近期版本中添加对新属性的支持。


本文由保哥基于Google最新开发者文档和IPTC官方标准撰写。如需验证你的论坛或问答页面的结构化数据实现,可以使用Google的Rich Results Test工具进行检测。