病毒营销背后的数学：次模函数如何帮TikTok选择种子用户？-CSDN博客

病毒营销背后的数学：次模函数如何帮TikTok选择种子用户？

想象一下，你手里有一笔有限的营销预算，需要在TikTok上投放一个新滤镜的推广。你当然希望这个滤镜能像野火一样蔓延，触达尽可能多的用户。直觉上，你可能会去找那些粉丝最多、看起来最有影响力的“大V”。但现实往往更微妙：你邀请的第一个头部网红可能带来巨大的初始曝光，但当你试图邀请第十个同类型网红时，新增的影响力可能微乎其微，因为他们的粉丝群体高度重叠。这种“第一口汉堡最美味，第二口满足感稍减，吃到第五个时甚至有点腻”的现象，在数学上有一个精准的刻画——次模性。

这正是像TikTok、Instagram这类超级平台在策划病毒式传播活动时，其增长团队和产品经理们每天都在面对的核心问题。如何在数亿用户的复杂社交网络中，精准地挑选出那一小撮“种子用户”，用最小的成本撬动最大的传播雪球？这远非凭直觉或经验就能搞定，其背后是一套融合了图论、优化理论和机器学习的严谨数学框架。今天，我们就来拆解这套框架，看看次模函数和图神经网络如何成为现代增长黑客手中最锋利的武器，将“影响力最大化”从一个商业直觉，变成一门可计算、可优化、可验证的数据科学。

1. 从直觉到公式：什么是影响力最大化问题？

我们先抛开数学术语，回到一个具体的业务场景。假设你负责为一款新的音乐剪辑应用在TikTok上做冷启动。平台给了你一笔资源，允许你免费向k个目标用户推送这款应用，并希望他们能自发地使用并推荐给好友。你的目标很明确：通过这k个初始用户的推荐，最终能触达的总用户数最大化。

这就是影响力最大化问题的经典定义：在一个给定的社交网络（图）中，选择一个固定大小的初始节点集合（种子集），使得按照某种特定的信息传播模型（如口碑、转发、模仿），最终被激活的节点总数期望值最大。

1.1 两个核心传播模型

为了量化“影响力如何传播”，研究者们提出了多种模型，其中最经典的两个是：

线性阈值模型：想象每个用户都有一个从众的“心理阈值”。比如，用户A是否尝试新滤镜，取决于他有多少朋友已经在用了。每个朋友对他的影响力权重不同，当所有已使用朋友的影响力权重之和超过他的个人阈值时，他就会被“激活”。这个阈值是随机设定的，模拟了人的不确定性。
独立级联模型：这更像一个概率传播过程。当一个用户被激活（比如使用了滤镜）后，他有一次机会以概率p去尝试激活他的每个尚未激活的好友。无论成功与否，他之后都不会再尝试激活同一个人。这个过程像瀑布一样逐层扩散。

为了更直观地对比这两个模型的关键特性，我们来看下表：

特性维度	线性阈值模型	独立级联模型
决策机制	被动接收，受多个邻居的累积影响	主动尝试，进行独立的激活尝试
随机性来源	每个节点的激活阈值随机	每次激活尝试的成功概率随机