蝴蝶结结构与信息传播、社交圈层

2000年,Andrei Broder 等人在分析 WWW(万维网) 的大型拓扑结构时,提出了  Bow-tie Structure 概念。他们通过大规模抓取网页(超10亿个页面)和链接,想了解互联网整体的链接模式。研究发表在论文《Graph Structure in the Web》(2000, WWW conference)中,是网络科学领域非常重要的开创性工作。

那么什么是 Bow-tie Structure?

顾名思义,Bow-tie(蝴蝶结)是因为整个网络的宏观结构像一个蝴蝶结:中间是一个“结”——大量互相连通的节点,而左右各有扩展出去的部分,像蝴蝶的翅膀。

这个蝴蝶结如图所示,主要分为五个部分:

  1. SCC (Strongly Connected Component,强连接核心):蝴蝶结中间的结,其中任意两个节点可以互相到达。
  2. IN(输入区):左边翅膀,能到达 SCC,但不能从 SCC 返回的节点。
  3. OUT(输出区):右边翅膀,能被 SCC 到达,但不能返回 SCC 的节点。
  4. Tendrils(卷须):翅膀外围的散乱丝状部分,既不在 SCC、也不直接连到 SCC,只和 IN 或 OUT 相关的节点。
  5. Tubes(管道):细长管道连接,连接 IN 和 OUT,但不经过 SCC 的路径。
  6. Disconnected components(断连部分):外部空间中的孤立点,与万维网基本孤立的部分。

更细一点理解每部分:

IN:比如一些老旧网站,能链接到网络中心,但中心不会回来。

OUT:比如一些新的门户网站,从中心能到它,但它链接回中心不方便。

Tendrils:

  • 有的 tendril 只连到 IN,不连到 SCC。
  • 有的 tendril 只连到 OUT。
  • 有些 tendril 之间互相连接,形成更复杂的旁路。

Tubes:少量节点能从 IN 直接到 OUT,但绕过了 SCC。

Disconnected components:没连接到网络主体,比如孤立小网站、个人页面。

为什么 Bow-tie Structure 很重要?

这一模型揭示互联网并不是统一的大网,而是有中心、有流向、有孤立区域的复杂结构。它激发了后续大量关于复杂网络(Complex Networks)研究,比如社交网络、电网、供应链系统中的结构特性研究。这种系统建模对理解信息流动、病毒传播、网络鲁棒性等问题有重要意义。比如:SCC是最关键的核心,一旦受损,网络分裂严重。

除了对网页关系的探索,蝴蝶结结构还揭示了:

  1. 互联网信息传播权力差距。互联网不是一个人人具有平等传播权力的场域,有些实体(官媒、商业媒体、自媒体KOL)比大众拥有更强的信息传播权——他们所发布的内容会在SCC中快速扩散,被许多人所知悉,而一般人所发布的信息,基本停留在IN区,不会进入到SCC,也就不可能被大范围传播。同时,很多人只是在OUT区的“信息被动接收者”,缺乏信息的发布、再传播能力。
  2. 社交网络具有多层级性和门槛条件。每个人处在多重社交圈中,一些社交圈是公开的,谁都能加入,比如网络论坛;一些社交圈是半公开,有一定门槛,但欢迎外来人,比如博主粉丝群;最后一些社交圈是完全私密的,只允许“圈内绝大部分人都认识且认可的人”加入,比如富豪俱乐部。想进入不同类型的社交圈,方法有别。对于后两类来说,最有效的过于找个圈内人帮你引荐。

评论

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注