行业洞悉

INDUSTRY INSIGHTS

BGP Anycast 在全球加速中的实战观察
网络架构

BGP Anycast 在全球加速中的实战观察

同一段 IP 在多个城市同时被宣告,让用户被路由到最近的节点——理论上很美好,但工程落地全是坑。本文用大白话讲清楚 Anycast 的真实成本与价值。

一、先打个比方:Anycast 像小区里"最近的那个快递柜"

想象你住在一个大型小区,里面有十几个快递柜。你下单时,快递公司不会指定一个固定柜子,而是把包裹推送到"离你家最近的那一个"。下楼五十米能拿到,比走到小区另一头方便得多——这就是 Anycast 的直觉版本。

在网络世界里,"最近"不是物理距离,而是 BGP 协议眼中的"AS Path 长度"。同一段 IP 在多个 PoP 同时被宣告出去,运营商收到你的请求时,会把它送到"路径最短"的那个节点。理论上,纽约的用户访问会自然落到美东 PoP,东京的用户落到东亚 PoP,跨洲请求被自动就近收敛——开箱即用的全球加速。

听起来很美好,但魔鬼藏在"理论上"这三个字里。真要把 Anycast 用稳,需要解决至少三件令工程师头疼的事。

二、Anycast 第一坑:跨洲粘性失败

我们曾经遇到一次诡异的故障:东南亚某国的客户反馈 API 延迟从平时的 35ms 飙升到 220ms。运维一查路由表,整个人都傻了——他们的请求居然被送到了美国弗吉尼亚的 PoP,而本来近在咫尺的新加坡 PoP 完全没接到流量。

原因出在某条上游运营商的策略:他们对一个特定区域的 BGP 路径做了 cold-potato 配置,把流量先送回自己的核心骨干,再走主干线路出去。在他们的视角里,"绕一圈到美国"反而是路径最短的选择。

这种问题在 Anycast 部署里非常常见。一个新接入的 PoP 看似宣告好了,路由表也都收到了,但真实流量到底从哪条线路过来,往往和上游运营商的策略密切相关,而不是你单方面就能决定。

解决办法是结合 RPKI、BGP Communities 和本地优先级,强行告诉上游:"这一段 IP 在这个区域必须落在指定 PoP"。说白了,就是和对方运营商打配合,把"地理上的近"翻译成"BGP 表里的近"。这件事不是配一次 BGP 就完事,而是需要持续监测真实流量的来源、定期和上游协商、动态调整策略。

三、Anycast 第二坑:那让人崩溃的几十秒收敛

比跨洲粘性更让人头疼的,是 BGP 收敛——也就是路由表更新的过程。

当一个 PoP 上下线,整张全球路由表要重新计算并向所有运营商广播出去。这个过程动辄需要几十秒到几分钟,期间会发生什么?部分用户的请求会被送到"次近"的节点,TCP 连接被迫重建,原本流畅的视频会卡顿一两秒,原本毫秒级的 API 调用会突然超时。

对消费级应用来说,这就是用户口中那句"网络又抽风了"。对游戏、直播、金融交易这些对延迟极度敏感的业务,这几十秒甚至能造成实际的商业损失。

我们的经验是:主动管理收敛过程,不要等运营商自己去发现。具体做法是在计划下线前 90 秒,就先停止该 PoP 的 BGP 宣告,让上游运营商有充分时间把路由表更新干净,再做实际维护。配合 BFD(Bidirectional Forwarding Detection)和 Graceful Restart,可以把切换感知压到 2 秒以内。

说到底,Anycast 的"快速故障切换"听起来是天然能力,但要做到对用户无感,需要的是精细到秒级的运维节奏

四、Anycast 第三坑:负载严重不均

第三个坑藏得更深。Anycast 默认是"路径最短就过来",但路径短不代表节点空闲。

我们见过一种典型情况:东京 PoP 因为上游运营商互联非常优质,于是整个亚太相当一部分流量都被吸过来,导致东京节点 CPU 被打到 90%,而本应承担一部分负载的首尔 PoP 只有 20% 利用率。

解决办法不是简单加机器——加机器只会让东京继续吸流量,治标不治本。真正的做法是在 BGP 层面做"区域分流":通过 Communities 控制宣告范围,让首尔 PoP 在韩国本土被优先选中,让东京只承担日本本地和它最擅长的那部分跨境流量。

Anycast 不是"开了就万事大吉"的技术,它需要持续的配置维护、上游协商、监控反馈。一个把 Anycast 真正做好的服务商,背后是一支懂网络、有运营商资源、能持续投入的团队。

五、回到正题:什么样的服务商能把 Anycast 做扎实

聊了这么多坑,最后想说一句实在话——对绝大多数业务来说,Anycast 的真正价值不是"快",而是"稳"和"近"。它把"全球可达性"和"故障自愈"打包成了基础能力,前提是有一家把网络做扎实的服务商在背后托底。

像 Skyline Connect 这样的国际网络运营商,在新加坡 SG1 与东京 TY8 双 PoP 直连了 NTTKDDISoftBankIIJPCCW GlobalLumenTelstra 等多家 Tier 1 / Tier 2 骨干运营商,并接入主流 IXP。这意味着客户拿到的不是"两台机器在两个城市",而是一张已经把跨洲粘性、收敛策略、运营商互联策略都调好的全球网络

对面向亚太市场的产品来说,新加坡 + 东京这套组合恰好覆盖了东南亚和东亚两大核心市场——比把流量绕到法兰克福或弗吉尼亚务实得多。Anycast 在这套基础设施之上,是自然而然能用的能力,而不是一项需要单独额外付费的"高级功能"。如果你正在考虑把业务部署到一张真正经过工程打磨的全球网络上,可以了解一下我们的产品矩阵,或查看最近的平台公告了解最新节点动态。

把网络做扎实,看似不性感,但它决定了用户每一次点击的体验。这一点,永远不会过时。