2023年2月10日事件的事后分析
2023年2月10日01:02 UTC,我们开始收到不同地理位置出现的连接相关警报,并逐步升级到待命团队。到UTC时间1:20,我们发现我们的域名提供商意外地停止了adjust.com的服务,并且错误的NS记录(4小时TTL)开始在全球的DNS服务器上传播,影响了客户端到达Adjust的能力。
我们立即采取行动联系域名提供商和ICANN,以修复错误的NS记录,并将影响降至最低。
与此同时,我们开始准备一个替代的域解决方案(如下所述),作为我们客户的备用方案,并开始审计我们的系统,以识别和解决与公共DNS记录相关的任何连接问题。在多次尝试联系域名提供商失败后,我们在UTC时间08:15左右继续使用变通解决方案。
由于域提供程序不可用,NS记录仅在08:55 UTC在根节点上恢复,并开始重新传播。
服务逐渐改善,该问题在UTC时间14:30左右进入监控阶段。
该事件于2023年2月10日19:15 UTC完全解决。
在事件发生期间,跨Dashboard、engagement、跟踪器重定向、s2s服务和api连接的服务部分不可用。属性和SDK流量(iOS v4.23.0+/Android v4.24.0+), SAN活动未受影响,正常工作。
我们正在积极与我们的合作伙伴合作,在事件发生期间重新执行失败的任务。一旦重播,所有归因数据将回填在我们的仪表板和汇总报告。如果您在我们的仪表板中设置了实时回调,我们也将能够提供离线原始回调数据。
您是否应该在事件发生时将url更改为https://app.adjust.io(点击)或https://app.adjust.io/impression/(对于印象),您可以继续使用这些URL,但我们建议您在方便的时候切换回我们的标准跟踪URL(见下文)。
对于所有新创建的活动,从现在开始请恢复使用标准urlhttps://app.adjust.com(点击),
https://view.adjust.com(印象),
https://s2s.adjust.com?s2s=1而且https://app.adjust.com?s2s=1(适用于S2S请求)。
对于此次服务中断所造成的不便,我们深表歉意。
客户满意对我们来说是最重要的。为确保今后不会发生此类事件,我们正与域名提供商合作,确保今后不会在没有事先通知的情况下发生此类问题。另一方面,我们也将完善沟通流程,确保未来的沟通能够及时共享。
如果您有任何疑问,请不要犹豫与我们联系。谢谢您的理解,并对由此造成的不便表示歉意。