云数据安全_美国_基于大数据的数据分析

云计算 虚拟云 浏览

小编:1月16日,太平洋时间下午6:00–6:20,我们的发送到每个生产系统4个时代。我们所有的客户,如果每小时查看他们的数据在下午6:00到7:00之间看到一个人工尖峰,类似于一张照片如下:我

云数据安全_美国_基于大数据的数据分析

1月16日,性能云服务器,太平洋时间下午6:00–6:20,我们的发送到每个生产系统4个时代。我们所有的客户,如果每小时查看他们的数据在下午6:00到7:00之间看到一个人工尖峰,类似于一张照片如下:我们对我们的数据的准确性感到非常自豪,对此我们深表遗憾发生此错误。我们知道,您根据你在Mixpanel中看到的数据,即使错误计算只持续了二十分钟,我们想让你立刻意识到。其余的这篇博客文章将讨论这个错误的全部细节和可能的对你的决策的影响。过度计数会影响所有报告Mixpanel.com网站或者任何API调用请求所有事件的总计数,包括2012年1月16日下午6点查询的时间段。然而,这种过度计算并不会产生影响查询唯一事件计数。这意味着漏斗报告和完全基于uniques的保留报告不受影响。此外,分段或趋势中的任何查询都将报告给uniques模式也不受影响。如何调整我的数据以适应这种情况?在大多数情况下,我们不建议尝试调整数据以解释此错误。对于每日报告,差别将是微不足道的。1月16日当天的事件总数将比实际情况高出大约5%。对于月度报告,事件总数只会比实际情况高0.1%。您可能需要调整Mixpanel输出的数据的唯一情况是每小时报告的情况。如果你是基于每小时一次的报告来做决定,那么把下午6点发生的事件总数除以2。结果将非常接近该小时的真实事件计数。我会为这些数据点付费吗?绝对不是。您将不会因为这个错误而对您的计划造成的任何超额收费。我是个怪胎-告诉我到底发生了什么首先,有必要描述一下我们的基础设施的一小部分。当用户发送一个事件到Mixpanel,云阿里,我们做少量的验证-主要是检查语法的正确性-然后立即将事件排队。在正常情况下,队列中的项目数保持不变非常接近于零,意味着在发送事件的几秒钟内出现在你的报告里。但是,将接收事件与处理分离它们允许我们轻松地执行服务器维护,否则需要大量停机。很长一段时间以来,我们有多个队列服务器,所以我们不依赖于它一台机器,但我们还没有自动故障转移。实际上,这意味着,如果一个队列服务器在一天中宕机,我们可以这样做在几分钟内进行手动故障转移,但如果在晚上,我们可能要花很长时间才能把一切都换掉。我们星期一推出的这项改革旨在纠正这种情况。基本上,当发生事件时,我们会尝试当前的每个队列服务器"思考"是一次一个向上,直到我们成功地将一个项目排队。不幸的是,大数据云开发,我们用来检查是否将项目放入队列的代码成功与否是不正确的,因此每个事件都被添加到每个队列服务器(目前有四个)。我们几乎注意到了这个问题很快就搞定了。我们正在做什么来防止这种事情再次发生不幸的是,服务器云平台,云数据库管理,虽然我们在测试中对相关测试进行了排队环境中只有一个队列服务器,因此没有捕获到任何测试这个特别的问题。那个洞将来会修好的天。再次,我们对这个错误表示最诚挚的歉意和遗憾。如果你有如有任何问题,请随时联系我们support@mixpanel.com。

当前网址:http://www.vmchk.com/web/2021/0227/52858.html

 
你可能喜欢的: