根据PV计算带宽
我们通常说的网站流量(traffic)就是指网站的访问量,是用来描述访问一个网站的用户数量以及用户所浏览的网页数量等指标,常用的统计指标包括网站的独立用户数量、总用户数量(含重复访问者)、网页浏览数量、每个用户的页面浏览数量、用户在网站的平均停留时间等。
网站访问量的衡量标准一个是IP,另一个是PV,常以日为标准,即日独立IP和PV来计算.
访问数(IP):即Internet Protocol,指独立IP数。00:00-24:00内相同IP地址只被计算一次。
综合浏览量(PV):即Page View, 即页面浏览量或点击量,用户每次刷新即被计算一次。
二者的联系与区别:PV高不一定代表来访者多;PV与来访者的数量成正比,但是PV并不直接决定页面的真实来访者数量。比如一个网站就你一个人进来,通过不断的刷新页面,也可以制造出非常高的PV。
IP是一个反映网络虚拟地址对象的概念,独立用户是一个反映实际使用者的概念,每个独立用户相对于每个IP,更加准确地对应一个实际的浏览者。使用独立用户作为统计量,可以更加准确的了解单位时间内实际上有多少个访问者来到了相应的页面。
一个独立IP可以产生多个PV,所以PV个数>=IP个数。
PV(Page View)值:是指一定时间范围内所有浏览该网站的访问者请求的页面数量之合。(例如:该网站一天有500个访问者,每个访问者浏览的页面数量平均为8页,则每天的PV是500×8=4000)
Hits值:是指对每个页面元素的请求数量。(一个页面中任何一个图片或者flash文件都算是一个页面元素)
日浏览字节数:即日流量,是指一天内,访问者请求的所有页面元素的字节数之和。
计算带宽大小需要关注两个指标:峰值流量和页面的平均大小。举个例子说明下吧:
假设网站的峰值流量是平均流量的5倍(当然,这只是一个假设,具体实施我们需要视自己情况而定);
假设每次访问的平均页面大小是200K字节;
假设网站的预期目标是每天50W PV的访问量。
我们的计算开始:50W PV如果在一天内平均分布,折合到每秒大概是50W/(24*60*60)=6次访问,按照我们之前的假设平均页面大小是200K字节计算,这6次访问总 共就是1200K字节(需要注意的是这个地方是字节),字节的单位是Byte,而带宽的单位是bit,1Byte=8bit,因此1200K Byte大概就是9600K bit,也就是9Mbps(1M=1024K)。在实际的网站运行过程中,我们的网站必须要在峰值流量时保持正常的访问,这里就会用到我们之前的假设,峰 值流量是平均流量的5倍,按照这个计算,实际需要的带宽大约在9Mbps*5=45Mbps左右。
具体的计算公式是:网站独享带宽=一天总的PV值÷ 一天总时间(换算到S)*平均页面大小(单位KB)* 8
这个计算结果的前提是我们之前的三条假设,而在实际运行中,由于缓存、网站提供下载、图片较多、网站白天夜里访问量不同等原因,这个结果可能并不是很理想。所以这个算法只能算是一个大概的算法了。
eg. 10w pv,页面大小1M ,带宽=10,0000/86400*1M*8 = 9.26Mbps
PV与并发之间换算的算法换算公式
并发连接数 = PV / 统计时间 * 页面衍生连接次数 * http响应时间 * 因数 / web服务器数量
PV = 并发连接数 * 统计时间 * web服务器数量/ 页面衍生连接次数 / http响应时间 / 因数
解释:
统计时间 : pv统计的总时间,单位秒,要计算一天的pv就是86400秒
页面衍生连接次数: 一个HTML页面可能会请求好几次http连接,如外部的css, js,图片等,可以估算一下,或者用10,可根据实际情况改变
http响应时间: 可以使用1秒或更少,可根据实际情况改变
因数: 一般使用5即可,可根据实际情况计算后推出
web服务器数量: web服务器数量
* "页面衍生连接次数","http响应时间","因数"这三个参数要根据实际情况分析计算后,确定一个适合的值
推算一下。单台机器1000并发的情况下,一天是1,728,000的pv(1秒响应,10个衍生连接,因子为5的情况下)
======================================================================
例子:
保证每天多少PV的并发连接数的计算公式是:
并发连接数= PV / 统计时间(一天是86400) * 页面衍生连接次数 * http响应时间 * 因数(5) / web服务器数量
保证4千万PV的并发连接数:
(40000000PV / 86400秒 * 10个派生连接数 * 5秒内响应 * 5倍峰值) / 6台Web服务器 = 19290连接数
eg.
10PV的并发连接数:
(100000PV / 86400秒 * 10个派生连接数 * 5秒内响应 * 5倍峰值) / 1台Web服务器 = 289连接数
Ref:
[1] http://cwind.blog.51cto.com/62582/1114405
[2] http://2804976.blog.51cto.com/2794976/786664
http://blog.csdn.net/fffy2366/article/details/40858931
相关推荐
总带宽的计算是并发数乘以每个连接提供的带宽。对于高并发应用,需要确保足够的带宽以避免网络瓶颈。 8. **数据库和文件系统**:数据库的性能和文件系统的效率对数据处理速度至关重要。选择合适的数据存储方案(如...
对于高并发系统而言,足够的带宽是非常重要的,因为它直接影响到系统能否快速响应大量的并发请求。 4. **PV(Page View)**:即页面浏览量。通常用来评估网站或应用程序的受欢迎程度。 5. **UV(Unique Visitor)**...
综上所述,构建一个能够支持高并发和高负载的大型网站需要从多个层面入手,包括但不限于硬件配置优化、数据库管理、编程语言及Web容器选择等方面。同时还需要结合实际情况灵活运用各种技术手段,以达到最佳效果。...
去哪儿网的机票搜索系统是在线旅游行业的关键技术之一,面对每日十亿级别的PV(页面浏览量)和上亿的UV(独立访客量),该系统需要具备处理高并发的能力。以下是对去哪儿网机票搜索系统高并发架构设计的详细说明: ...
2. 峰值QPS可以通过公式计算:(总PV数*80%)/ (六小时秒数*20%),表明大部分流量集中在一小段时间内。 3. 压力测试用于确定系统能承受的最大并发数和QPS值,常用的工具有ab、wrk、httpload、Web Bench、Siege和...
这可能涉及到利用现有的免费或低成本的开源工具和平台,以及寻找性价比高的服务器和带宽资源。 2. 选择合适的编程语言和框架:在文件中提到了Rails(Ruby on Rails),这表明了选择一个成熟的Web框架对于快速开发和...
系统容量预估涉及QPS、PV、带宽、并发量等,带宽计算公式为总流量除以时间。 Dubbo作为分布式RPC框架,扮演着连接服务提供者和服务消费者的角色,它提供了服务发现、负载均衡、容错、监控等功能,帮助开发者构建高...
常见的吞吐量指标包括网络带宽、TPS、PV、QPS/RPS、HPS、UV、DAU、MAU、在线数、并发数等。这些指标都是衡量系统处理能力的重要依据。 网络带宽是衡量系统处理能力的重要指标,计算公式为:带宽(bps)= 总流量数...
20. **PV操作**:在并发执行过程中,PV操作用于控制资源的共享,信号量S1~S5的初值为零,根据前趋图,正确使用PV操作可以避免死锁。具体的PV操作安排因题目信息不完整而无法给出准确答案。 以上是针对2015年数据库...
随着PV(Page Views,页面访问量)的增长,服务器需要处理更大的带宽需求和更高的并发量。为解决这些问题,常见的技术手段包括服务器集群、MySQL优化、缓存技术如Memcached或Redis,以及页面静态化。页面静态化通过...
一:项目介绍koalas-RPC 个人作品,提供大家交流学习,有意见请私信,欢迎拍砖。... 我也算得上是在很多个互联网企业厮杀过,见过很多很多的内部RPC框架,有些优秀的设计让我非常赞赏,有一天我突然想着,为什
理论上并发数量接近服务器带宽,客户端采用thrift协议,服务端支持netty和thrift的TThreadedSelectorServer半同步半异步线程模型,支持动态扩容,服务上下线,权重动态,可用性配置,泛化调用,页面流量统计,泛化...