`
imjl
  • 浏览: 156289 次
  • 性别: Icon_minigender_1
  • 来自: 上海
社区版块
存档分类
最新评论

分布式系统之分

阅读更多

数据达到一定规模,一台机器不能满足你要求,也许你该考虑分布式。

那么如何分,分的合理。

我觉得可以从这几方面考虑:

1: 业务

2: 效率

3: 余

 

业务:不同业务会有不一样的划分。举个简单例子,比如我有博客和mp3搜索两部分,这两者对于业务而言,是两个独立部分。那么将博客的索引放在一起,mp3的索引放在一起。

效率:程序设计,操作系统和硬件资源结合。合理使用硬件资源是重点。常见的mysql的isam+innodb的搭配。

余:通常它是在前面两者都不能分的时候才会用到。将资源划分成n分,采用余的方式,将资源划分。

 

复杂的分布式是这几种结合。分布式的好坏将决定你整个系统的扩展,稳定,效率。

 

分享到:
评论
2 楼 imjl 2007-10-15  
ryq1     1 小时前
如果将资源分成N份,搜索效率接近于N个单个文件哦。

如果你是串行处理,,你这句话对的。


并行处理就不是这么计算的。




你硬件什么情况,索引文件几个。

以前有人和我介绍过.net,,好像是开daemon和web service来做的。

你开了几个daemon。。

索引后有没有commit和optimize。

lucene是什么版本,,还是1.4吗?

把这些信息发到圈子的论坛把。。。这样大家都能看到。有类似情况的也能帮到你。


不要给我pm。
1 楼 ryq1 2007-10-15  
如果将资源分成N份,搜索效率接近于N个单个文件哦。
还有,为了要用权重,我现在一次搜4个字段。

我的环境如下:
Lucene.net 2.0
1000万的数据量
索引文件有4G左右。

现在搜一个数据要5秒左右。很是郁闷,都不知要如何改进了。
http://search.cfp.cn
"足球"
qq:5192412
Msn:ryqbl@hotmail.com
希望各位能经点指导。

相关推荐

    分布式系统原理介绍

    分布式系统理论体系非常庞大,涉及知识面也非常广博,由于笔者的肤浅,本文精心选择了部 分在工程实践中应用广泛、简单有效的分布式理论、算法、协议加以介绍。全文分为两大部分,第 一部分介绍了分布式系统的一些...

    分布式系统概念与设计(第5版)教材+习题答案

    分布式系统是计算机科学中的一个重要领域,它涉及到多个独立计算节点通过网络进行通信和协作,以完成共同的任务。《分布式系统概念与设计(第5版)》是一本深入探讨这一主题的经典教材,它提供了全面的理论知识和实际...

    分布式系统的应用

    分布式系统的发展可追溯到20世纪50年代的串行处理机,再到60年代的批处理和70年代的分时系统。随着微处理器性能的提升和网络技术的进步,80年代出现了个人计算机,而90年代以来,分布式计算的概念得到了广泛关注。...

    分布式系统网络教程之采用分布式系统的必要性

    分布式系统是现代信息技术领域中的重要概念,它在各种规模的企业和组织中发挥着关键作用。分布式系统通过将任务和数据分散在多个独立的计算节点上,实现了更高效、灵活和可扩展的解决方案。本教程主要探讨了采用...

    分布式系统设计原理和实践

    分布式系统设计的关键技术之一是分布式数据存储。这包括分布式数据库和分布式文件系统,如Google的Bigtable、Hadoop的HDFS和Amazon的DynamoDB。这些系统利用复制和分片策略来提高读写性能和可用性,同时通过复杂的...

    分布式系统概念与设计(第五版)课后题答案

    分布式系统是计算机科学中的一个重要领域,它涉及到多个独立计算节点通过网络进行通信和协作,以完成共同的任务。《分布式系统概念与设计(第五版)》是一本深入探讨这个主题的经典教材,提供了丰富的理论基础和实践...

    百度系统部分布式系统

    百度系统部分布式系统深入解析 一、百度的数字与计算平台 百度系统部分布式系统的核心在于其庞大的计算能力和高效的数据处理能力。百度拥有的高性能计算(HPC)平台大约有200台左右的服务器,每台配置了8核处理器,...

    分布式系统工程实践.pdf

    分布式系统工程实践 分布式系统是一种由多个独立的计算单元组成,通过网络互相连接并协作完成任务的系统。这类系统通常具有高度的内聚性和透明性,其核心目标是提供高性能、高可用性以及可扩展性。分布式系统中,...

    分布式系统在网络工程专业课程体系中的地位.pdf

    分布式系统是计算机网络资源共享的一种软件手段,自计算机网络诞生以来,分布式系统就随之发展,并贯穿于从早期的文件共享到现代大规模分布式计算、高性能并行计算,以及近年兴起的云计算等技术中。分布式系统对...

    分布式系统 国外优质课件

    - **Tanenbaum著《分布式系统》**:此书为分布式系统领域的经典著作之一,价格约为60欧元。 - **Coulouris著《分布式系统概念与设计》**:另一本广泛使用的教材,价格约为70欧元。 #### 四、课程先修知识 - **网络...

    分布式系统工程实践_taobao

    实现有效的负载均衡机制是提高分布式系统性能的关键因素之一。 ##### 3.6 Chubby Chubby是Google开发的一个分布式锁服务,它用于解决分布式环境中协调多个服务的问题。Chubby提供了一种简单有效的方式来管理分布式...

    分布式系统(英)课件

    分布式系统是计算机科学中的一个重要领域,它涉及到多台计算机通过网络进行协同工作,共同完成一个大任务。这个“分布式系统(英)课件”提供了一种深入理解这一复杂主题的资源,尤其适合初学者入门。 分布式系统的...

    分布式系统设计模式——ppt模式

    分布式系统设计模式是指在分布式系统中,为了解决如何划分服务、如何部署服务以及如何组织服务间通信等问题而采用的一些通用方案和策略。这些模式能够在不同的分布式环境和应用场景中应用,以期达到系统设计的最优解...

    分布式系统-原理与范例

    分布式系统是计算机科学中的一个重要领域,它涉及到多个独立计算节点通过网络进行通信和协作,以完成共同的任务。这本书“分布式系统-原理与范例”可能是深入理解这一主题的关键资源,尽管这里提供的信息是英文版且...

    大规模分布式系统架构与设计实战.完整版

    分布式系统是现代信息技术领域中的核心概念,它涉及多个计算节点通过网络进行协同工作,共同处理大规模数据和提供高可用服务。在"大规模分布式系统架构与设计实战.完整版"这本书中,作者深入探讨了构建高效、可靠且...

Global site tag (gtag.js) - Google Analytics