1.Storm 在taobao的使用情况:
We make statistics of logs and extract useful information from thestatistics in almost real-time with Storm. Logs are read from Kafka-likepersistent message queues into spouts, then processed and emitted over thetopologies to compute desired results, which are then stored into distributeddatabases to be used elsewhere. Input log count varies from 2 millions to 1.5billion every day, whose size is up to 2 terabytes among the projects. The mainchallenge here is not only real-time processing of big data set; storing andpersisting result is also a challenge and needs careful design andimplementation.
淘宝使用storm和消息队列结合,每天能够处理2百万到15亿条日志,日志量达到2TB的近实时处理。
2.使用场景
上周开始学习storm的使用,现在探索出来两种使用场景。
1, 通过配置drpc服务器,将storm的topology发布为drpc服务。客户端程序可以调用drpc服务将数据发送到storm集群中,并接收处理结果的反馈。这种方式需要drpc服务器进行转发,其中drpc服务器底层通过thrift实现。适合的业务场景主要是实时计算。并且扩展性良好,可以增加每个节点的工作worker数量来动态扩展。
2, 第二种场景是通过beanstalkd来实现信息的导入,将topology任务提交到storm集群后可以通过开发beanstalkd客户端来向集群中发送信息,这种方式客户端收不到结果反馈。这个场景适合纯粹的数据分析处理的业务场景。
3.Strom drpc服务配置:
端口可以不用配置,默认是:3772
Nimbus节点的配置:
storm.zookeeper.servers:
- "10.10.249.195"
- "10.10.249.196"
#
# nimbus.host: "nimbus"
## Locations of the drpc servers
drpc.servers:
- "10.10.249.197"
# - "server2"
Supervisor节点的配置:
########### These MUST be filled in for astorm configuration
storm.zookeeper.servers:
- "10.10.249.195"
- "10.10.249.196"
#
nimbus.host: "10.10.249.195"
#
## Locations of the drpc servers
drpc.servers:
- "10.10.249.197"
# - "server2"
supervisor.slots.ports:
-6700
-6701
- 6702
Drpc服务器节点配置
该节点只需配置zookeeper地址即可。默认开放的端口:3772
storm.zookeeper.servers:
-"10.10.249.195"
-"10.10.249.196"
启动drpc服务:./storm drpc
相关推荐
Oracle 11g Database Resident Connection Pooling (DRCP) 是Oracle数据库系统中为解决传统连接方式带来的性能问题而推出的一种连接池技术。DRCP旨在优化数据库资源的利用,特别是对于那些具有大量短暂连接的应用...
美国人做的关于未来思考的PPT 令思考范围更开阔的PPT
数据库驻留连接池(Database Resident Connection Pooling,简称DRCP)是Oracle 11g版本引入的一项重要特性,旨在优化数据库连接管理和资源利用率,从而提高系统性能和响应速度。DRCP通过在数据库内部维护一个连接池...
#### 连接池技术:Database Resident Connection Pooling (DRCP) ##### Database Resident Connection Pooling简介 为了提高PHP应用程序的性能和可扩展性,Oracle Database 11g引入了一种新的连接池机制——...
- **DRCP报文协商**:设备配置完DR系统参数后,通过IPL链路交换DRCP(Distributed Relay Control Protocol)报文。如果两端设备的DR系统配置匹配,它们就会组成DR系统。 - **主从协商**:成功配对后,设备根据角色...
DRCP允许数据库服务器保持一组空闲的会话,当需要时,这些会话可以立即分配给用户,减少了建立新连接的时间。此外,DRCP还可以帮助管理会话状态和资源,进一步优化了性能和资源利用率。 总结来说,缓存和连接池是...
分布式远程连接池(DRCP)是一种优化策略,尤其适用于跨网络的数据库连接。通过缓存数据库连接,DRCP可以减少网络通信次数,从而提升性能。然而,这也意味着需要更精细地管理资源,避免过度使用数据库连接导致性能...
使用cx_Oracle,你可以配置应用程序以利用DRCP,从而提高资源利用率并减少数据库服务器的负载。 ### Database Startup/Shutdown cx_Oracle提供了控制数据库启动和关闭的功能。这在需要执行维护任务或处理紧急情况...
- **Database Resident Connection Pool (DRCP)**:一种内存中的连接池技术,允许重复利用已存在的数据库连接,从而减少资源消耗和提高性能。 - **Fast Application Notification (FAN)**:当数据库发生状态变化时...
- **DRCP 模式**:内存使用 = 100 * (400KB + 4MB) = 615MB 通过对比可以看出,在不同服务模式下,内存的使用量有着显著的差异。共享服务器模式和 DRCP 模式可以有效减少内存消耗。 #### 三、Oracle后台进程 ...
- **概念**: DRCP是一种优化机制,可以在数据库服务器上保留一定数量的空闲连接,以便快速响应新的请求。 - **优势**: 减少了连接建立和销毁的时间,提高了应用程序的整体性能。 - **适用场景**: 特别适用于高并发的...
支持操作oracle 数据库的扩展控件 These functions allow you to access Oracle ... Oracle's scalability features such as Database Resident Connection Pooling (DRCP) and result caching are also supported.
6. **DRCP超时时间**:DRCP(Device Resilient Control Protocol)超时时间分为短超时(3秒)和长超时(90秒),这是DR系统心跳检测和状态切换的重要参数。 7. **主备竞选规则**:在DR系统中,主设备的选举首先比较...
目前最新版本 0.2 还是个预览版本,开发团队还在不断完善,包括对 Windows 平台的支持、LOB 支持、批获取/大查询结果集的流处理以及 DRCP 支持等。支持 Oracle 的基本和高级特性:SQL 和 PL/SQL 执行使用 javascript...
3. **高可用性策略**:讨论了故障检测、故障转移和数据保护机制,如Automatic Workload Repository (AWR)、Database Resident Connection Pool (DRCP) 和Fast Application Notification (FAN)。 4. **性能优化**:...
10. **Database Resident Connection Pool (DRCP)**:优化数据库连接管理,减少资源消耗。 Oracle RAC的实施和维护需要深入了解数据库原理、操作系统、网络以及存储等多方面知识。在实际应用中,要确保正确的硬件...
6. **Database Resident Connection Pool (DRCP)**: - 优化资源利用率,减少连接开销,通过池化数据库连接来服务多个客户端请求。 7. **Load Balancing**: - RAC能够自动将工作负载分配到不同的实例上,降低...
8. **连接池和资源管理**:Oracle 提供了数据库居民连接池(DRCP)、并发连接池(GDS Pool)等,以优化连接管理和资源分配,减少资源竞争。 9. **进程结构**:12cR2 中,有代表 Oracle 传统进程的组件,也有针对新...