【FlumeBase介绍】

gaojingsong

浏览: 1237022 次
性别:
来自: 深圳

最近访客更多访客>>

muyuanqiang7

ZZ_lll

boveysmith

zah5897

博主相关

博客

微博

相册

留言

关于我

文章分类

社区版块

存档分类

博客分类：

大数据之Flume

FlumeBase介绍

FlumeBase是一个建立在Flume之上的数据驱动的流处理系统。这个系统允许用户动态的向数据收集环境插入查询并且监控被Flume收集到的事件流。这些查询可能是抽样调查输入的数据，也可能是指定固定的监控，也可能是数据转换或者是质量过滤任务。这些查询是用一个类似于SQL的名为“rtsql”语言编写的。

FlumeBase可以把数据反馈给一个在交互的shell环境下的用户。它也可以配置成把输出的事件流返回到Flume网络中，用于被其他的工具使用或者持久化到Hbase、HDFS或者其他的存储介质中。

这个系统强调对被Flume捕获到的输入数据的低延迟分析。“rtsql”语言的名字强调了系统的实时查询特性，也说明了衍生于基于SQL的查询语言语法。FlumeBase被期望于在把被Flume捕捉的数据被用类似于Hadoop一样的工具去深入分析（可能是高延时的）之前，可以允许你执行有效的in-line数据转换或者过滤，或者有时效性的消息或者是一个更广泛系统的调谐。

警告FlumeBase是一个实验性的系统！现在还不能满足生产环境使用的要求。把这个系统连接到Flume生产环境的节点上可能会导致数据丢失，错配置或者其他比较严重的问题。

FlumeBase系统是由一个命令行客户端、一个成为执行环境的服务器和负责收集和传输数据的Flume系统组成。这些可能被配置为单独的、分布式的进程、或者相对的在一个机器上甚至是在一个进程中。

命令行客户端是这里面最简单的组件。这个进程直接被一个用户运行(可能是一个服务器、但是更多的是他的桌面电脑或者笔记本)。它需要连接到执行环境。这个客户端提供给用户一个提示信息，这个提示中可能会有新的查询或者控制语句被给出。

每一个查询(比如说，SELECT语句)会产生一个在执行环境中的流。用户可能需要订阅正在运行的流(这对于用户新创建的流是自动完成的)。当一个订阅的流发出一个输出事件，它的文本将被打印到客户端的终端上。

关闭客户端不会终止任何已提交的流，它们运行在执行环境中，执行环境是一个单独的可以被多个用户共享的常驻进程。一个执行环境保存着所有流的定义(用CREATE STREAM创建)，并处理运行中的流。所以执行环境一般运行在专用的服务器上。为了测试的需要，可能也会包含在和命令行客户端相同的进程中。(当执行环境内嵌到客户端的时候，关闭客户端将关闭所有的流，并且不能够在获得这些流)

提交的查询可以在流的数据上做计算。流被定义为一个事件集，就类似于在以表为基础的SQL执行环境中的记录。这些事件直接和Flume中的事件连接。用户需要在查询之前先定义这个流，这个定义指定了在这个事件中的字段，包括怎样把事件主体转换成字段和这个流起源于哪里。每一个查询流本身是一个流，它的输出是一系列的事件，这些输出的事件是基于用户指定的计算处理过程和这个查询流所输入的事件集。

默认情况下，被用户提交的查询将导致一个没有名称标识的查询流，这个查询流只会把它的输出传送给订阅的客户端实例。这些查询流在没有用户订阅的时候持续的运行，但是这时候所生成的输出结果将被丢弃掉(而且也没办法在此获取)。

用户可以给运行的查询流绑定一个名称(或者在使用CREATE STREAM AS SELECT语句提交一个查询流的时候这样做)。这个名称被作为一个Flume逻辑节点的名称，这个逻辑节点把这个查询流的结果作为一个Avro编码的事件集广播出去。用户可以接着使用Flume的shell把这个逻辑节点配置成把一个该输出结果的拷贝定向到一个监控的应用，比如持久化存储(比如HDFS)或者其他的应用。

FlumeBase通过修改在CREATE STREAM语句中指定的节点的接收器的定义来从一个Flume的网络读取。当一个逻辑节点被确定为一个流的源头，它的接收器定义被重写为一个包含它原有的接收器和一个新的代理接收器的新的接收器，这个新的代理接收器负责把这个节点的输出推送给在FlumeBase执行环境中的一个collector source 。(FlumeBase将拥有一个内嵌的Flume物理节点，这节点将拥有托管给它的一个逻辑节点作为接受和传送事件流的必要条件).当一个流被丢弃掉(使用DROP STREAM或者\shutdown!直接关掉执行环境)的时候，最初的逻辑节点的定义会被恢复为提供数据流的那个逻辑节点。

在FlumeBase执行环境和Flume之间的交互式通过Flume的master节点的thrift接口完成的。寄宿在一个执行环境中的物理节点是被Flume的master节点所控制的，而且是对于所有的Flume节点都是这样的。因为这个原因，查询流可能需要花费几秒钟去初始化或者取消，因为这些都依赖于Flume方面的配置。一旦初始化成功，查询流将在事件的处理上有较低的延时。如果没有外部的Flume网络可用，你可以配置Flume的执行环境来维护一个内嵌的Flume的master节点，以用于测试或者单机计算的目的。

0
顶

0
踩

分享到：

【Jafka 介绍】 | 【自然语言之分类处理】

2017-03-15 20:52
浏览 741
评论(0)
分类:开源软件
查看更多

发表评论

您还没有登录,请您登录后再发表评论

相关推荐

【Linux设备管理】从devfs到udev：设备文件系统演变及其关键技术对比分析了Linux设备管理: 内容概要：本文详细介绍了Linux设备文件系统从devfs到udev的演变过程。devfs作为Linux 2.4时代的创新，通过引入内核空间的设备管理机制，简化了设备文件的创建和管理，但其存在稳定性问题和灵活性不足的缺点。udev则运行在用户空间，利用内核发送的热插拔事件和sysfs提供的信息，实现了设备文件的动态管理和高度自定义。它不仅解决了devfs的问题，还提供了更灵活、高效的设备管理方式，成为现代Linux系统中的主流选择。文章还探讨了两者在不同应用场景中的优劣，并展望了未来Linux设备管理的发展方向，强调了对新型设备的支持、虚拟化和容器环境的兼容性以及智能化的用户体验。适合人群：对Linux系统有一定了解，特别是对设备管理感兴趣的开发人员、系统管理员和技术爱好者。使用场景及目标：①理解Linux设备管理的历史和发展趋势；②掌握devfs和udev的工作原理及其在不同场景下的应用；③学习如何编写udev规则文件，实现设备的个性化管理和优化配置。阅读建议：本文内容较为技术性，建议读者先了解基本的Linux设备管理概念。在阅读过程中，重点关注devfs和udev的区别和优势，并结合实际应用场景进行思考。对于udev规则文件的编写，可以通过实践和调试加深理解。

三维路径规划中RRT与APF融合算法及其路径平滑处理: 内容概要：本文详细介绍了将快速随机树(RRT*)和人工势场(APF)相结合用于三维空间路径规划的方法。首先阐述了两种算法的工作原理，特别是APF如何通过引力和斥力向量引导RRT*的节点扩展，使得路径规划更加高效且能够有效避开障碍物。接着讨论了路径平滑处理的具体实现方式，如利用贝塞尔曲线进行路径优化，确保最终路径不仅平滑而且不会发生碰撞。此外，文中还提供了具体的代码片段来展示各个模块的功能，包括APF核心算法、RRT*扩展逻辑、碰撞检测以及路径平滑等。同时提到了一些潜在的改进方向，如引入速度场因素、采用不同的平滑算法等。适合人群：对机器人路径规划、无人驾驶等领域感兴趣的开发者和技术爱好者。使用场景及目标：适用于需要在复杂三维环境中进行高效路径规划的应用场合，如无人机飞行、自动驾驶汽车等。主要目的是提高路径规划的速度和质量，使生成的路径更加平滑、安全。其他说明：本文不仅提供了理论解释，还有详细的代码实现，便于读者理解和实践。对于希望深入了解RRT*和APF融合算法并应用于实际项目的读者来说是非常有价值的参考资料。

HikvisionIVMSGetShell-main.zip: HikvisionIVMSGetShell-main.zip

动态演示后缀表达式的计算方式: 动态演示后缀表达式的计算方式

大学战队2021雷达站视觉算法源码.zip: 1、该资源内项目代码经过严格调试，下载即用确保可以运行！ 2、该资源适合计算机相关专业(如计科、人工智能、大数据、数学、电子信息等)正在做课程设计、期末大作业和毕设项目的学生、或者相关技术学习者作为学习资料参考使用。 3、该资源包括全部源码，需要具备一定基础才能看懂并调试代码。大学战队2021雷达站视觉算法源码.zip大学战队2021雷达站视觉算法源码.zip 大学战队2021雷达站视觉算法源码.zip大学战队2021雷达站视觉算法源码.zip 大学战队2021雷达站视觉算法源码.zip大学战队2021雷达站视觉算法源码.zip 大学战队2021雷达站视觉算法源码.zip大学战队2021雷达站视觉算法源码.zip 大学战队2021雷达站视觉算法源码.zip大学战队2021雷达站视觉算法源码.zip 大学战队2021雷达站视觉算法源码.zip大学战队2021雷达站视觉算法源码.zip 大学战队2021雷达站视觉算法源码.zip大学战队2021雷达站视觉算法源码.zip 大学战队2021雷达站视觉算法源码.zip大学战队2021雷达站视觉算法源码.zip 大学战队2021雷达站视觉算法源码.zip大学战队2021雷达站视觉算法源码.zip 大学战队2021雷达站视觉算法源码.zip大学战队2021雷达站视觉算法源码.zip 大学战队2021雷达站视觉算法源码.zip大学战队2021雷达站视觉算法源码.zip

MATLAB用户界面设计.pptx: MATLAB用户界面设计.pptx

程序员面试题精选100题.pdf: 程序员面试题精选100题.pdf

牵牛花铅笔素材儿童教学课件模板.pptx: 牵牛花铅笔素材儿童教学课件模板

基于C++的rviz机械臂各类仿真+源码+项目文档（毕业设计&课程设计&项目开发）: 基于C++的rviz机械臂各类仿真+源码+项目文档，适合毕业设计、课程设计、项目开发。项目源码已经过严格测试，可以放心参考并在此基础上延申使用，详情见md文档基于C++的rviz机械臂各类仿真+源码+项目文档，适合毕业设计、课程设计、项目开发。项目源码已经过严格测试，可以放心参考并在此基础上延申使用，详情见md文档~ 基于C++的rviz机械臂各类仿真+源码+项目文档，适合毕业设计、课程设计、项目开发。项目源码已经过严格测试，可以放心参考并在此基础上延申使用，详情见md文档基于C++的rviz机械臂各类仿真+源码+项目文档，适合毕业设计、课程设计、项目开发。项目源码已经过严格测试，可以放心参考并在此基础上延申使用，详情见md文档基于C++的rviz机械臂各类仿真+源码+项目文档，适合毕业设计、课程设计、项目开发。项目源码已经过严格测试，可以放心参考并在此基础上延申使用，详情见md文档基于C++的rviz机械臂各类仿真+源码+项目文档，适合毕业设计、课程设计、项目开发。项目源码已经过严格测试，可以放心参考并在此基础上延申使用，详情见md文档

三相电流型PWM整流Matlab仿真：电压外环与电流内环双闭环控制策略详解: 内容概要：本文详细介绍了三相电流型PWM整流的Matlab仿真过程，采用了电压外环和电流内环的双闭环控制策略。电压外环负责维持直流侧电压的稳定，通过PI调节器输出电流给定值；电流内环根据电压外环的给定值和实际检测到的三相电流，经过PI调节器产生PWM波来控制整流器的开关动作，实现对交流侧电流的精确控制。文中提供了详细的系统参数设置、PI调节器参数设定、主循环仿真代码以及坐标变换的具体实现方法。此外，还讨论了PWM调制、开关信号生成、仿真结果分析等内容，并附有说明文档和参考文献。适合人群：从事电力电子、控制系统设计的研究人员和技术人员，尤其是对PWM整流器感兴趣的工程师。使用场景及目标：适用于研究和开发三相电流型PWM整流器的人员，帮助他们理解和实现双闭环控制策略，提高系统的稳定性和效率。目标是在不同工况下实现直流侧电压的稳定和网侧电流的正弦化，达到单位功率因数运行。其他说明：文中提供的代码和仿真模型已在MATLAB 2021b及以上版本测试通过，附带的说明文档包含了参数整定表、典型波形库和故障排查指南，有助于解决实际应用中的问题。

五相永磁同步电机单相开路故障下的矢量容错控制技术解析: 内容概要：本文详细探讨了五相永磁同步电机（PMSM）在发生单相开路故障时的矢量容错控制方法。首先介绍了五相电机相较于三相电机的优势及其容错机制的基本原理。随后，文章深入讨论了故障发生时的电流重构策略，包括Clarke变换矩阵的修改、电流补偿系数的选择以及相位补偿的方法。此外，文中还涉及了矢量控制的具体实现，如矢量合成、SVPWM调制方式的调整、电流环整定的自适应算法等。最后，通过实测数据分析了不同故障条件下的系统表现，并提出了进一步的研究方向和技术改进措施。适合人群：从事电机控制系统设计与开发的技术人员，尤其是关注五相永磁同步电机容错控制领域的研究人员。使用场景及目标：适用于需要提高电机系统可靠性和容错能力的应用场合，如工业机器人、电动汽车等领域。主要目标是在单相开路故障情况下，确保电机能够继续稳定运行并尽可能减少性能损失。其他说明：文章不仅提供了理论分析，还包括大量实际案例和代码片段，有助于读者更好地理解和应用相关技术。同时提醒读者，在进行容错控制设计时要考虑实际系统的非线性特性，避免因参数设置不当而导致系统不稳定。

电力系统暂态分析中PSS对单机无穷大系统稳定性影响的Simulink仿真研究: 内容概要：本文详细探讨了在单机无穷大系统中加入电力系统稳定器(PSS)前后，系统在不同扰动条件下的暂态响应情况。首先介绍了同步发电机的基本参数配置及其连接方式，然后分别进行了无PSS和带有PSS两种情况下系统的稳态运行、小扰动以及三相短路故障仿真实验。结果显示，PSS能够显著提高系统的阻尼水平，有效抑制因各种原因引起的振荡现象，确保系统快速恢复稳定状态。适用人群：从事电力系统分析、自动化控制领域的研究人员和技术人员。使用场景及目标：适用于希望深入了解PSS在电力系统中作用机制的研究者，以及需要评估PSS对于特定应用场景下系统性能改善效果的专业人士。通过本案例的学习，可以帮助使用者掌握如何利用MATLAB/Simulink进行相关仿真实验的方法。其他说明：文中提供了详细的建模步骤和参数设定指南，并附有多张对比图表帮助理解PSS的作用效果。同时提醒了一些常见的操作误区，如仿真步长的选择等。

2023-04-06-项目笔记 - 第四百七十三阶段 - 4.4.2.471全局变量的作用域-471 -2025.04-19: 2023-04-06-项目笔记-第四百七十三阶段-课前小分享_小分享1.坚持提交gitee 小分享2.作业中提交代码小分享3.写代码注意代码风格 4.3.1变量的使用 4.4变量的作用域与生命周期 4.4.1局部变量的作用域 4.4.2全局变量的作用域 4.4.2.1全局变量的作用域_1 4.4.2.471局变量的作用域_471- 2025-04-19

病理分割-基于深度学习实现的腹部多器官分割算法-附项目源码-优质项目实战.zip: 病理分割_基于深度学习实现的腹部多器官分割算法_附项目源码_优质项目实战

基于三菱PLC和触摸屏的停车场智能管理系统设计与实现: 内容概要：本文详细介绍了基于三菱PLC和三菱触摸屏构建的停车场智能管理系统。系统分为入口、出口和管理中心三大部分，分别负责车辆身份识别、车位检测、道闸控制、缴费结算等功能。三菱PLC作为核心控制器，通过梯形图编程实现了车辆检测、道闸控制等关键逻辑；三菱触摸屏提供人机交互界面，支持参数设置、状态监控等功能。文中还讨论了PLC与触摸屏之间的通信配置，以及如何通过物联网技术将系统接入云端。适合人群：从事智能交通系统开发的技术人员，尤其是熟悉三菱PLC编程和触摸屏应用的工程师。使用场景及目标：适用于新建或改造停车场项目，旨在提高停车场管理效率和服务质量，减少人工干预，实现智能化运营。其他说明：文中提供了具体的硬件配置建议、PLC编程实例、触摸屏界面设计指南及通信协议解析，有助于读者快速理解和实施类似项目。

Code_20250419.html: Code_20250419.html

基于MSP430F5529的无线温湿度传输系统设计与实现: 内容概要：本文详细介绍了基于MSP430F5529微控制器构建的无线温湿度传输系统的完整设计方案。系统集成了DHT11湿度传感器、DS18B20温度传感器、Nokia5110显示屏、按键模块、报警模块和nRF24L01无线传输模块。文章不仅涵盖了硬件连接细节，还深入讲解了各模块的驱动代码实现，包括传感器数据读取、数据显示、按键处理、报警机制和无线数据传输。此外，还讨论了一些优化措施，如低功耗模式的应用和传感器供电稳定性。适合人群：具有一定嵌入式系统开发基础的技术人员，尤其是对MSP430系列微控制器感兴趣的开发者。使用场景及目标：适用于需要实时监测环境温湿度并进行远程数据传输的场合，如智能家居、农业温室、工业环境监测等。目标是帮助读者掌握MSP430F5529的实际应用技能，理解各模块之间的协同工作原理。其他说明：文中提供的代码片段可以直接应用于实际项目中，有助于快速搭建原型系统。同时，文章还提供了一些调试经验和常见问题解决方案，便于读者在实践中少走弯路。

台达DVP PLC RS485通信实现多台变频器频率读写及启停控制: 内容概要：本文详细介绍了如何利用台达DVP PLC通过RS485接口与多台变频器进行通信，实现读取设定频率、设定变频器频率及控制启动和停止的功能。主要内容涵盖硬件连接、通讯参数设置、编程实例及常见问题解决方案。文中提供了具体的梯形图代码示例，解释了MODBUS RTU协议的应用，包括功能码的选择、寄存器地址的定义、CRC校验的处理方法等。适合人群：从事工业自动化领域的工程师和技术人员，特别是那些需要掌握PLC与变频器通信技能的人。使用场景及目标：适用于需要集成PLC控制系统并管理多个变频器的工作环境，如工厂生产线、自动化设备等。目标是提高系统的稳定性和可靠性，确保各个变频器能够按照预设的要求高效运作。其他说明：文中强调了实际应用中的注意事项，如硬件连接的准确性、通讯参数的一致性、数据传输的安全性等，并给出了详细的调试建议和优化措施。此外，还提到了一些常见的陷阱及其应对策略，帮助读者更好地理解和解决问题。

MATLAB/Simulink中二阶线性自抗扰控制器(LADRC)的高效电机控制仿真模型: 内容概要：本文详细介绍了基于MATLAB/Simulink平台构建的二阶线性自抗扰控制器（LADRC）用于电机控制的应用。文章首先指出了传统PI控制器存在的响应慢、易振荡的问题，随后深入探讨了LADRC的核心组成部分：跟踪微分器TD、线性扩张状态观测器LESO以及误差反馈控制律。文中展示了LADRC在面对负载突变时表现出色的抗扰能力和快速响应特性，并提供了具体的参数调整方法和调试技巧。此外，作者还分享了将LADRC应用于实际工程项目的经验，强调了其相较于传统PI控制器的优势，特别是在鲁棒性和适应不同电机型号方面的表现。适合人群：从事电机控制领域的工程师和技术人员，尤其是那些希望提高控制系统性能并解决传统PI控制器局限性的专业人士。使用场景及目标：适用于需要快速响应和强抗扰能力的电机控制系统设计，旨在替代传统的PI控制器，以获得更好的动态响应和平滑的操作体验。具体应用场景包括但不限于伺服压机、绕线机等工业自动化设备。其他说明：文中提到的所有代码片段均可以在MATLAB环境中运行，且已封装成Simulink模块，便于集成到现有系统中进行测试和验证。对于初次接触LADRC的新手而言，文中提供的调试经验和参数选择建议尤为宝贵。

【脑电信号处理】基于matlab EEG信号（EP42）傅里叶变换和功率谱密度特征提取【Matlab仿真 3380期】.zip: CSDN Matlab武动乾坤上传的资料均有对应的代码，代码均可运行，亲测可用，适合小白； 1、代码压缩包内容主函数：main.m；调用函数：其他m文件；无需运行运行结果效果图； 2、代码运行版本 Matlab 2019b；若运行有误，根据提示修改；若不会，私信博主； 3、运行操作步骤步骤一：将所有文件放到Matlab的当前文件夹中；步骤二：双击打开main.m文件；步骤三：点击运行，等程序运行完得到结果； 4、仿真咨询如需其他服务，可私信博主或扫描博客文章底部QQ名片； 4.1 博客或资源的完整代码提供 4.2 期刊或参考文献复现 4.3 Matlab程序定制 4.4 科研合作

最近访客 更多访客>>

博主相关

文章分类

社区版块

存档分类

最新评论