mysql applier with hadoop - 术业有专攻 - ITeye博客

`

ylzhj02

浏览: 250659 次
性别:
来自: 成都

最近访客更多访客>>

daqin

bbpopeye

也许on

learnmore

博主相关

博客

微博

相册

收藏

留言

关于我

文章分类

社区版块

存档分类

最新评论

oldrat： https://github.com/oldratlee/tr ...
Kafka: High Qulity Posts

mysql applier with hadoop

博客分类：

Hadoop

阅读更多

MySQL Applier for Hadoop

Replication via the Hadoop Applier is implemented by connecting to the MySQL master and reading binary log events as soon as they are committed, and writing them into a file in HDFS. "Events" describe database changes such as table creation operations or changes to table data.

MySQL to HDFS Integration

The Hadoop Applier uses an API provided by libhdfs, a C library to manipulate files in HDFS. The library comes precompiled with Hadoop distributions.

It connects to the MySQL master to read the binary log and then:

Fetches the row insert events occurring on the master
Decodes these events, extracts data inserted into each field of the row, and uses content handlers to get it in the format required
Appends it to a text file in HDFS.

Databases are mapped as separate directories, with their tables mapped as sub-directories with a Hive data warehouse directory. Data inserted into each table is written into text files (named as datafile1.txt) in Hive / HDFS. Data can be in comma separated format; or any other, that is configurable by command line arguments.

Mapping between MySQL and HDFS Schema

download from http://labs.mysql.com/

Preferences

http://dev.mysql.com/tech-resources/articles/mysql-hadoop-applier.html

http://www.tuicool.com/articles/NfArA3i

a similar project is https://github.com/noplay/python-mysql-replication

分享到：

MySQL Applier For Hadoop: Real time data ... | Architecture of Flume NG

2014-12-08 11:25
浏览 900
评论(0)
分类:开源软件
查看更多

评论

发表评论

您还没有登录,请您登录后再发表评论

相关推荐

MySQL 8 for Big Data-Packt Publishing(2017).pdf: It will cover real-time use case scenarios to explain integration and achieving Big Data solutions using different technologies such as Apache Hadoop, Apache Sqoop, and MySQL Applier. The book will ...

MySQL 8数据库复制技术介绍.pptx: MySQL 8 数据库复制技术介绍 MySQL 8 数据库复制技术是指在一个或多个站点生成和复制多个数据副本的过程。这项技术可以帮助确保数据的一致性和可用性，提高系统的可靠性和性能。数据库复制技术可以应用于各种...

mysql-kafka-applier:用于kafka的mysql realtime-binlog: MySQL Kafka应用程序用于kafka的mysql realtime-binlog 要求 MySQL Binlog事件1.0.0 librdkafka MySQL 5.7.X（二进制和源代码）安装跑步

kube-applier:kube-applier为您的Kubernetes集群实现自动部署和声明式配置: 库伯应用程序 kube-applier是一项服务，可通过将声明性配置文件从Git存储库应用到Kubernetes集群，从而实现Kubernetes对象的连续部署。 kube-applier在您的集群中作为Pod运行，并监视以确保集群对象及其存储库中的...

基于MySQL组复制技术数据备份策略实现.pdf: 隔离核心服务层是MySQL组复制技术的最上层，API接口层是用户访问核心层的接口，核心服务插件层包括capture、applier、recovery三个组件，Replication协议层模块实现了replication协议的逻辑，Group Communication ...

MySQL_57_Replication_Enhancements: 在一个典型的MySQL复制设置中，主要包括以下三个角色：插入客户端（Insert Client），发送线程（Sender thread），接收线程（Receiver thread）以及应用线程（Applier Thread）。在复制过程中，主服务器（Master）上...

lvs+keepalived+mha+mysql架构最佳部署手册: - `masterha_relay_logs_applier`: 应用中继日志。 - `masterha_binlog_replayer`: 重放二进制日志。 - **Node工具包**负责执行具体的故障切换任务，主要包括： - `masterha_node`：用于监控主服务器的状态，...

2020_05_22_mysql_复制问题处理全集.docx: ### MySQL GTID复制问题处理全集 #### 一、引言 MySQL的复制功能是数据库运维中的重要组成部分，尤其在高可用性和数据一致性方面发挥着关键作用。然而，在实际操作过程中，由于各种因素可能会遇到复制中断的问题。...

Python_Auto_Jobs_Applier_AI_Agent旨在通过自动化求职流程来简化求职过程，利用人工智能，.zip: Python_Auto_Jobs_Applier_AI_Agent是一个创新的工具，它的设计宗旨是通过人工智能技术自动化求职过程中的繁琐步骤，以此减轻求职者在寻找工作时所承受的压力。该工具的核心在于应用Python编程语言，结合人工智能的...

Licence Applier-开源: 《Licence Applier：自动化开源软件许可管理工具》在当今的开源软件世界中，遵循正确的许可协议至关重要，它不仅保护了开发者的权益，也确保了用户和贡献者能够合法地使用、修改和分发软件。"Licence Applier" 是...

MySQL MGR 有哪些优点: MySQL MGR，全称为MySQL Group Replication，是MySQL 5.7版本引入的一个高可用性和高扩展性的插件。它的核心目标是解决传统异步复制和半同步复制中可能出现的数据一致性问题，提供一种更为可靠的数据复制解决方案。...

简述mysql监控组复制: - `performance_schema.replication_applier_status`：显示了复制应用器的状态，有助于监控每个工作线程的工作情况。 2. **组成员实例状态** 组中的每个成员服务器可以处于不同的状态： - **ONLINE**：正常工作...

详解MySQL 5.7 MGR单主确定主节点方法: MySQL 5.7版本引入了MySQL Group Replication（MGR）功能，这是一个高可用性、分布式复制方案，允许多个MySQL服务器实例组成一个复制组，并在组内进行故障自动转移和数据一致性处理。在单主模式下，MGR会自动选举出...

openstack-watcher-applier-3.0.2-1.el7.noarch.rpm: 官方离线安装包，测试可用。使用rpm -ivh [rpm完整包名] 进行安装

openstack-watcher-applier-3.0.1-1.el7.noarch.rpm: 官方离线安装包，测试可用。使用rpm -ivh [rpm完整包名] 进行安装

openstack-watcher-applier-3.0.0-1.el7.noarch.rpm: 官方离线安装包，测试可用。使用rpm -ivh [rpm完整包名] 进行安装

openstack-watcher-applier-2.0.0-2.el7.noarch.rpm: 官方离线安装包，测试可用。使用rpm -ivh [rpm完整包名] 进行安装

openstack-watcher-applier-2.0.0-1.el7.noarch.rpm: 官方离线安装包，测试可用。使用rpm -ivh [rpm完整包名] 进行安装

openstack-watcher-applier-1.12.1-1.el7.noarch.rpm: 官方离线安装包，测试可用。使用rpm -ivh [rpm完整包名] 进行安装

openstack-watcher-applier-1.12.0-1.el7.noarch.rpm: 官方离线安装包，测试可用。使用rpm -ivh [rpm完整包名] 进行安装

Global site tag (gtag.js) - Google Analytics