公司为了好几个产品间的数据同步与共享,要求产品部做出个方案来,对于这个问题,要满足两个条件:1 应用集群2 多机集群,所以针对多机应用集群的上载文件处理可以采用以下几种方式。
1. 存入数据库
将上载的文件存入数据库可以很好解决这个问题,目前主流数据库对大字段都有很好的支持,如oracle等。
应用范围:集群中的各个应用共用一个数据库(或数据库集群),对于文件的读取则不再有任何问题。
缺点:1. 如果不同的应用对数据的处理量较大,则存库的内容就会导致数据库的数据量非常大,数据库的开销较大,影响整个应用的性能。
2. 对于应用集群共用一个库,不是很现实,尤其是那些有自己应用系统特殊权限的,对库的控制较严。
2. 采用共享目录
设置一个共享目录,将上载文件存储在这个共享目录中,集群中的各个应用均访问这个共享目录即可。
对于共享目录,现在有比较成熟的技术,如NFS。
独立的文件服务器
把上传下载的部分独立成web系统,对不同的系统应用提供单独的接口。
应用范围:需要自己开发组件,控制上传与下载。可以利用socket、FTP协议与服服务器端做连接。
优缺点:
1. 自己写服务端与客户端组件。纯socket通信、或者是借用mina框架,并发性、性能不好不一定有很好的效果。
2. 利用开源的组件搭建服务端。只需写客户端。 像FTP服务器,本身就支持大文件的数据传输。自己开发客户端,但是对上传下载的控制,不好处理。对第三方组件的依赖性,第三方组件对系统环境的依赖性等都比较繁琐。
3. 第三方开源的文件服务器。例如 淘宝的开源文件系统 :TFS。以及像 fastFS。Hadoop的hdfs等等。其都是建立在特定的应用中。TFS就是正对小文件的海量存储。虽然在性能、集群、容灾方面都有不存的表现,但是对于不同的应用,不一定满足自己的应用。
从以上角度来看,共享目录还是中小企业比较实用并且有效的方法。大家有什么看法,可以继续探讨。技术上,方案上,随便说。。。
分享到:
相关推荐
#### 四、小结 本文档提供了在Ubuntu上搭建Hadoop集群的具体步骤和注意事项,通过这些步骤,用户可以在自己的计算机上快速搭建一个功能完整的Hadoop集群。在整个过程中,需要注意硬件资源的合理分配以及各个组件之间...
2-1 HBase简介及其在大数据生态圈的位置 2-2 HBase数据存储模型及与关系型数据库的区别 2-3 Hadoop伪分布式集群安装 2-4 HBase伪分布式集群安装 2-5 HBase基础架构 2-6 HBase阶段小结 第3章 HBase原理与实战 介绍...
7-6_Centos7下Docker部署Ceph集群(nautilus最新版,多机部署).mp4 第08章 “云存储”系统之基于阿里云OSS实现海量数据上云 8-1_阿里云对象存储OSS简介.mp4 8-2_阿里云对象存储OSS特点.mp4 8-3_阿里云对象存储OSS...
包括但不限于数据的有效存储和处理、高并发访问下的系统稳定性和性能、大数据量的分析挖掘、小文件存储问题的解决、备份文件至云端的优先级策略、文件全路径的存放方式以及Namespace的管理等。 通过上述内容的介绍...
- **MIME 类型检测**:确保上传文件类型正确。 - **文件大小限制**:防止恶意用户上传过大文件。 - **文件名重命名**:保证文件系统安全。 **4.6 小结** - **表单处理注意事项**:保障数据完整性和安全性。 #### ...
1. **数据准备**:在HDFS中创建名为wordcount的文件夹,并将待处理的文本文件(如word.txt)上传至input目录。 2. **查看文件状态**:使用HDFS命令检查文件夹和文件内容。 3. **运行WordCount程序**:调用Hadoop自带...
1.8 小结 第2章 快速入门 2.1 实例功能概述 2.1.1 比Hello World更适用的实例 2.1.2 实例功能简介 2.2 环境准备 2.2.1 创建库表 2.2.2 建立工程 2.2.3 类包及Spring配置文件规划 2.3 持久层 2.3.1 建立领域对象 ...
1.8 小结 第2章 快速入门 2.1 实例功能概述 2.1.1 比Hello World更适用的实例 2.1.2 实例功能简介 2.2 环境准备 2.2.1 创建库表 2.2.2 建立工程 2.2.3 类包及Spring配置文件规划 2.3 持久层 2.3.1 建立领域对象 ...
47docker数据卷小结官方htpd镜像运行容器mp4 48docker跑mariadb或mysql应用mp4 49 docker跑应用补充与小结,mp4 50 ockerfile个绍参数讲解1mp4 51 ockerfile参数讲解2mp4 52ockerfile构建httpd镜像,mp4 53...
1. **创建目录与上传文件** 在Hadoop集群上创建一个名为`input`的目录,并将本地文件`file01`和`file02`上传至该目录下。这可以通过运行`Hadoop/bin/hadoop fs -mkdir input`以及`Hadoop/bin/hadoop fs -...
- 实验中提到的新建emp.txt文件,然后将其上传到HDFS并装载到Hive表中,体现了Hive对非结构化数据的支持。 5. **Hive UDF开发**: - UDF允许用户自定义函数,扩展Hive的功能。 - 开发过程包括创建Java工程,添加...
### 小结 整个部署手册是NVIDIA、VMware和Citrix三家技术巨头产品整合使用的一个全面指南。它包含了最新版本的技术更新和变更记录,使得技术从业者可以根据最新的软件版本和文档指南进行环境搭建和优化。部署手册...
2. 分发:将Parcel文件上传到CDH集群的Parcel分发目录,通常是 `/opt/cloudera/parcel-repo`。 3. 验证:使用Cloudera Manager验证Parcel的完整性,并将其添加到集群的Parcel列表中。 4. 分发和激活:通过Cloudera...
### 小结 《WebLogic安装和应用部署简单图释》不仅提供了清晰的操作流程,还包含了丰富的图形示例,对于初次接触WebLogic Server的用户而言,是一份不可多得的学习资料。通过本文的详细解析,相信读者能够对WebLogic...
3.4 小结 ........................................................................................................................................... 25 第 4 章 工欲善其事,必先利其器.....................