工作中常常需要在linux线上环境处理数据,比如:处理log分析,mysql数据提取等等。
你可能首先想到的是shell,或在python。
shell确实简练,但是有时候并不好用,比如复杂数据的统计,shell显得过于简陋。
python当然可以应对多种需求,由于linux 都标配了python,熟悉python 那是相当方便。
不过对于业界 java语言的普及度是很高的,很多同事在处理数据的时候,由于对python不熟悉,效率很低,要把数据搞到本地,再tmd写java处理,实在坑爹。
下面兄弟谈下java在linux下的配置java环境以及处理数据,尤其是引用第三方的jar包,自我感觉相当方便~
第一步:配置jdk环境。
vim .profile
export JAVA_HOME=/home/q/java/jdk1.6.0_20
export PATH=$JAVA_HOME/bin:$PATH
export CLASSPATH=.:$JAVA_HOME/lib/dt.jar:$JAVA_HOME/lib/tools.jar:~/java/lib/*.jar
注意:最后我指定了:~/java/lib/*.jar ,这些jar包是jdk提供之外的jar包。
第二步:配置 Djava.ext.dirs,java编译和执行时引用jdk之外的jar包
alias jc='javac -Djava.ext.dirs=/home/xinchun.wang/java/lib'
alias jr='java -Djava.ext.dirs=/home/xinchun.wang/java/lib'
第三步:测试
import org.apache.commons.lang.StringUtils;
public class Test2{
public static void main(String[] args){
System.out.println(StringUtils.isEmpty(""));
System.out.println(StringUtils.isEmpty("hellow"));
}
}
执行:
jc Test2.java
jr Test2
输出:
true
false
至此:已经成功配置~
总结:
shell :实在不好用,但是简单的数据处理以及统计,那是简洁高效方便
python:胜任所有场景,熟悉的话,就优先使用啦,尤其是在执行环境多变的情况,可移植性好,比如给dba执行一个db数据处理的情况,对方可能没有装java环境,或者环境配置不一致,这块java不让python。
java:胜任所有场景,移植性(因为不同组的同事可能不装java环境,但是python肯定都有)相对python较差。
分享到:
相关推荐
**Python大数据处理库 PySpark 实战** 在大数据领域,PySpark是Python编程语言与Apache Spark框架相结合的重要工具,它提供了Python API,使得开发者能够利用Spark的强大功能进行数据处理。PySpark广泛应用于数据...
本文将详细介绍如何在Java中调用Shell脚本和Python脚本,并重点讨论如何正确处理不同规模的数据输出。 #### 二、Java调用Shell脚本和Python脚本的基本方法 ##### 2.1 使用`Runtime.exec()`调用脚本 Java中可以...
例如,Shell擅长自动化和系统调用,Java在企业级应用中以其稳定性和跨平台特性受到青睐,而Python则因其简洁和在数据处理方面的强大功能而广受欢迎。这种多语言融合的方式既体现了实际应用中的灵活性,也表明了实训...
- Java基础知识和核心概念,如CheckDecimalConverter类的实现可能涉及Java中的数据类型转换机制。 - 公共代码设计的最佳实践,例如PoiUtil工具类如何设计以便复用。 - 跨语言编程的技巧和方法,特别是如何将Shell...
标题 "中英文语料处理脚本,python,c++,java_Python_Shell_下载.zip" 暗示了这是一个包含多种编程语言(Python、C++、Java)用于处理中英文语料的代码集合。这个压缩包可能包含了用于数据预处理、文本分析、语言...
整体而言,该Demo项目提供了一个结合了Java、Shell和Python三种语言的多语言贷款核算系统,通过合理地分配各语言在系统中扮演的角色,实现了数据处理的高效性和系统功能的完备性。对于希望在金融软件领域中寻找一个...
无论是Java的广泛应用,Shell的系统操作能力,还是Python的高效数据处理,这些都为复杂系统的设计和开发提供了多样化的解决方案,极大地增强了项目的灵活性和实用性。 该项目不仅为开发者提供了一个强大的工具集,...
它们使得数据处理、分析和可视化的过程变得更为直观和动态,让读者可以在学习理论的同时,通过实践加深理解。 在实际的项目开发中,版本控制系统扮演着重要的角色,这也是项目中包含.gitignore文件的原因。....
Python在本项目中虽然提及不多,但作为一门简洁明了的编程语言,它在处理一些数据处理和算法实现方面有着独特的优势。在开发过程中,Python可以用来快速编写工具脚本,进行数据清洗、分析,甚至在某些复杂算法的实现...
标题中提到的“Python_使开发人员的日常生活更轻松、更快乐的有用脚本包括Java shell等.zip”表明了压缩包内容的核心价值在于为开发人员提供一系列实用的脚本。这些脚本不仅局限于Python语言,还可能包括Java shell...
RocketMQ作为一个流行的开源消息处理平台,广泛应用于企业级消息中间件解决方案中,尤其在大数据处理和实时计算场景下有出色表现。通过深入源码级别的学习与分析,本项目将有助于开发者更好地理解RocketMQ的内部机制...
此项目为《linux工匠》博客,以及日常运维中所用到的shell,python脚本和k8s服务配置,集群安装文档等 软件开发设计:应用软件开发、系统软件开发、移动应用开发、网站开发C++、Java、python、web、C#等语言的项目...
Java作为广泛应用于企业级应用开发的语言,其在该项目中的大量应用表明系统可能涉及较为复杂的业务逻辑和数据处理。这995个Java文件中,可能包括了业务逻辑处理、数据访问层、用户界面等多个模块的代码。 图像文件...
自动安装Python和Java,并配置环境变量的自动化脚本能够大幅提高工作效率,尤其在需要频繁搭建开发环境的场景中更为有用。通过合理编写和测试脚本,可以确保脚本的可靠性和健壮性,从而为开发工作提供便捷和稳定的...
Java文件中包含的数据处理、业务逻辑、网络通信等核心代码是ERP系统能够高效运行的基础。 XML配置文件共有88个,XML文件通常用于配置数据和描述应用结构,这意味着系统可能具有高度模块化和可配置性,能够根据企业...
基于Java、Shell、Python语言的BenchmarkSQL 5.1版本TPCC性能测试工具源码,是一款专注于数据库性能评估的开源工具。它采用目前流行的编程语言Java、Shell和Python进行开发,能够为用户提供强大的数据库测试能力。 ...
本项目以Java为核心,巧妙地融入了Shell和Python脚本,展示了一个完整的技术集成方案。整个项目包含424个文件,分为多个部分,其中Java源文件占据了主体,共计294个,说明项目的大部分逻辑和功能都是通过Java实现的...
该项目是一个综合性的代码仓库设计,由老牛同学主持开发,其中融合了多种编程语言和技术,主要涵盖了Python、Java和Shell这三种语言。这个代码仓库的构建不仅体现了老牛同学在编程领域的多元技能,也为编程爱好者...
例如,Java可以处理大量的业务逻辑,Python可以快速实现数据处理和分析任务,Shell则可以高效执行系统管理任务。 此外,该项目作为云智慧项目的后端设计源码,也势必涉及到安全性、稳定性和可维护性等关键因素。在...