commons-pool对象池实例（一）

博客分类：

java

使用commons-pool 框架实现了一个对象池例子。将官网的例子稍微改动了一下而已。使用的版本是： <dependency> <groupId>org.apache.commons</groupId> <artifactId>commons-pool2</artifactId> <version>2.4.2</version> </dependency> 对象池实现类： package com.my.pool.pooledobject; impo ...

2017-02-06 17:17
浏览 930
评论(0)
分类:开源软件

线性回归的python例子

博客分类：

python
机器学习

参考的文章： http://blog.csdn.net/lulei1217/article/details/49385531 http://blog.csdn.net/LULEI1217/article/details/49386295 我将该作者上面两篇文章中的代码修改后，变成下面的样子。数据集在附件中。 #coding:utf-8 import matplotlib.pyplot as plt import numpy as np import pandas as pd from sklearn import datasets, linear_mo ...

2016-12-09 18:48
浏览 3827
评论(0)
分类:编程语言

MySQLdb的一个例子

博客分类：

python

保存一个例子。使用MySQLdb库去连接MySQL数据库。 import MySQLdb #创建连接 conn=MySQLdb.connect(host=db_url,port=db_port,user=db_user,passwd=db_pwd,db=db_name) cur=conn.cursor() try: #加入临时变量" cur.execute('SET @begin_date=\''+begin_time.strftime("%Y-%m-%d")+'\';') conn.commi ...

2016-11-22 15:24
浏览 446
评论(0)
分类:编程语言

ElasticSearch的多维度聚合心得

博客分类：

elasticsearch
数据库

elasticsearch

最近拿ElasticSearch当数据库使用，应用场景中用到了多维度聚合的需求。聚合需求是：项目id,渠道id,产品id这样的三维度聚合。变成SQL语句的话，大概是 SELECT project_id,channel_id,item_id,SUM(sell_num),SUM(order_num),SUM(sale_income) Group By project_id,channel_id,item_id 如果按照project_id,channel_id,item_id这样的顺序构建Aggregation的话，最终的查询速度会非常的慢。后 ...

2016-10-28 11:16
浏览 1131
评论(0)
分类:开源软件

Hive To Elasticsearch

博客分类：

hadoop
elasticsearch
hive

hive数据往elasticsearch导入的时候，需要用到一个插件。详情可以查看官网。具体的用法是这样：在elasticsearch添加表。在hive创建外部表往hive插入数据关键的步骤是在hive创建表的时候的定义: CREATE EXTERNAL TABLE `report`( `id` string, `rep_date` string COMMENT 'from deserializer', `hour_id` int COMMENT 'from deserializer', `channel_id` st ...

2016-09-21 17:52
浏览 1944
评论(0)
分类:编程语言

使用netty4.0实现Http请求的分发

博客分类：

java

思路是使用executor来处理被分发的请求。主类的代码： package com.mytest.main; import java.net.InetSocketAddress; import java.util.HashMap; import java.util.Map; import org.slf4j.Logger; import org.slf4j.LoggerFactory; import com.mytest.executors.AbstractExecutor; import com.mytest.executors.HelloExec ...

2016-09-02 18:51
浏览 3406
评论(0)
分类:编程语言

人生苦短用tez

博客分类：

hadoop
hive

hive tez

tez是什么？ tez官网普通执行hive 的速度: 用tez引擎后的速度: 使用方法： set hive.execution.engine = tez; 默认值： set hive.execution.engine = mr;

2016-09-02 10:39
浏览 400
评论(0)
分类:开源软件

url encode列表

博客分类：

web工程

来自 w3school URL 编码 - 从 %00 到 %8f ASCII Value URL-encode ASCII Value URL-encode ASCII Value URL-encode æ %00 0 %30 ` %60 %01 1 %31 a %61 %02 2 %32 b %62 %03 3 %33 c %63 %04 4 %34 d %64 %05 5 %35 e %65 %06 6 %36 f %66 ...

2016-09-01 11:50
浏览 1051
评论(0)
分类:Web前端

MapReduce数据倾斜的解决经验

博客分类：

hadoop
java

数据倾斜的意思就是某些key对应的信息条数过多，导致对应reducer的内存溢出。解决这个问题，要区分一下问题引起的原因。无非是：由于对数据构成认识不足，导致启动配置资源的不合理刷量数据的不合理涌入对于第一种情况，我们可以通过调整reduce的个数，以及reducer的jvm大小来解决。对于第二种情况，我建议应该先分析数据的倾斜原因，考虑这部分数据生成的原因，是程序错误还是恶意的刷量数据。当然这个工作并不在解决数据倾斜的内容中。解决的方案比较简单，以时间换空间。通过修改pat ...

2016-08-29 13:58
浏览 1942
评论(0)
分类:开源软件

shell按日期的循环

博客分类：

shell
工作经验

经常有需要按日期运行脚本补数据。有时候是好几天的。但是可能整个过程下来会超过24个小时。最早的时候是这样的一个方案。 for((i=0;i<10;i++)); do date=`date -d "$i days ago" +"%Y%m%d"` sh dojob.sh $date done 这个方案的不足就是，跨天之后，会漏掉某个日期。后来诞生了一个用配置文件的方法。把要搞的日期写到一个文本里。每行写一个日期。 file=/data/datelist.txt ...

2016-08-18 19:49
浏览 1522
评论(0)
分类:编程语言

一个Maven的pom实现

博客分类：

java
manven

java maven pom

留给自己以后用的pom实现。 <project xmlns="http://maven.apache.org/POM/4.0.0" xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance" xsi:schemaLocation="http://maven.apache.org/POM/4.0.0 http://maven.apache.org/xsd/maven-4.0.0.xsd"> <modelVersion>4.0.0</mo ...

2016-08-11 10:45
浏览 1075
评论(0)
分类:编程语言

Python2.7安装numpy

博客分类：

python

numpy python

系统 Window8-64bit 安装python 下载地址： https://www.python.org/downloads/windows/ 运行msi 系统变量设置path.假设安装地址是：C:\python27 cmd 下试试python -V 查看版本号，以验证是否成功安装python 安装pip 下载ez_setup.py. https://bootstrap.pypa.io/ez_setup.py 运行python ez_setup.py。这两步是解决setuptools的问题。下载pip的tar.gz包。https:/ ...

2016-08-09 17:56
浏览 1396
评论(0)
分类:编程语言

jdbc连接数据库的实现

博客分类：

java

mysql jdbc

写了一点测试用例。很久没有使用过jdbc了。写起来还是怪生疏的。还是习惯JDBCTemplate啊。大家做工程还是使用框架能快一点点。 package com.myTest.jdbc; import java.sql.Connection; import java.sql.DriverManager; import java.sql.ResultSet; import java.sql.SQLException; import java.sql.Statement; import java.util.ArrayList; import java.u ...

2016-08-09 14:41
浏览 402
评论(0)
分类:编程语言

截取固定长度字符串显示在页面，多余部分显示为省略号(区分汉字和字符)

博客分类：

web工程

2009-05-07 网上给的方法就是在取出之时先做处理，大致思路： 1. 测试具体长度 2. 超过则进行截断+“....” 否则，保持原貌 3. 如果是中文，则应注意中文存储是双字节存储。所以通用法则就是取偶数长度（例如，10、20、30）。代码很简单，这里没有例子。

2016-07-05 11:46
浏览 557
评论(0)
分类:Web前端

Thinking in Java对象设计的一些tips

博客分类：

工作经验
java

2009-06-20 Guidelines for object development These stages suggest some guidelines when thinking about developing your classes: 1. Let a specific problem generate a class, then let the class grow and mature during the solution of other problems. 2. Remember, discovering the classes you need ...

2016-07-05 11:41
浏览 467
评论(0)
分类:开源软件

最近访客更多访客>>

博主相关

文章分类

社区版块

存档分类

最新评论

commons-pool对象池实例（一）

线性回归的python例子

MySQLdb的一个例子

ElasticSearch的多维度聚合心得

Hive To Elasticsearch

使用netty4.0实现Http请求的分发

人生苦短用tez

url encode列表

MapReduce数据倾斜的解决经验

shell按日期的循环

一个Maven的pom实现

Python2.7安装numpy

jdbc连接数据库的实现

截取固定长度字符串显示在页面，多余部分显示为省略号(区分汉字和字符)

Thinking in Java对象设计的一些tips

最近访客 更多访客>>

博主相关

文章分类

社区版块

存档分类

最新评论

最近访客更多访客>>