- 浏览: 144259 次
- 性别:
- 来自: 上海
最新评论
-
漂泊一剑客:
②非数字如何处理 对于文档中只要出现某些文字,就提升权重,没有 ...
solr使用dismax的一些record -
onelee:
同感同感只不过是身处一个起点比较高的创业公司
小公司做项目经理一些难处 -
babydeed:
看了一下豆瓣 感觉人气不旺 呵呵
亚马逊与当当的简单评价 -
悲剧了:
cuichang 写道要推荐去豆瓣,送货快是京东。其他价格之类 ...
亚马逊与当当的简单评价 -
cuichang:
要推荐去豆瓣,送货快是京东。其他价格之类的没多少区别。
亚马逊与当当的简单评价
文章列表
karaf常用命令纪录
- 博客分类:
- osgi
karaf常用命令纪录
karaf命令里面本身支持shell方式的还有subshell,所以根据需要没事可以--help,把常用的命令,切换为subShell下进行 exit退出 shell:completion FIRST
feature安装 install使用最多,-v 展示正在做什么 -c失败不卸载 -s不自动startbundle(是否可以利用这个可以控制顺序) repo-add增加 repo-refresh刷新 info 最有用参数-t详细列出当前feature的依赖关系,类似maven,目前根据这个命令,用脚本写了一个自动下载features里面以来的bundle到本地仓库 ...
1.批量导入总是少1条数据,多线程导入,少得梳理跟线程数一样
忘记 conn.setAutoCommit( true);
conn.setAutoCommit(false);
Object[] parmas = list.toArray();
ps = conn.prepareStatement(sql, Statement.RETURN_GENERATED_KEYS );
qr.fillStatement(ps, parmas);
...
1.网上得数据下载到本地,利于快速分析 具体操作:java多线程 httputil
2.提取出关键信息进行分析 ,一般是key value键值对
分析数量 key value的状况 key value尽量不带html的东西
3.建立第二部中提取的key值与开发系统设计的key值关系规则
4.导入数据库,建立持续自动更新机制,跟系统集成的话就quartz等 或者直接linux的cron
根据上述key point 建立起对应的框架,分配任务,提供接口 写核心代码 迭代进行
上一篇blog就是在这个过程中写的一个工具类,快速的下载html
下载上传wget,附带java代码一份
- 博客分类:
- 2011项目
场景1:
项目放到国外服务器,配置ftp,上传老掉线,网速实在不如人意
解决:
wget方式下载,-c就ok,把你的东西放到一个url可以直接下载的地方,俺测试下了360云盘,报错不支持,可以找速度快并且稳定的地方上次,不行那就自己动手,放nginx里面,远程下载,不用操心
nuhop xxx & ,到时候看nohup.out就ok
场景2
收集网页分析数据,wget方式可以下载全站的,如果觉得速度太慢,不给力,自己动手
附带简单的下载代码
public class SimpleDownLoadHtmlUtil {
public Logger log = Logger. ...
一:用户积分功能设计
二:key point
1. 需要提统一业务规则与扩展业务规则,扩展负责经常变化部分,统一负责不改变部分,用单例模式配置规则,xml方式配置都可以
2. item与total监听器 --aop拦截配置可行,常规监听器模式浸入太多
商业BI初步分析
场景:做一个中小型互联网项目,需要提供商业智能,支撑推荐功能+CRM+广告系统等
思路如下:
1.用来来网站的每一次行为,进行log
2.对行为进行分类,提取不同的关键信息
3.不同行为导致不同的权重比例
4.每次的行为都放入搜索引擎文档,利用引擎来检索,如果不考虑不同行为的打分,效率等,数据库也是可以的
一段时间后,用户就会积累很多记录,那么我们根据不同行为的积累分析信息,利用搜索引擎特点,进行各种高效的关键字排名,权重打分排名
关键点:1.每次行为的提取--用户行为的分析,这直接导致了BI是否有效
2.搜索引擎文档的合理设计
场景:中小型互联网垂直领域网站,项目广告系统置入分析:
keynote:固定位置+keywords导致广告唯一
1.固定位置广告
2.固定位置,关键字广告
3.非固定位置,关键字广告
收费:按照使用效果+按时间收费混合型收费标准
细节:
广告编号唯一性,销售方便
关键字集合sell,多人购买则出现随机情况
1.三个重要字段(bf,pf,qf)注意事项
①pf--字段配置都必须为index字段,否则使用会报错
②bf影响打分结果,结合solr提供的数学方式,但具体打分影响需要结合工具,debug模式查看,
跟想象差距很大
2.常见场景分析
①数字公式bf处理
淘宝排序:
1.在商品名称上出现搜索关键字排序靠前,而内容的次之
2.对多皇冠的买家排序靠前等
3.对近期发布的商品排序靠前
4.对最近销售多商品靠前
非索引字段造成很大影响,但不是排序,需要作为打分的一个要素,而不是order by,比如销量数字,可以配置通过配置bf,对索引到的文档综合打分进行影响
②非数字如何处理
对于文档中只要出现某 ...
[size=medium]真实需求与实际设计的矛盾
出现一些问题时候,往往就反映我们理解错了一些概念,运用错了一些东西。写东西是个好的方式,是让自己思考的一种方式,也是一种package,ok
场景:
系统内置发送信息,当用户提交的信息审核通过,发送信息给用户
信息--站内信 短信 邮件
提供发送信息的借口,分别实现。
public interface NoticeUser {
void sendNoticeInfo(String title,String content,RbacUser rbacUser);
}
public cl ...
先假定一个model实体,有十六个字段,然后service提供update(Model model)
现在要提供更新功能,通常根据划分为可修改字段,不可修改字段,我们提供修改功能的时候,反应到具体代码层
1.最简单form表单提交时候,传递参数拥有完整的16字段,虽然页面要么隐藏要么展现,可修改不可修改,种种折腾
提交处理:表单包含16个字段,全部提交,然后update
2.升级版,业务只需要提供16个字段中的三个字段修改,其它也不需要用户知道,上面的处理方式没问题,但是form表单参数搞写那么多字段很烦,大家都很懒,页面给需要更改的就好
提交处理:三个字段与表示字段就可以了
问题: ...
由于业务需要,可能存在以下类似model,比如正式表 零时表
那么在很多时候,正式表的model的属性要copy到零时表中,有时候又涉及到对比,如果只涉及一次这种类似的操作,自己set也就无所谓,但类似业务多了,就需要抽象了,反射式比较好的方式,能抽象提取这些操作
用commons的beanUtils 与spring的工具类封装了一个BeanUtilss
public class BeanUtilss {
/**
* 该方法对比不同Bean实例中具有相同属性值是否相等,只对比neww中的属性
* @param neww--系统对象
* @param old- ...
1.网络问题你全负责,有人上不了网会直接来找你
建立流程,网络问题就那些,写文档,找你之前,先按照文档操作,百分之99都可以解决
2.公司服务器宽带你全负责,如果出现问题有人来找你
这个没办法,很多不会要自己学.责任也要自己担当.
effective 第四十九条thinking
- 博客分类:
- 细节理解
effective java 第49条 基本类型优先于装箱类型
作者说道了两者的区别,这个大家都懂的,明显不一样的东西
个人觉得是不完全面向对象的产物,然后又提供语言级别的自动转换,两种东西都不是一类,越转问题越大,还不如统一使用
使用中的一些问题:
1.==的使用出现问题
2.null拆箱问题
比如:我的方法返回类型是int 但是调用框架类处理完成返回是Integer,这个时候不检查null,问题就来了,
public int getCtgId(String name)
{
return (Integer)XX.xx(); ...
数据整理备份:
1.采集数据的记录(包括采集规则,采集id分布情况)
2.转换程序备份(相关使用说明完整)
3.转换程序生产sql备份(必须有sql对应id系统库记录)
采集数据处理过程(采集的数据最终导入系统数据库):
1.对应我们数据库表导入相关字段转换成sql,转换前注意,清洗数据(去掉一些错误的信息,类型变更)
2.根据采集来的已有信息,推测出一些数据,比如根据许可证号可以推测出省市
评估原则:
不符合规则的数据,程序记录下来,比重小,人工修改
比重大则保证尽可能多转换为原则.只要能转换大于5%数据,则值得.
整个功能模块定位:
不在系统中集成,作为运营人员使用,网 ...
1.设置自动连接断开时间,需要在数据库里配置好,避免下次机器重启后再次配置 隔几天就报连接错误,困扰好久了
引用
org.springframework.transaction.CannotCreateTransactionException: Could not open JDBC Connection for transaction; nested exception is com.mysql.jdbc.exceptions.jdbc4.CommunicationsException: The last packet successfully received from the se ...