- 浏览: 263178 次
- 性别:
- 来自: 北京
最新评论
-
chlhp:
Session Option→选字体(新宋体)→再选Char ...
SecureCRT中文显示乱码的解决方法 -
Interceptor2013:
org.wltea.analyzer.core.IKSegme ...
使用余弦相似性原理计算文本的相似度 -
renzhengzhi:
我的maven版本是3.2.3,也报这个错误
maven com.github.goldin.plugins 报错 -
riching:
君诩逸尘 写道我想问下 我把.project文件改了以后项目里 ...
MyEclipse buildpath 报错问题的解决方法 -
君诩逸尘:
我想问下 我把.project文件改了以后项目里面都报错啊 ...
MyEclipse buildpath 报错问题的解决方法
文章列表
报错内容:Incorrect string value: '\xF0\xA8\x91\xB3\xE5\xAE...' for column
出现这个问题原因是,mysql中设置的utf8编码,只能存储三字节的unicode编码,如果出现四个字节的unicode,则会报错
解决方案是将utf8编码,改成utf8mb4,utf8mb4是utf8的超集,兼容utf8
mysql5.5以后的版本才会支持utf8mb4,另外jdbc驱动的版本过低也需要升级
stackoverflow上面完整的答案:http://stackoverflow.com/questions/10957238/incorre ...
当线上出现问题的时候,无法debug,log的级别开始时候设定的比较高,导致不好调试的时候
可以临时修改对应log的级别,定位完问题之后再改回去
log4j版本:
<%@page import="java.util.Enumeration"%>
<%@page import="org.apache.log4j.LogManager"%>
<%@page import="org.apache.log4j.Logger"%>
<%@ page language="java&quo ...
[INFO] --- copy-maven-plugin:0.2.5:copy
[WARNING] Error injecting: com.github.goldin.plugins.copy.CopyMojo
java.lang.NoClassDefFoundError: Lorg/sonatype/aether/RepositorySystem;
[ERROR] Failed to execute goal com.github.goldin:copy-maven-plugin:0.2.5:copy (unpack-qzz) on project travel-destination: ...
一、eclipse中不同的字体,显示出来的代码效果区别很大,网上搜了一下,使用Courier New字体,显示效果是最好的,这个也会因人而异,我试了一下大部分的字体,确实这个效果最靠谱
我的环境是win7+eclipse4.3 Kepler 开普勒,最简单的方式是:
1、通过控制面板-》字体,找到Courier New,右键设置为显示,
2、eclipse中修改java编辑器的字体为Courier New ,大小为小四
二、eclipse4.3的版本安装maven插件之后有各种奇怪的问题,一般都是因为maven的选项【Update Maven projects on startup ...
1、Guava:Guava 是一个 Google 的基于java1.6的类库集合的扩展项目,包括 collections, caching, primitives support, concurrency libraries, common annotations, string processing, I/O, 等等. 这些高质量的 API 可以使你的JAVa代码更加优雅,更加简洁,让你工作更加轻松愉悦
官方首页:http://code.google.com/p/guava-libraries
中文详细介绍:http://www.cnblogs.com/peida/archive/20 ...
1、有很多开源库以及python自动的htmlparser库都可以解析html,简单的功能,用哪个都一样,看个人习惯,此处简单介绍一下BeautifulSoup的用法,详细的用法可以参考官方文档http://www.crummy.com/software/BeautifulSoup/
2、去上面的网址下载、解压安装,都有说明, 我在python2.7的环境下面安装soup4一直报错,最后只好换成soup3的版本,具体原因没查明
3、代码示例
from BeautifulSoup import BeautifulSoup
import urllib2
content = urllib2.u ...
Python的urllib2的代理设置
- 博客分类:
- python
程序中使用代理的应用场景主要是:爬去有访问频率限制的网站的数据或者用于刷票等
代理的代码很简单,可以和上一篇的cookie、header等一起设置,具体可参考官方api
proxy_info = "219.232.47.153:80"
proxy_handler = urllib2.ProxyHandler({"http" : "http://%s/" % proxy_info})
proxy_opener = urllib2.build_opener(proxy_handler)
之后
urllib2.ins ...
使用Python的urllib2库抓取网页
- 博客分类:
- python
1、GET方式直接抓取,需要参数拼在参数中
import urllib2
content = urllib2.urlopen(url).read()
这里的url可以是很多中协议,具体参考官方文档
2、POST方式抓取数据,参数可以在url中,也可以封装中请求中
import urllib2, urllib
data = urllib.urlencode({'title':'this is title', 'body':'this is body'})
request = urllib2.Request(url, data, headers)
result = urllib ...
使用余弦相似性原理计算文本的相似度
- 博客分类:
- java
原理参考:http://www.ruanyifeng.com/blog/2013/03/cosine_similarity.html
好多人说包不对,或者不知道哪儿下载,贴上个下载地址:https://code.google.com/p/ik-analyzer/downloads/list,附件贴上ik的包,其他的apache的commons包自己去下吧
/**
*
*/
package com.text;
import java.io.IOException;
import java.io.StringReader;
import java.util.HashMap ...
1、添加maven依赖
<dependency>
<groupId>org.elasticsearch</groupId>
<artifactId>elasticsearch</artifactId>
<version>0.90.0</version>
</dependency>
建议使用maven管理项目,因为elasticsearch还有很多依赖包,手工维护很麻烦
2、创建连接elasticsearch服务的client
Settings settings = Immut ...
1、参考资料网站:http://www.searchtech.pro/,这个上面很多关于elasticsearch的资料可以参考
2、下载
wget https://download.elasticsearch.org/elasticsearch/elasticsearch/elasticsearch-0.90.3.tar.gz
3、解压缩
tar xvf elasticsearch-0.90.3.tar.gz
4、进入config文件夹,编辑elasticsearch.yml,修改下面两行配置
node.name: "name of node"
node.m ...
1、本机自动登录,第三步很重要,不要漏掉
ssh-keygen -t rsa -P '' -f ~/.ssh/id_rsa
cat ~/.ssh/id_rsa.pub >> ~/.ssh/authorized_keys
chown 600 authorized_keys
2、其他机器
将第一步生成的id_rsa.pub的内容拷贝至目标机器的~/.ssh/authorized_keys中,一定不能换行
分布式搜索的开源框架
- 博客分类:
- software
1、文本搜索的内核:lucene http://lucene.apache.org/,很多的开源框架式基于lucene实现的
2、Apache Solor:http://lucene.apache.org/solr/
3、Katta:katta.sourceforge.net,基于Lucene和Hadoop的分布式搜索框架
4、Elasticsearch:http://www.elasticsearch.org/,基于Lucene的分布式搜索框架
如果碰到无法生成java的JNI接口的问题,请参考一下官方文档:http://docs.opencv.org/doc/tutorials/introduction/desktop_java/java_dev_intro.html
如果还有问题,请继续往下看
1、官网下载 [url]http://opencv.org/ [/url]
2、解压缩文件,另外再创建一个编译的目录 mkdir opencv
3、使用cmake编译
如果没有cmake,去cmake的官网http://cmake.org/cmake/resources/software.html下载最新的cmake(2.8.10.2) ...
1、在普通模式下按ctrl+v或者v进入块操作模式
v(小写) 按字符选择,选中按下V时光标所在的字符到当前光标所在字符间的内容
V(大写) 按行选择
[Ctrl]+V 选择矩形字符块
2、通过光标移动选中内容,可以进行ydp操作
y:复制选中内容到粘贴板
d:删除选中内容
p:用粘贴板里的内容替换选中的内容
=:对齐选中内容
对于矩阵字符块:[Shift] + i xxx [esc] :把xxx写到每一行的光标前面的位置
3、批量缩进或反缩进,类似于文本编辑器中的格式化
选中多行,按I进入插入模式,写入Tab,之后按ESC,即可完成批量缩 ...