- 浏览: 421938 次
- 性别:
- 来自: 南京
最新评论
-
felicitia:
需要登录的数据能抓取到吗?模拟淘宝的登录感觉太难了。。。
是使用淘宝API获取数据好,还是利用爬虫去抓取数据好呢 -
baso4233:
我的是机器本身编译器装多了。
Error starting modern compiler -
exceedly:
淘宝有访问其他店铺产品信息的API吗...我怎么没有看到- - ...
是使用淘宝API获取数据好,还是利用爬虫去抓取数据好呢 -
atal162:
根据楼主的配置,成功部署了vsftpd。谢谢!
Ubuntu下成功安装配置vsftpd -
opencvImage:
你好!请问能不能把你Lucene结合PR进行排序优化的代码贴出 ...
PageRank算法的原理和源代码实现(java)
文章列表
刚才试验了下javaeye的firefox插件,嘿嘿,都没看仔细就乱发表言论,正好看到robbins在线,就点了他试了下闲聊功能,哈哈。
后来才发现自己的那个想法,人家早实现了,ESC就返回所有的收藏页面,囧……
还有新标签页的打开问题,鼠标中键就可以在新标签页打开,而不是当前页。可是,可是,我用的是触摸板啊,没鼠标中键那个功能,只好右击咯
嗯哼,嗯哼,以后看清楚了再说哦,哈哈,自惭下。
- 2009-03-05 17:42
- 浏览 1081
- 评论(0)
昨晚装了Netbeans6.5后发现“打开项目”的这个动作完成不了
,“新建项目”倒是可以正常使用的。
打开NetBeans点击“打开项目”的时候,右下角提示出现意外异常,详细情况如下:
Neatbeans6.5 写道
出现 java.lang.ArrayIndexOutOfBoundsException 异常。
请访问 http://www.netbeans.org/community/issues.html 以报告此异常,请包含 messages.log 文件的副本。
messages.log 文件位于 C:\Users\tzjybarney\.netbeans\6.5\var\log 文 ...
- 2009-03-05 11:21
- 浏览 2446
- 评论(0)
快速查看本机的DNS:
写道
cat /etc/resolv.conf
IP:
写道
ifconfig -a
- 2009-01-07 15:02
- 浏览 15246
- 评论(4)
ubuntu下访问windows共享文件夹
今天碰到一个问题,需要将windows下的共享文件夹挂载到Linux下来,于是就用到mount命令。
可是按照以前的方法mount本机的硬盘行,mount局域网内的就不行了,只好去搜了一下,原来这么简单,如下:
www.5dlinux.com 写道
假定您的网络连接已经正确设定好。
网络主机的 IP: 192.168.0.1
网络主机的使用者名称: myusername
网络主机的登录密码: mypassword
分享中的目录名称: linux
主机上要挂载的目录: /media/sharename
要挂 ...
- 2008-12-01 14:05
- 浏览 8437
- 评论(0)
之前用htmlparser的时候是从ibm开发中心的两篇文章看起来的,感觉很不错,作者是刘冬,地址如下:
从HTML中攫取你所需的信息 http://www-128.ibm.com/developerworks/cn/java/l-html-parser/
扩展 HTMLParser 对自定义标签的处理能力 http://www.ibm.com/developerworks/cn/opensource/os-htmlparser/
今天看到一篇将htmlparser讲解的比较详细的文章,最后还附录了一些相关的文章,不需要我们自己再去搜了
《htmlparser使用指南 》http ...
- 2008-11-24 21:36
- 浏览 1451
- 评论(0)
不知道用ictclas4j的人多不多,该项目地址是http://code.google.com/p/ictclas4j/ 关于ictclas分词系统讨论组地址是http://groups.google.com/group/ictclas
其中在ictclas4j项目的issues中有人提到一个问题“程序分词最后结果会吃掉一些字”,也就是漏字、漏词的问题。
问题地址为http://code.google.com/p/ictclas4j/issues/detail?id=2,但是没有人来回答。
我也碰到这个问题,只能自己看看了。经过对ictclas4j源程序的理解以及与原始c++版本(FreeI ...
- 2008-10-09 21:27
- 浏览 6729
- 评论(3)
今天碰到一个关于BufferedReader的mark()问题,于是去google了一下,发现N年前一篇帖子(汗一个)和我遇到的问题一样,但貌似没有最终的明确结论。
写道
标 题: 关于BufferedReader的mark()问题 发信站: BBS 水木清华站 (Wed Apr 21 19:35:26 2004) 在做第三次的作业时,为了统计行数,我先用把文件读了一遍,然后要让文件指针指向文件头,于是我在文件的最开始mark()了一下,mark()的长度为file.length(),当指针指到文件末后用reset()指回来,但是我发现了一个奇怪的问题,如果文件的最后一个字符是中文,则一切正常, ...
在lucene使用过程中,如果要对同一IndexWriter中不同Document,不同Field中使用不同的analyzer,我们该如何实现呢?
通过对《lucene in action》的阅读,发现是可以解决这一问题的。lucene可以正对整个IndexWriter对象或者每一个document对象或者特定Field使用不同的分析器。
Analyzer analyzer = new StandardAnalyzer();
IndexWriter writer = new IndexWriter(direcotry, analyzer, true); //
Document doc = n ...
- 2008-08-21 15:55
- 浏览 2693
- 评论(2)
参考文章:
理论:竹笋炒肉:Google的PageRank算法学习 http://hedong.3322.org/archives/000199.html
算法: PageRank算法的原理和源代码实现(C++)http://renxijun.blog.sohu.com/60220486.html
模仿上面这个算法实现了java版的计算,我写的这个性能不好,3496987篇网页迭代1次居然需要3分钟左右,贴出来希望高手帮我指点改正。
package pagerank;
import java.io.BufferedReader;
import java.io.BufferedWriter; ...
今天在搜索结果高亮时候碰到了一个小问题,是“lucene高亮显示时,String index out of range异常”,百思不得其解,以前并没有出现过,后来google了下,终于觅得解决办法,哈哈。
搜了下javaeye,以前也有同学碰到和我一样的问题, ...
- 2008-07-26 20:27
- 浏览 3086
- 评论(3)
Ubuntu8.04下上无线网络
- 博客分类:
- Linux
我的无线网卡是Intel Corporation PRO/Wireless 3945ABG Network Connection (rev 02)
开机后等待系统自动检测到无线网络,然后左击网络图标,选择下拉中的无线网络节点,如果是加密的WEP,则在安全性方面选择第二项,输入密码,然后就能连上了,连接成功后会显示成无线网络强度的图标,爽哦~
- 2008-07-17 10:21
- 浏览 1717
- 评论(0)
在编译larbin的时候会出现2个错误,解决办法如下:
http://hi.baidu.com/hustwk/blog/item/b68d9bef232143eacf1b3eed.html 写道
adns文件夹下internal.h文件569-571:adns_status adns__parse_domain(adns_state ads, int serv, adns_query qu,vbuf *vb, parsedomain_flags flags,const byte *dgram, int dglen, int *cbyte_io, int max);更正为:adns_status ...
- 2008-07-17 10:11
- 浏览 1743
- 评论(0)
java里面设置User-Agent代码如下
HttpURLConnection uc = (HttpURLConnection) baseURL.openConnection();
uc.setRequestProperty("User-Agent", "Mozilla/4.0 (compatible; MSIE 6.0; Windows NT 5.1; .NET CLR 3.0.04506)");
这个User-Agent是我用ieHTTPheaders的在浏览器里面看到的结果,挑了几个改了下
写道
User-Agent: Mozilla/4. ...
- 2008-07-16 17:54
- 浏览 4821
- 评论(1)
今天爬虫爬到了一个url,里面还有“&”,手动在浏览器里面打开发现根本打不开,是链接错误?
后来发现不是链接错误,到网上搜了下说是“ W3C 规定这样写”
我晕了,查看页面源码,发现自己提取的url没有错,源码里面就是包含了&,如:
<a href="list.asp?id=33&page=2">下一页</a>
那这样的话,我每次岂不是还要对url做检测,将&替换成& ??
我不知道其他有什么办法解决这个问题,只能先暂时这样了。
- 2008-07-16 17:48
- 浏览 1419
- 评论(0)
1、String==》int , 有两种方法
str为String型
1) int i=Integer.parseInt(str);或 i=Integer.parseInt(String str,int radix);
2) int i = Integer.valueOf(my_str).intValue();
注:字符串转成Double,Float,Long的方法大同小异
double d = Double.parseDouble(str); float f = Float.parseFloat(str); long l = Long.pa ...
- 2008-07-14 10:36
- 浏览 2024
- 评论(0)