- 浏览: 422937 次
- 性别:
- 来自: 南京
-
最新评论
-
felicitia:
需要登录的数据能抓取到吗?模拟淘宝的登录感觉太难了。。。
是使用淘宝API获取数据好,还是利用爬虫去抓取数据好呢 -
baso4233:
我的是机器本身编译器装多了。
Error starting modern compiler -
exceedly:
淘宝有访问其他店铺产品信息的API吗...我怎么没有看到- - ...
是使用淘宝API获取数据好,还是利用爬虫去抓取数据好呢 -
atal162:
根据楼主的配置,成功部署了vsftpd。谢谢!
Ubuntu下成功安装配置vsftpd -
opencvImage:
你好!请问能不能把你Lucene结合PR进行排序优化的代码贴出 ...
PageRank算法的原理和源代码实现(java)
文章列表
转载自《python2.6.2 documentation
》:
The class hierarchy for built-in exceptions is:
BaseException
+-- SystemExit
+-- KeyboardInterrupt
+-- GeneratorExit
+-- Exception
+-- StopIteration
+-- StandardError
| +-- BufferError
| +-- ArithmeticError
| ...
- 2009-07-01 20:00
- 浏览 1388
- 评论(0)
转载自《Django Web开发指南》表1.6 (蓝色字体为本人自行标注,供参考
)
AssertionError assert(断言)语句失败
AttributeError 试图访问一个对象没有的树形,比如foo.x,但是foo没有属 ...
- 2009-06-27 15:25
- 浏览 3245
- 评论(0)
RT
目前抓了淘宝的200多万家
的店铺地址(URL)了,不知道算不算流氓爬虫。估计爬了他们
95%的店铺地址
,仅供参考。
发现一个搞笑的店铺,整个店铺里都是卖避孕套之类的,分类到了数码相机类里面去了,哈哈
目前不知道taobao会不会把一个店铺分到多个类中,如何会分到多个类中的话,我这数值还要缩减,自己要来排重一下。
- 2009-06-25 17:08
- 浏览 19804
- 评论(6)
ibus守护进程
将下列内容加入$HOME/.bashrc中,并重启
export GTK_IM_MODULE=ibus
export XMODIFIERS=@im=ibus
export QT_IM_MODULE=ibus
- 2009-06-23 17:13
- 浏览 2084
- 评论(0)
来源:
问友源码 -> 网站开发相关 -> Python
地址:http://www.winu.cn/dispdocnew.php?tid=108863
是否全文转载:是
由于网站要支持国际化, 以前用 GB2312 的脚本都要转化成 utf-8 格式. 一共有 1000 多个页面,
虽然一些文本编辑器支持转化格式, 比如 EditPlus, UE等, 但这么多的文件一个个转化也够受的. 所以准备用 Python
写了一个脚本, 负责转化目录下的所有文件成 urf-8 格式.
Python 中的 codecs 模块可以完成这个任务, 该模块可以转化很多编码, ...
- 2009-06-09 17:12
- 浏览 1523
- 评论(0)
Ubuntu下有个终端伺服器客户端,很方便,同样可以用在Debian下 (其实Ubuntu和Debian一家亲啊),但是不知道这个玩意儿叫啥名字,就不好安装了,搜了很久,终于发现他的名字了 哈哈 Tsclient
OK!
apt-get install tsclient
我用的mirrors.163.com的源(见这个帖子
),安装后填上远程机器的IP,以及用户名和密码就可以使用了,当然前提是远程机器运行被访问~
- 2009-05-23 16:36
- 浏览 1822
- 评论(0)
这是 Google 对 http://sxpspace.blogspot.com/2009/03/ubuntu_25.html
的缓存。 这是该网页在 2009年5月17日 01:22:16 GMT 的快照。 当前页
在此期间可能已经更改。 了解详情
纯文字版本
Philips@自由的天空 写道
Ubuntu源列表
deb http://mirrors.163.com/ubuntu/ hardy main restricted universe multiverse
deb http://mirrors.163.com/ubuntu/ hardy-security m ...
- 2009-05-22 18:10
- 浏览 1877
- 评论(0)
在桌面上发现一个文本文件,里面内容如下,应该算MySql新手入门教程吧:
[ps: 我忘了是在哪里copy的这篇文章了,所以未注明出处,如果哪位过路的朋友知道这篇文章的作者,请告诉我,我添上作者和您的姓名,谢谢!]
============转载分割线==============
Windows:
1.用系统管理员登陆系统。
2.停止MySQL的服务。
3.进入命令窗口,然后进入MySQL的安装目录,比如我的安装目录是c:\mysql,进入C:\mysql\bin
4.跳过权限检查启动MySQL,
[color=green]c:\mysql\bin>;m ...
- 2009-05-07 10:19
- 浏览 1034
- 评论(0)
今天在一台机器(OS为vista 64bit)上装MySQL5.0数据库,看了下机器,之前有安装MySQL,不过没启动服务,于是就打开cmd.exe输入mysqld --install,谁知出现Install/Remove of the Service Denied!
错误,奇怪。
查了下MySQL自带手册,命令没有敲错,为什么安装服务失败呢,后来仔细一想,哦,权限不够,我用的是普通用户权限,恩,再次打开cmd.exe,不过这次要右击“Run as administrator”,恩,然后再键入mysqld --install
OK,服 ...
- 2009-04-15 20:58
- 浏览 111480
- 评论(0)
查
查查
查
查
查
查
查
哈哈 无聊,比了下编辑器里的字体大小,感觉自己看着4号比较顺眼些,以后多用四号吧
- 2009-04-15 18:03
- 浏览 1170
- 评论(2)
http://www.cnblogs.com/dyj057/archive/2008/11/12/1332135.html
DengYangjun@Gmail.com 写道
打开控制器,运行如下的脚本:
wget http://www.cnblogs.com/Files/dyj057/myfonts.sh.zip
unzip -o myfonts.sh.zip
chmod a+x myfonts.sh
./myfonts.sh
支持8.04, 8.10
打开控制器的意思就是打开终端
- 2009-04-12 21:32
- 浏览 1305
- 评论(0)
在windows命令行窗口下执行:
>netstat -aon|findstr "8000"
TCP 127.0.0.1:8000 0.0.0.0:0 LISTENING 4292
看到了吗,端口被进程号(PID)为4292的进程占用,继续执行下面命令:
>tasklist|findstr "4292"
python.exe*32
然后打开任务管理器,杀掉他就好了 ...
- 2009-04-10 16:44
- 浏览 4289
- 评论(0)
今天更新时候出现了点小问题,一开始更新到一半,我嫌速度慢,就取消掉了。
更新了sources.list之后再执行sudo apt-get update 提示我出错了
E: Could not get lock /var/lib/apt/lists/lock - open (11 Resource temporarily unavailable)
E: Unable to lock the list directory
上网搜了下(http://ubuntuforums.org/showthread.php?t=580428
),问题应该是之前那个更新被强制取消的问题,进程仍然还在。用这个命令 ...
- 2009-04-09 09:44
- 浏览 14557
- 评论(1)
在建立html文件的索引的时候,我们需要去除文件中的这些html标签,比如<a...></a>,<script></script>,<style></style>等等,一般而言,我们使用正则表达式来匹配是最方便快速的。
下面为匹配这些标签的正则表达式:
<\s*script.*?>[^<>]*?<\s*/\s*script\s*>
或者
<\s*script.*?>[\s\S]*?<\s*/\s*script\s*>
类似
<\s*style ...
- 2009-04-03 18:02
- 浏览 5323
- 评论(0)
主要是遇到浮点数中出现无意义的数时候的处理情况:
public static void main(String args[]) {
Map<String, Float> map = new HashMap<String, Float>();
map.put("a", 1073.8256f);
map.put("b", 16.360186f);
map.put("c", 803.6707f);
map.put("d", 1164.1406f);
map.put(&quo ...
- 2009-03-24 18:56
- 浏览 2298
- 评论(0)