- 浏览: 55252 次
- 性别:
- 来自: 西安
最新评论
-
iamicebergs:
好东西,收藏~
[转]用python爬虫抓站的一些技巧总结 -
qiaoqinqie:
mark 很好的学习资料
python 常用类库! -
fire01312:
svn import /tmp/skysrt file:/// ...
FEDORA下SVN的安装以及配置 所属分类:Linux 评论(1),浏览(94)
文章列表
在Windows下用迅雷下东西很方便,可惜迅雷没有Ubuntu Linux版。但是没有关系,有个同济大学的Linux高手做了个MultiGet,具有类似迅雷这样的多线程下载能力。MultiGet FOR Ubuntu deb包下载地址:http://mesh.dl.sourceforge.net/sourceforge/multiget/multiget_1.1.2-0getdeb1_i386.deb有了MultiGet,在下载百度MP3歌曲的时候方便很多,只要把MP3文件地址拖放到那个悬浮在屏幕上的 MultiGet的箭头logo上就可以下载。最新版本MultiGet为您提供更快速下 ...
1.os.system(cmd) 只能得到成功或者失败信息。
2.os.popen 或者os.popen2()
3.output = subprocess.Popen(['ls','-l'],stdout=subprocess.PIPE,shell=True).commun icate()
4. command 模块 status, output = commands.getstatusoutput('ls -l')
我们是一群怀揣着一点点梦想的年轻人;我们是互联网的忠实信徒,相信世界正在因互联网而改变;我们崇信技术的力量;我们倾向于组建小而精悍的团队;我们喜欢快速反应的工作节奏;我们挚爱正在从事的工作,那是我们相当一部分的乐趣所在;我们热爱我们的用户,对用户的喜怒哀乐感同身受;我们曾经打造出校内网、饭否网等优秀的web2.0产品;我们经历过巨大的挫折和失败,但从未有放弃!
1.控制台下的进度库
http://pypi.python.org/pypi/progressbar
2.控制台彩色打印库
http://pypi.python.org/pypi/termcolor
用得最多的还是各类爬虫脚本:写过抓代理本机验证的脚本,写过在discuz论坛中自动登录自动发贴的脚本,写过自动收邮件的脚本,写过简单的验证码识别的脚本,本来想写google music的抓取脚本的,结果有了强大的gmbox,也就不用写了。-这些脚本有一个共性,都是和web相关的,总要用到获取链接的一些方法,再加上simplecd这个半爬虫半网站的项目,累积不少爬虫抓站的经验,在此总结一下,那么以后做东西也就不用重复劳动了。-1.最基本的抓站
import urllib2content = urllib2.urlopen('http://XXXX'
django的外键查询
假设我有两个表(model),分别叫useraccount和userrole:
class UserAccount(meta.Model):person = meta.ForeignKey(Person, core=True)account = meta.ForeignKey(User, core=True)
class UserRole(meta.Model):account = meta.ForeignKey(UserAccount, core=True)group = meta.ForeignKey(Group, core=True)acti ...
Ubuntu Linux 目录结构
重要的标准目录结构和文件
/ 根目录/bin 基本命令的二进制文件–包含启动系统和在恢复模式初次运行所需的文件/boot 引导加载程序的静态文件–包含引导系统的所有文件/dev 设备文件–包含代表外围设备(如磁盘驱动器,终端,打印机)的所有文件/etc 本地计算机系统配置文件/etc/opt 放在opt/目录下的附加软件包的配置文件etc/X11 用于X窗口系统的本地计算机配置文件/home 用户主目录/lib 共享库/lib/modules 可加载内核模块/mnt 临时挂载文件系统的挂载点/opt 附加软件包(optional ...
Python学习
On this page... (hide)
1. 基本安装
2. Python文档
2.1 推荐资源站点
2.2 其他参考资料
2.3 代码示例
3. 常用工具
3.1 Python IDE
3.2 内置类库使用参考
3.3 常用第三方类库
3.4 其他东西
3.5 有意思的东西
3.6 普通但没准有用的东西
(Edit Section ↓)
1. 基本安装
django-friends
地址:http://wiki.github.com/jtauber/django-friends/
api doc
Welcome to the django-friends wiki!
I haven’t worked with friends in a while. I’m just throwing this documentation here because I created some for my use. Please check it!
Model Contact
Friendship:objects:
非常全的资料
http://code.djangoproject.com/wiki/DjangoResources
项目管理:rancho
http://demo.getrancho.com
文本比较库:
http://code.google.com/p/google-diff-match-patch/
值得研究!
aptana更新
http://download.aptana.org/tools/studio/plugin/install/studio
持续集成Martin Fowler & Matthew Foemmel 著 透明 译Martin FowlerChief Scientist, ThoughtWorks 译者语:2002年1月23日,我们很荣幸的在UMLCHINA组织的网上交流中聆听了Martin Fowler先生的教诲。在交流中,Martin Fowler向所有中国软件开发者推荐了这篇文章:Continuous Integration(《持续集成》)。初读之下,我便感觉到了它的分量,AgileChina的林星也称赞:“其中的思想非常的好,大师就是大师。”然后,用了一周的时间,我终于把这篇文章翻译出来,以飨读者。 ...
持续集成精华理论(转载)
持续集成是一个程序开发的原则,它要求开发小组的每个成员频繁的集成他们的工作成果,这个频度通常是至少每天一次,有时甚至每天多次。每次的集成通过一个包含测试的build去尽快的探测潜在 ...
组织级配置管理员与项目级配置管理员的职责定义(转)
很多公司设置了组织级配置管理员与项目级配置管理员,以下为建议的对这两种岗位的职责定义。 项目级配置管理员的职责: 1 制定配置管理计划 2 建立并维护配置管理库 3 建立并发布基线 4 物理审计(PCA) 5 跟踪并关闭变更申请 6 报告配置状态
STAF(Software Testing Automation Framework,软件测试自动化框架)是一个开源的,支持多种平台,多种语言的框架,主要围绕着可重用组件和服务(如过程调用,资源管理,日志,监视)。它的目的在于使软件测试更加容易,尤其更易 ...