- 浏览: 562469 次
- 性别:
- 来自: 杭州
最新评论
-
hanjiyun:
本人水平还有待提高,进步空间很大,看这些文章给我有很大的指导作 ...
JVM的内存管理 Ⅲ -
liuxinglanyue:
四年后的自己:这种方法 不靠谱。 使用javaagent的方式 ...
计算Java对象占用内存空间的大小(对于32位虚拟机而言) -
jaysoncn:
附件在哪里啊test.NoCertificationHttps ...
使用HttpClient过程中常见的一些问题 -
231fuchenxi:
你好,有redis,memlink,mysql的测试代码吗?可 ...
MemLink 性能测试 -
guyue1015:
[color=orange][/color][size=lar ...
JAVA同步机制
文章列表
主博客是:http://www.liuxinglanyue.com/
主论坛是:http://bbs.liuxinglanyue.com/ 论坛崩溃掉了。
这个论坛已于2011-2-18日恢复。
欢迎对论坛的版块设置提供改进意见,谢谢。
同时也欢迎在论坛里交流技术。
这里有个论坛:http://java.liuxinglanyue.com/
支持google账户直接登录,支持Gravatar 更改你的头像
新浪微博地址:http://t.sina.com.cn/liuxinglanyue
我的博客:http://www.liuxinglanyue.com/
欢迎来踩。
其实谈不上总结,而是生活的一段剪影。
直到昨天晚上,我注册的域名(liuxinglanyue.com)终于和博客绑定了。这中间还是遇到了不少问题,不 ...
IBM技术文档库
阿里巴巴(软件)开发者博客
淘宝数据平台与产品部官方博客
搜索引擎研究团队
车东[Blog^2]
HttpClient4 Post XML到一个服务器上
纯Java文件操作工具,支持文件、文件夹的复制、删除、移动
山寨版Log4j
Java反射深度测试
深入理解HTTP Session
深入理解ServletRequest与ServletResponse
Java字符编码根本原理
Servlet接收JSP参数乱码问题解决办法
JDBC数据源(DataSource)的简单实现
Java应用程序工程模板
Java线程:深入ThreadLocal
Java线程:线程私有变量
揭开Annotation的面纱
Java字符集编码与转码
纯JDBC系
强烈推荐,适合入门,适合深入
http://www.cnpythoner.com/
原文 http://www.hetland.org/python/instant-hacking.php Instant Hacking[译文] 译者: 肯定来过 这是一篇简短的关于python程序设计语言的入门教程,原文在这里,翻着词典翻译了来! ...
python所支持的数据类型:整型、长整型、布尔型、浮点型、复数、字符串、列表(list)、元组(Tuple)、字典(Dict)、object
python能支持理论意义上的长整型,如C#中的长整型是Int64,即最大值为2的64次方,而python中的长整型只与机器的虚拟内存大小有关,你完全不用考虑溢出这样的异常。
python是一种动态语言,虽然在定义变量时无需定义变量的类型,但并不意味着在运行的过程中,你可以随时更改变量的类型,所以,python是一种强类型的动态语言,它与asp/javascript/php完全不一样,比如:
>>> a=123
...
注释(#):
python中的注释是以#开头的,不像c++中有/**/之类的多行注释。
继续():表示继续上一行,通常情况下,一行表示一个语句,一行过长的语句可以使用进行分解
语句块(:):在c#/php/javascript/c++中,对于复合语句是用{}来 ...
python3.0已推出,但据说很多库都不能用了,建议使用2.6版本,我目前使用的是2.5版,与2.6版差距不大。
注意:2.6版本开始,print需要加上括号,否则会提示语法错误。
安装python运行环境:
下载for windows的安装包,http://www.python.org/,不过,正式对外的下载地址被和谐了,请移步到这里下载:http://www.python.org/ftp/python/
运行下载的.msi文件执行安装程序,默认会安装在系统盘符:/python25目录下,当然你可以更改该目录,但建议使用默认值,安装完成后会自动注册环境变量
运行cm ...
五、为HTML文档中的属性值添加引号
前面我们讨论了如果根据HTML解析器中的某种处理程序来解析HTML文件,可是有时候我们却需要使用所有的处理程序来处理HTML文档。值得庆幸的是,使用HTMLParser模块解析HTML文件的所有要素并不比处理链接或者图像难多少。
import HTMLParser import urllib class parseAttrs(HTMLParser.HTMLParser): def handle_starttag(self, tag, attrs): . . .
对搜索引擎、文件索引、文档转换、数据检索、站点备份或迁移等应用程序来说,经常用到对网页(即HTML文件)的解析处理。事实上,通过Python语言提供的各种模块,我们无需借助Web服务器或者Web浏览器就能够解析和处理HTML文档。本文上篇中,我们介绍了一个可以帮助简化打开位于本地和Web上的HTML文档的Python模块。在本文中,我们将论述如何使用Python模块来迅速解析在HTML文件中的数据,从而处理特定的内容,如链接、图像和Cookie等。同时还会介绍如何规范HTML文件的格式标签。
一、从HTML文档中提取链接
Python语言还有一个非常有用的模块HTMLParse ...
对搜索引擎、文件索引、文档转换、数据检索、站点备份或迁移等应用程序来说,经常用到对网页(即HTML文件)的解析处理。事实上,通过Python语言提供的各种模块,我们无需借助Web服务器或者Web浏览器就能够解析和处理HTML文档。本文将详细介绍如何利用Python抓取和解析网页。首先,我们介绍一个可以帮助简化打开位于本地和Web上的HTML文档的Python模块,然后,我们论述如何使用Python模块来迅速解析在HTML文件中的数据,从而处理特定的内容,如链接、图像和Cookie等。最后,我们会给出一个规整HTML文件的格式标签的例子,通过这个例子您会发现使用python处理HTML文件的内容是 ...
1. 给定a、b两个文件,各存放50亿个url,每个url各占64字节,内存限制是4G,让你找出a、b文件共同的url? 方案1:可以估计每个文件安的大小为50G×64=320G,远远大于内存限制的4G。所以不可能将其完全加载到内存中处理。考虑采取分而治之的方法。 (1)遍历文件a,对每个url求取clip_image002,然后根据所取得的值将url分别存储到1000个小文件(记为 clip_image004)中。这样每个小文件的大约为300M。 (2)遍历文件b,采取和a相同的方式将url分别存储到1000各小文件(记为clip_image00 ...
Java深度历险(一)——Java字节代码的操纵
Java深度历险(二)——Java类的加载、链接和初始化
A.关于推荐系统的综述说明
推荐系统:主要推荐方法
电子商务推荐系统入门基础
电子商务推荐系统研究综述
Collaborative Filtering
为什么基于项目的协同过滤是稳定的.
个性化推荐系统的研究进展[和朋友一起写的小综述]
推荐系统: