`
文章列表
superword是一个Java实现的英文单词分析软件,主要研究英语单词音近形似转化规律、前缀后缀规律、词之间的相似性规律等等。   IT领域中和软件开发相关的249本电子书打包下载   ​CET4、CET6、GRE、IELTS、TOEFL、考研英语总的词汇量为14055,其中有9224个出现到了二百多部软件著作中。单词后面跟的是词频。   1 the-999272 to-452799 of-334689 and-282144 in-250769 2 that-195787 you-186249
8年多爬虫经验的人告诉你,国内ADSL是王道,多申请些线路,分布在多个不同的电信机房,能跨省跨市更好,我这里写好的断线重拨组件,你可以直接使用。 ADSL拨号上网使用动态IP地址,每一次拨号得到的IP都不一样,所以我 ...
对如下图30个JDK类库源代码中最频繁出现的词的深度分析: if语句用的是最多的,第一大控制结构。搞编程,很多时候就是在处理各种情况,做各种条件判断。 get方法是最多的,set比get要少一点,是因为set一般是setXXX,get除了getXXX,直接用get更简洁,get和set是java的一大特色。 this的使用也是非常具有JAVA特色的,几乎遍及每一个类,当然这个关键字是可以省的,如果不能省,那么这个词肯定排名第一。 return这么多,说明了有返回值的方法那是相当多了啊,这也正常,毕竟JDK类库嘛,不返回值的情况很少滴。 public远远超过private和prote ...
superword是一个Java实现的英文单词分析软件,主要研究英语单词音近形似转化规律、前缀后缀规律、词之间的相似性规律等等。 复杂度级别挑选最高的99级,从1-99递增,每个级别只选择一个句子:   1、Paradise flycatchers are monogamous, which makes their distinctive coloring and plumage unusual, as this form of sexual display is usually reserved for nonmonogamous species. Cassandra The Def ...
英语对我们搞IT的人来说实在太重要了,你还在为记不住英语单词而苦恼吗?还在为看不懂thinking in java而伤神吗?看看我最近的研究,也许对你有些启发呢!基于英国国家语料库中最常见的18299个英语单词进行分析,如 AB-, ABS- (away from, off, apart) (hit 13) 表示“包含前缀AB或ABS的单词且单词除去前缀后剩下的部分本身也是一个单词”,第一个括号里面的内容是对前缀的含义的解释,第二个括号里面的hit后面的数字表示有此前缀的单词有多少个是在这18299个词范围内,还可以点击单词链接在爱词霸中查看详细含义。 superword是一个Java实现 ...
英语对我们搞IT的人来说实在太重要了,你还在为记不住英语单词而苦恼吗?还在为看不懂thinking in java而伤神吗?看看我最近的研究,也许对你有些启发呢!基于英国国家语料库中最常见的18299个英语单词进行分析,如 -ABLE, -ABLY (able to, capable of being.) (hit 65) 表示“包含后缀ABLE或ABLY的单词且单词除去后缀后剩下的部分本身也是一个单词”,第一个括号里面的内容是对后缀的含义的解释,第二个括号里面的hit后面的数字表示有此后缀的单词有多少个是在这18299个词范围内,还可以点击单词链接在爱词霸中查看详细含义。 superwo ...
superword是一个Java实现的英文单词分析软件,主要研究英语单词音近形似转化规律、前缀后缀规律、词之间的相似性规律等等。   一个月的时间让你的词汇量翻一翻   The 100 most common Latin and Greek roots figure in more than 5,000 English derivatives just beyond the average person’s vocabulary of 10,000 words. They are the ones in all CAPITAL letters. By memorizing these ...
英语对我们搞IT的人来说实在太重要了,你还在为记不住英语单词而苦恼吗?还在为看不懂thinking in java而伤神吗?看看我最近的研究,也许对你有些启发呢!基于英国国家语料库中最常见的18299个英语单词进行分析,如 b - p rule 表示“将单词中的b字母转化为p字母”,后面的total number是表示转化之后的单词有多少个是在这18299个词范围内,可以点击单词链接在爱词霸中查看详细含义。通过这种方式,可以找到读音相近、外形相似、含义相关的英语单词,从而非常有利于我们深入地记忆理解这些单词。 superword是一个Java实现的英文单词分析软件,主要研究英语单词音近形似 ...
利用Java Platform Debugger Architecture(JPDA:Java平台调试架构)进行Java程序远程调试,JVM本身支持指定参数来让Java程序以调试模式启动,当虚拟机运行在调试模式下,你只要去连接它的相应监听端口就可以远程调试程序了。 具体做法如下: 1、在java命令后跟如下参数启动程序: JAVA_DEBUG_OPT=" -server -Xdebug -Xnoagent -Djava.compiler=NONE -Xrunjdwp:transport=dt_socket,address=3090,server=y,suspend=y &qu ...
在Java应用系统中,我们经常需要配置文件来定制系统行为,这些配置文件可能包括:类路径下的文件和文件夹、非类路径下的绝对路径和相对路径的文件和文件夹,在分布式环境中,还需要通过HTTP从统一集中的Web服务器中获得配置信息,如何对这些配置信息进行自动加载并实时检测变化呢?   Java分布式中文分词组件 - word分词已经实现了这个功能,我们看看是如何实现的:     package org.apdplat.word.util; import java.io.BufferedReader; import java.io.File; import java.io.File ...
    每一个软件项目的第一个版本都很漂亮。新项目从零开始,所有的内容都是新开发的。因为全新开发,就意味着没有历史负担的问题。第一个版本的BUG非常少,当然,程序员也尽力做到最好。这意味着,在开发人员的眼中 ...
HtmlExtractor是一个Java实现的基于模板的网页结构化信息精准抽取组件,本身并不包含爬虫功能,但可被爬虫或其他程序调用以便更精准地对网页结构化信息进行抽取。  
QuestionAnsweringSystem是一个Java实现的人机问答系统,能够自动分析问题并给出候选答案。IBM人工智能计算机系统"沃森"(Watson)在2011年2月美国热门的电视智力问答节目"危险边缘"(Jeopardy!)中战胜了两位人类冠军选手,QuestionAnsweringSystem就是IBM Watson的Java开源实现。   系统架构如下:     QuestionAnsweringSystem提供了两种集成方式,以库的方式嵌入到应用中,以平台的方式独立部署。   下面说说这两种方式如何做。   1、 ...
网络爬虫架构在Nutch+Hadoop之上,是一个典型的分布式离线批量处理架构,有非常优异的吞吐量和抓取性能并提供了大量的配置定制选项。由于网络爬虫只负责网络资源的抓取,所以,需要一个分布式搜索引擎,用来对网络爬虫抓取到的网络资源进行实时的索引和搜索。   搜索引擎架构在ElasticSearch之上,是一个典型的分布式在线实时交互查询架构,无单点故障,高伸缩、高可用。对大量信息的索引与搜索都可以在近乎实时的情况下完成,能够快速实时搜索数十亿的文件以及PB级的数据,同时提供了全方面的选项,可以对该引擎的几乎每个方面进行定制。支持RESTful的API,可以使用JSON通过HTTP调用它的 ...
搜索引擎通过分片(shard)和副本(replica)实现了高性能、高伸缩和高可用。   分片技术为大规模并行索引和搜索提供了支持,极大地提高了索引和搜索的性能,极大地提高了水平扩展能力;   副本技术为数据提供冗余,部分机器故障不影响系统的正常使用,保证了系统的持续高可用。   有2个分片和3份副本的索引结构如下所示:  
Global site tag (gtag.js) - Google Analytics