`
helloyesyes
  • 浏览: 1313428 次
  • 性别: Icon_minigender_2
  • 来自: 武汉
文章分类
社区版块
存档分类
最新评论

基于统计方法的二字词发掘程序

阅读更多

package test;

import java.io.FileNotFoundException;
import java.io.FileOutputStream;
import java.io.IOException;
import java.io.ObjectOutputStream;
import java.util.HashMap;

public class Letter {
private HashMap letter = new HashMap();


public void run() {
char c = 0;
for(int i=19968;i<40870;i++) {
c = (char) i;
//System.out.print(i + " " +c);
System.out.print(c + " ");

letter.put(c, c);

if(i % 255 == 0) {
System.out.println();
}
}

this.save(letter, "d:/letter.obj");
}



public void run1() {
byte[] c = new byte[2];
byte i , j;
for(i=0;i<255;i++) {
for(j=0;j<255;j++) {
c[0] = i;
c[1] = j;
System.out.print(String.valueOf(c) + " ");
}
System.out.println();
}
}



public void save(HashMap map, String file) {
ObjectOutputStream out;

try {
out = new ObjectOutputStream(new FileOutputStream(file));

out.writeObject(map);

out.close();

} catch (FileNotFoundException e) {
// TODO Auto-generated catch block
e.printStackTrace();
} catch (IOException e) {
// TODO Auto-generated catch block
e.printStackTrace();
}
}
}

package test;

import java.io.FileInputStream;
import java.io.FileNotFoundException;
import java.io.FileOutputStream;
import java.io.IOException;
import java.io.ObjectInputStream;
import java.io.ObjectOutputStream;
import java.util.ArrayList;
import java.util.HashMap;
import java.util.Iterator;
import java.util.List;


public class Test {
private HashMap zi = new HashMap();
private HashMap ci = new HashMap();
private HashMap ju = new HashMap();
private HashMap count = new HashMap();

private String[] sort = new String[500];

private List result = new ArrayList();

public void run(String content) {
System.out.println(content);

zi = this.load("zi.obj");
ci = this.load("ci.obj");
ju = this.load("ju.obj");
count = this.load("count.obj");



scan(content);

this.save(zi, "zi.obj");
this.save(ci, "ci.obj");
this.save(ju, "ju.obj");

this.save(count, "count.obj");

this.list(count);

System.out.println("\n\n\n\n\n***\n\n\n\n\n");

this.lists(sort);
}

public void scan(String content) {
int l = content.length();
StringBuilder builder = new StringBuilder();
StringBuilder t = new StringBuilder();
char c = 0;
char o = 0;
for(int i=0;i<l;i++) {
//System.out.println(content.charAt(i));
c = content.charAt(i);

zi.put(c, c);

if(split(c)) {
System.out.println();
System.out.println(builder.toString());
ju.put(builder.toString(), builder.toString());
builder.delete(0, builder.length());
o = 0;
c = 0;
} else {
builder.append(c);
if(o != 0) {
t.append(o).append(c);
Object obj;
int k = 0;

obj = count.get(t.toString());

if(obj != null) {
k = (Integer) obj;
k += 1;
count.put(t.toString(), k);
} else {
count.put(t.toString(), 1);
}

t.delete(0, t.length());
}
o = c;
}

}
}


public boolean split(char c) {
boolean result = false;
String chars = " ,。;!?“”…、,.;!?";
for(int i=0;i<chars.length();i++) {
if(chars.charAt(i) == c) {
result = true;
break;
}
}
return result;
}

public HashMap load(String file) {
HashMap map = null;

ObjectInputStream in;

try {
in = new ObjectInputStream(new FileInputStream(file));

map = (HashMap) in.readObject();

in.close();

} catch (FileNotFoundException e) {
// TODO Auto-generated catch block
e.printStackTrace();
} catch (IOException e) {
// TODO Auto-generated catch block
e.printStackTrace();
} catch (ClassNotFoundException e) {
// TODO Auto-generated catch block
e.printStackTrace();
}

return map;
}

public void save(HashMap map, String file) {
ObjectOutputStream out;

try {
out = new ObjectOutputStream(new FileOutputStream(file));

out.writeObject(map);

out.close();

} catch (FileNotFoundException e) {
// TODO Auto-generated catch block
e.printStackTrace();
} catch (IOException e) {
// TODO Auto-generated catch block
e.printStackTrace();
}
}


public void list(HashMap map) {

Iterator it = map.keySet().iterator();
while(it.hasNext()) {
String t = (String) it.next();
int k = (Integer) count.get(t);
System.out.println(t + " " + k);

String s = sort[k];
if(s == null) {
sort[k] = t;
} else {
s = s + " " + t;
sort[k] = s;
}
}

}

public void lists(String[] sort) {
for(int i=0;i<sort.length-1;i++) {
System.out.println(i+": " + sort[i]);
}
}

}

package test;

import java.io.BufferedWriter;
import java.io.FileNotFoundException;
import java.io.FileOutputStream;
import java.io.FileWriter;
import java.io.IOException;
import java.io.ObjectOutputStream;
import java.util.HashMap;

public class Words {
private HashMap words = new HashMap();


public void run() throws IOException {
char c=0 , d=0;
int i , j;
long a = 0;
int s = 1;
BufferedWriter writer;
//BufferedWriter writer = new BufferedWriter(new FileWriter("d:/word.txt"));

writer = new BufferedWriter(new FileWriter("d:/w/word" + s + ".txt"));

for(i=19968;i<40870;i++) {
for(j=19968;j<40870;j++) {
c = (char) i;
d = (char) j;
String t = String.valueOf(c) + String.valueOf(d);
//words.put(t, t);
a ++;
//System.out.print(a + ": " + t + " ");
writer.write(a+": "+i+" "+j+" "+t+ " 0 ");
if(a % 255 == 0) {
writer.write("\n");
}

if(a % (255 * 255 * 16 * 4) == 0) {
writer.close();
s++;
writer = new BufferedWriter(new FileWriter("d:/w/word" + s + ".txt"));
}
}
//System.out.println();
}

writer.close();

//this.save(words, "d:/word.obj");
}


public void save(HashMap map, String file) {
ObjectOutputStream out;

try {
out = new ObjectOutputStream(new FileOutputStream(file));

out.writeObject(map);

out.close();

} catch (FileNotFoundException e) {
// TODO Auto-generated catch block
e.printStackTrace();
} catch (IOException e) {
// TODO Auto-generated catch block
e.printStackTrace();
}
}
}

分享到:
评论

相关推荐

    基于JavaScript的公益人优势发掘器设计源码

    该项目是一款基于JavaScript的公益人优势发掘器设计源码,总计包含51个文件,涵盖18个JavaScript脚本文件、9个CSS样式文件、9个XML配置文件、2个Markdown文档、2个JSON数据文件、1个EditorConfig配置文件、1个环境...

    基于SSM的微信阅读小程序.zip

    这是一个基于SSM的微信阅读小程序,旨在为用户提供更加便捷和个性化的阅读体验。该小程序提供了丰富的书籍资源,用户可以在小程序内轻松浏览并选择自己感兴趣的书籍进行阅读。除了常规的阅读功能外,该小程序还支持...

    步步高外语通电子词典9288T系统安装程序和游戏.rar

    这样的资源包对拥有9288T的用户来说是一份宝贵的资料,尤其是对于那些寻求设备优化和扩展功能的爱好者来说,它提供了进一步发掘设备潜力的可能性。在操作过程中,用户需要注意数据安全,遵循正确的方法,避免对设备...

    一种基于Matlab的生产系统瓶颈单元智能发掘方法.pdf

    根据所提供的文件内容,该文档主要介绍了基于Matlab的生产系统瓶颈单元智能发掘方法(BIDM)。本方法的目的是为了优化生产系统的效率和产能,通过动态计算生产单元的产能,智能地识别和改善瓶颈单元,从而缩短生产...

    一种基于Matlab的生产系统瓶颈单元智能发掘方法.zip

    "一种基于Matlab的生产系统瓶颈单元智能发掘方法.pdf"可能包含了更详细的步骤、案例研究和实际操作指南,包括如何构建数学模型,选择适当的优化算法,以及如何解读和应用结果。读者可以详细阅读此PDF文档,以深入...

    《暗战亮剑-软件漏洞发掘与安全防范实战》┊王继刚[.PDF]

    使用FileFuzz发掘文字处理软件漏洞3.6 文字处理型软件漏洞的危害与利用3.6.1 ShellCode与木马植入3.6.2 本地权限与系统命令3.6.3 邮件附件中的隐蔽杀手3.7 实战课之二:编写属于自己的发掘漏洞程序3.8 媒体播放软件...

    工业物联网中基于机器学习方法的预测技术.pdf

    "工业物联网中基于机器学习方法的预测技术.pdf" 本文概述了工业物联网中基于机器学习方法的预测技术,讨论了机器学习在工业智能系统预测技术中的应用。随着工业物联网技术的发展,机器学习方法将发挥着越来越重要的...

    基于SQL技术的频繁模式的发掘.pdf

    本文将重点探讨《基于SQL技术的频繁模式发掘》这一主题,旨在通过SQL技术对FP-Growth算法进行优化,以期提高频繁模式挖掘的效率和性能。 频繁模式挖掘是寻找数据集中频繁出现的项集的过程,支持度和置信度是衡量项...

    论文研究-一种基于fuzzing技术的漏洞发掘新思路.pdf

    目前检测软件缓冲区溢出漏洞仅局限于手工分析、二进制补丁比较及fuzzing技术等,这些技术要么对人工分析依赖程度高,要么盲目性太大,致使漏洞发掘效率极为低下。结合fuzzing技术、数据流动态分析技术以及异常自动...

    基于微信小程序的Web工程师模拟面试系统.docx

    本学位毕业论文——“基于微信小程序的Web工程师模拟面试系统”,旨在探讨如何利用微信小程序的优势来优化教育过程。首先,论文深入剖析了微信小程序的功能和特点,如离线运行、快速启动、易于分享等,这些特性使得...

    基于OBE理念的面向对象程序设计(Java)课程教学改革.pdf

    本文探讨了面向对象程序设计(Java)课程教学过程中采用以产出为导向教学理念的可行性,阐明了基于OBE理念的面向对象程序设计(Java)课程教学改革基本思路,并对课程基于OBE教学理念的教学方法进行了深入探讨。...

    基于数据挖掘技术的经济统计研究.pdf

    1. 决策树方法:决策树方法主要是对数据中有价值信息的发掘,并进行有效的分类预测。常见的预测类型有连续型变量和类别型变量,决策树通过图形和规则作为模型形式,通过离散值逼近目标函数,形成分类规则。决策树的...

    微信小程序:拼图工具箱

    这是一款拼图工具箱小程序源码 小程序支持多种拼图制作生成 ...这款小程序安装方法还是挺简单的! 使用微信开发者工具打开该小程序源码,然后上传审核就可以了 这款小程序无需设置任何的合法域名

    小程序源码:拼图工具箱微信小程序源码下载支持多种拼图模式制作

    这是一款拼图工具箱小程序源码 小程序支持多种拼图制作生成 ...这款小程序安装方法还是挺简单的! 使用微信开发者工具打开该小程序源码,然后上传审核就可以了 这款小程序无需设置任何的合法域名

    基于卷积神经网络的微博情感倾向性分析.pdf

    本文提出了一种基于卷积神经网络的微博情感倾向性分析方法,使用字符级别词向量和词级别词向量作为原始特征,探讨了卷积神经网络在微博情感倾向性分析中的可行性。 实验结果表明,基于卷积神经网络的微博情感倾向性...

    基于用户行为的智能家居产品设计方法研究与应用.pdf

    研究成果以即将上市的某品牌扫地机器人产品为例,验证了基于用户行为的产品设计研究方法的可行性和有效性。通过用户行为采集和行为数据分析,该研究不仅发掘了产品的痛点,还提出了一系列改进方案,为智能家居产品的...

Global site tag (gtag.js) - Google Analytics