感知机-Percepron

博客分类：

机器学习

代码说明：w和b为感知机模型参数，w就是weight叫做权值，或者叫weight ector，叫做偏置，（bias） f(x) = w.x+b package org.ansj.ml; import java.util.Arrays; public class Perceptron { public static void main(String[] args) { //三个点 int[][] T = { { 3, 3 }, { 4, 3 }, { 1, 1 } }; //定义应三个点类别 int ...

2013-10-29 10:29
浏览 1543
评论(0)
分类:编程语言

elasticsearch 常用备忘

博客分类：

J2EE
备忘录

java

关闭服务： curl -XPOST 'http://localhost:9200/_shutdown' 显示log ./elasticsearch -f

2013-10-23 13:56
浏览 1330
评论(0)
分类:编程语言

算法实现系列第六章.桶排序

博客分类：

算法讨论

算法

package algorithm; /** * 桶排序 * @author ansj * */ public class BucketSort { /** * 这个排序算法很恶心.但是容易写我凑个数呵呵 * @param args */ public static void main(String[] args) { int [] bucket = new int[1000] ; int[] array = {1,32,234,34,5,54,6,65,932,7,56,455} ; for (int i : arra ...

2013-01-10 15:18
浏览 1449
评论(0)
分类:编程语言

算法实现系列第五章.viterbi算法

博客分类：

算法讨论

算法

package algorithm; public class Viterbi { /** * 维特比算法（Viterbi algorithm）是一种动态规划算法。它用于寻找最有可能产生观测事件序列的-维特比路径-隐含状态序列,特别是在马尔可夫信息源上下文和隐马尔可夫模型中。术语“维特比路径”和“维特比算法”也被用于寻找观察结果最有可能解释相关的动态规划算法。例如在统计句法分析中动态规划算法可以被用于发现最可能的上下文无关的派生(解析)的字符串，有时被称为“维特比分析”。 * @param args */ public static void main(Str ...

2013-01-10 14:57
浏览 2107
评论(0)
分类:编程语言

两个大数字相乘

博客分类：

算法讨论

没什么只是.一个demo package net.csdn.service.tag.impl; import java.util.ArrayList; import java.util.HashMap; import java.util.List; import love.cq.util.StringUtil; import net.csdn.exception.ArgumentErrorException; import net.csdn.pojo.tag.ObjTag; import net.csdn.pojo.tag.Tag; import net.c ...

2013-01-10 14:54
浏览 1766
评论(0)
分类:编程语言

算法实现系列第四章.启发式搜索_A*搜索

博客分类：

算法讨论

启发式搜索

..很郁闷启发式搜索和A*搜索.自己对照文档写了下..发现和之前学的有出入...算了先写这个吧..等我回去翻翻笔记...如果有问题再来补充..明白的同学可以直接拍砖... 下面我们对这个图进行..最短路径的查 package algorithm; import java.util.ArrayList; import java.util.HashMap; import java.util.Iterator; import java.util.List; import java.util.Map.Entry; import java.util.Set; /* ...

2013-01-09 14:31
浏览 2434
评论(0)
分类:编程语言

算法实现系列第三章.快速排序

博客分类：

算法讨论

先剽窃jdk的... package algorithm; import java.util.Arrays; /** * 快速排序,哦也 * * @author ansj * */ public class QuickSort { public static void main(String[] args) { long[] ints = { 123, 1234, 324, 2, 1, 12, 31, 4, 3, 3, 466, 7, 87, 87, 56, 456, 5 }; sort(ints, 0, ints.length); ...

2013-01-08 16:05
浏览 1406
评论(0)
分类:编程语言

算法实现系列第二章.堆排序

博客分类：

算法讨论

算法 java

说白了就是二叉树排序..java中hashset中非基本数据类型的对象比较就是用的这个方式... package binarytree; public class BinaryTree { public static void main(String[] args) { Node root = null; int[] ints = { 123, 1234, 324, 2, 1, 12, 31, 4, 3, 3, 466, 7, 87, 87, 56, 456, 5 }; root = new Node(ints[0]); for ...

2013-01-08 15:56
浏览 1418
评论(0)
分类:编程语言

算法实现系列第一章.冒泡排序

博客分类：

算法讨论

package algorithm; public class Bubbling { public static void main(String[] args) { int[] ints = {123,1,31,31,432,42,1,23,556,75,67,76,8,6} ; int temp = 0 ; for (int i = 0; i < ints.length; i++) { for (int j = i; j < ints.length; j++) { if(ints[i]<ints[j]){ ...

2013-01-08 15:47
浏览 1406
评论(0)
分类:编程语言

介绍一种基于角色标注+字词体位法的人名识别方式-Ansj中文分词

博客分类：

算法讨论
J2EE
JAVASE

java java中文分词中文分词人名识别

大家好.最近在做分词.在分词中遇到了各种各样的问题.在这里选择一个比较有意思的与大家分享. 在这里说分词有点老生常谈了.的确.中文分词已经非常成熟了.但是在实体名识别上一直是中文分词的软肋.最近通过对ictclas的学习,和自己的总结.得出了一个还算不错的人名识别系统. 目前这种方式已经开源.大家可以参看:https://github.com/ansjsun/ansj_seg , 在线测试:http://www.ansj.org/demo/seg.jsp 主要思路是..先粗分,粗分的办法很多.但是在粗分的时候要尽量减少歧异. 比如祝海林在 ...

2012-09-14 13:35
浏览 7294
评论(14)
分类:Web前端

Totoro中文分词第二版上线啦

Lucene

经过不懈的努力.耗费了毕生经历.终于把分词写完了. 事后觉得太过复杂的东西真的不是好玩的..可控性太差了. 推翻恢复.重写.优化经历了一晚上.终于得道了一个还算满意的答案. 呵呵废话不多说了..老规矩.我先介绍下这一版分 ...

2012-08-12 17:49
浏览 1930
评论(2)
论坛回复 / 浏览 (20 / 12620)
分类:开源软件

一些分词中用到的公式-参考ictclas

//计算平滑系数公式 //平滑参数 dSmoothingPara = 0.1 //设置当前节点的频度，如果是已知词性，直接使用频度 dCurFreqency //一个参数 static int MAX_FREQUENCE = 2079997; //Two linked Words frequency dTemp = (double) 1 / MAX_FREQUENCE; //两词之间的词频?关联度? nTwoWordsFreq = DictBinary.GetFrequency(sTwoWords, 3); //这个词的平度 if (pCu ...

2012-08-08 11:17
浏览 2732
评论(6)
分类:编程语言

一晚上整理出来的激动

每种词性的概率 1 4 a ad ag an b c d dg e f h

2012-08-07 23:45
浏览 1742
评论(0)
分类:非技术

贝叶斯学习笔记

博客分类：

JAVASE
算法讨论

贝叶斯分类

一.什么是贝叶斯贝叶斯是数学统计分类发放.可以预测类成员关系的可能性.如果直接说起贝叶斯.那么他就是一个数学模型. 数学模型我的理解就是.将显示生活中的一些现象通过.数学公式予以表示. 二.关于贝叶斯� ...

2012-04-19 11:21
浏览 1644
评论(0)
分类:编程语言

大话字符编码发展史

博客分类：

JAVASE

ascii gb2312 gb

ASCII码 ASCII码于1968年提出，用于在不同计算机硬件和软件系统中实现数据传输标准化，在大多数的小型机和全部的个人计算机都使用此码。ASCII码划分为两个集合：128个字符的标准ASCII码和附加的128个字符的扩充和ASCII码。比较EBCDIC。其中95个字符可以显示。另外33个不可以显示。标准ASCII码为7位，扩充为8位。　美国(国家)信息交换标准(代)码，一种使用7个或8个二进制位进行编码的方案，最多可以给256个字符从描述可以看出(ASCII码)表示 ,只是对西文字符的一个集合. [a-z][A-Z] ,其中包括95个可见字符.和33个不可见字符. ...

2012-04-06 17:17
浏览 3790
评论(0)
分类:编程语言

最近访客更多访客>>

博主相关

文章分类

社区版块

存档分类

最新评论

感知机-Percepron

elasticsearch 常用备忘

算法实现系列第六章.桶排序

算法实现系列第五章.viterbi算法

两个大数字相乘

算法实现系列第四章.启发式搜索_A*搜索

算法实现系列第三章.快速排序

算法实现系列第二章.堆排序

算法实现系列第一章.冒泡排序

介绍一种基于角色标注+字词体位法的人名识别方式-Ansj中文分词

Totoro中文分词第二版上线啦

一些分词中用到的公式-参考ictclas

一晚上整理出来的激动

贝叶斯学习笔记

大话字符编码发展史

最近访客 更多访客>>

博主相关

文章分类

社区版块

存档分类

最新评论

最近访客更多访客>>