`
zhouqiang128
  • 浏览: 94913 次
  • 性别: Icon_minigender_1
  • 来自: 北京
社区版块
存档分类
最新评论
文章列表
1.激活command window; 2.然后按ctrl+c ;

设置JVM

-Xmx1024m
1. 引子 Bag-of-Words 模型是NLP和IR领域中的一个基本假设。在这个模型中,一个文档(document)被表示为一组单词(word/term)的无序组合,而忽略了语法或者词序的部分。BOW在传统NLP领域取得了巨大的成功,在计算机视觉领域(Computer Vision)也开始崭露头角,但在实际应用过程中,它却有一些不可避免的缺陷,比如: 稀疏性(Sparseness): 对于大词典,尤其是包括了生僻字的词典,文档稀疏性不可避免; 多义词(Polysem): 一词多义在文档中是常见的现象,BOW模型只统计单词出现的次数,而忽略了他们之间的区别; 同义词(Synon ...
什么是信息增益(Information Gain)? 当我们需要对一个随机事件的概率分布进行预测时,我们的预测应当满足全部已知的条件,而对未知的情况不要做任何主观假设。在这种情况下,概率分布最均匀,预测的风险最小。因为这时概 ...
修改注册表。进入注册表,打开 “HKEY_CLASSES_ROOT\\lnkfile”分支, 在lnkfile子键下面找到一个名为 “IsShortcut”的键值,它表示在桌面的.LNK快捷方式图标上将出现一个小箭头。右键单击“IsShortcut”,然后从弹出的菜单中选择“删除”,将该键值删除。 因为快捷方式以.LNK居多,但也有一些是.PIF(指向MS-DOS程序的快捷方式)所以也将“HKEY_CLASS-ES_ROOT\\piffile”分支上的“IsShort-cut”删除,重启计算机就可以了。
1.开始--运行--输入control userpasswords2 ; 2.取消 “要使用本机,用户必须输入用户名和密码” 的选择;
问题:   1.没有数据备份,重装MySQL之后,只有以前的data文件夹及其子目录文件;   解决方法:   1.delete重装之后的data; 2.copy早先的data到相应目录; 3.delete ib_logfile0 和 ib_logfile1 两个日志文件; 4.运行MySQL,数据恢复正常;
step1 远程的服务器端设置: 要有用户名和密码; 我的电脑-属性-远程-允许用户远程连接到此计算机; step2 本地用户的客户端连接: 运行-cmd-mstsc; 或者 开始-程序-附件-远程桌面连接; 输入IP地址;
SQL语句: truncate table table_name;
序号  大写  小写  英文注音  国际音标注音  中文注音  意义1      Α       α      alpha       a:lf                阿尔法  角度;系数2      Β       β      beta        bet          ...
SVM-1 (1) SVM(Support Vector Machine)是从瓦普尼克(Vapnik)的统计学习理论发展而来的,主要针对小样本数据进行学习、分类和预测(有时也叫回归)的一种方法,能解决神经网络不能解决的过学习问题。作者以为,类似的根据样本进行学习的方法还有基于案例的推理(Case-Based Reasoning),决策树归纳算法C4.5等,以后将详细阐述这两种方法。 (2)过学习问题:训练误差过小导致推广能力下降,即真实风险的增加。 (3)推广能力:generalization ability,也可以说是泛化能力,就是对未知样本进行预测时的精确度。
1.概述     熵(entropy)指的是体系的混乱的程度,它在控制论、概率论、数论、天体物理、生命科学等领域都有重要应用,在不同的学科中也有引申出的更为具体的定义,是各领域十分重要的参量。熵由鲁道夫·克劳修斯(Rudo ...

对数换底公式

    博客分类:
  • Math
公式:
(1) 朴素贝叶斯算法   设每个数据样本用一个n维特征向量来描述n个属性的值,即:X={x1,x2,…,xn},假定有m个类,分别用C1, C2,…,Cm表示。给定一个未知的数据样本X(即没有类标号),若朴素贝叶斯分类法将未知的样本X分配给类Ci,则一定是   P(Ci|X)>P(Cj|X) 1≤j≤m,j≠i   根据贝叶斯定理   由于P(X)对于所有类为常数,最大化后验概率P(Ci|X)可转化为最大化先验概率P(X|Ci)P(Ci)。如果训练数据集有许多属性和元组,计算P(X|Ci)的开销可能非常大,为此,通常假设各属性的取值互相独立,这样   先验概率P(x1|Ci), ...
在向量空间模型中,文本泛指各种机器可读的记录。用D(Document)表示,特征项(Term,用t表示)是指出现在文档D中且能够代表该文档内容的基本语言单位,主要是由词或者短语构成,文本可以用特征项集表示为D(T1,T2,…,Tn) ...
Global site tag (gtag.js) - Google Analytics