文章列表
折腾了好久,终于是把Drupal clean URL设置给弄好了。——等会把我的博客也改装一下。
废话不多说,直奔主题吧。
运行环境:ubuntu_8.10_desktop + Apache/2.2.9 (Ubuntu)
首先加载mod_rewrite模块:$: sudo a2enmod rewrite
使用命令 $:apache2ctl -M
查看模块是否成功加载,如果看到 rewrite_module (shared) 则加载成功。
接着,修改Apache2的配置文件:
$:sudo gedit /etc/apache2/apache2.conf
确认 Ac ...
- 2009-04-29 05:42
- 浏览 1667
- 评论(0)
前言:前几天翻译了一篇Drupal的介绍文章,但是比较简单。随着更加深入的了解,我越来越觉得使用Drupal平台进行资源管理是一个很不错的选择,所以,今后将转载Drupal Handbooks的一些精华文章。
Last modified: March 19, 2009 – 08:28
Although Drupal is often described as a “content management system” (CMS) it is also a “content management framework” (CMF). In other words, unlike a typ ...
- 2009-04-27 04:35
- 浏览 1704
- 评论(0)
看了大半天Drupal的文档,留个记号。
首先来看几个基于Drupal的站点:
中国一位网友使用Drupal做的:
http://www.geekg.com/
Drupal官网发布的:
http://www.rakemag.com/
来一个重磅的,奥巴马(白宫)的新网站Recovery.gov:
http://ww ...
ubuntu 8.10一直存在着杂音问题,看电影听歌都很不爽。
尝试过修改系统的音效设置(系统-首选项-音效),但是效果不理想。
后来看到一位仁兄的办法,其实很简单。
1、打开alsa高级设置,$:sudo alsamixer
2、按F5打开所有音轨;
3、左右方向键选择音轨,上下键调节音量,把每个出现红色的音量跳调节到绿色;
4、按ESC退出。
设置立即生效,不需要重启设备。
注:
关于ubuntu 8.10对声卡驱动的修改。
从8.10开始,ubuntu默认声卡驱动是pulseaudio,不是直接驱动声卡硬件,而是作为一个上层的中间件。由于pulseaudio毕竟是应用层 ...
- 2009-04-22 07:04
- 浏览 1042
- 评论(0)
由于项目需要改进关键词算法,在算法改进的可行方向_20090413
中提到了几个可能的改进意见,这里先就第三点做了一些实现。
实现目标
:区分出高频的关键词,同时解决低频词IDF值过高的影响。
实现依据
:高频词中,无意 ...
- 2009-04-19 05:08
- 浏览 1166
- 评论(0)
可能改进的方向和参数:
*1、不同频道
2、单词在文本中的位置
3、IDF趋势的改变(词语在不同频道的分布) 方差*当前值,取反
4、语义相关度
5、时间变化
- 2009-04-13 07:50
- 浏览 773
- 评论(0)
此方法参照网友Deidara
的博客文章完成。
系统 : ubuntu server 8.10
第一部分:虚拟用户设置
1。安装
$sudo apt-get install vsftp db4.6-util
2。建立虚拟用户使用目录
#sudo mkdir -p /home/ftp
设置只允许ftp 访问
$chown ftp.root /home/ft ...
<这几天把实验室的FTP服务器重新安装了一下,由于vsftpd是通过配置文件来管理的,将参数列表整理一下,以备将来查询>
#################用户登陆控制##############
#接受匿名用户
anonymous_enable=YES
#匿名用户login时不询问口 ...
- 2009-04-12 10:50
- 浏览 807
- 评论(0)
原来墨水也可以这么美
- 博客分类:
- 娱乐
这是一位老兄拍摄的墨水稀释过程,看后感觉很不错的。
ink_dance
for an artist called ‘aus’ (Released on Motteer, U.K)
- 2009-04-11 12:02
- 浏览 600
- 评论(0)
pygGTrends
为了自动得获取Google趋势搜索的结果,最初考虑国使用socket来实现,但是一直没法登录,——我是抓包之后完全模拟这个过程,很可惜这条路没走通。后来,在网上搜到一个Python的脚本文件,于是乎就开始鼓弄这些东西。
该脚本相关资料参考:
Programmatic Google Trends API
suryasev/unofficial-google-trends-api
Google趋势搜索说明文档
接下来,汇总一下这一天时间的一些收获,主要在代码上,——实实在在的只为项目,得到结果即可,不关注效率等。
第一阶段
:需要处理词语 ...
前几天转载了TF-IDF算法的思路(见:TF/IDF算法(转载)
),参照这一思路用JAVA实现了算法。——在这之前,我使用权重+词频(V-TF)的方法计算了文本的关键词。现在通过比较,来分析一下出现的一些问题。
总体来说,很遗憾的得 ...
- 2009-04-06 12:30
- 浏览 3843
- 评论(0)
~$ wget -t0 -c -nH -np -b -m -P /localdir hostname -o wget.log
参数解释参照man,可能有些差别
-t0 :=t inf设置重试次数,0和inf表示无限次,默认是20次;
-c :递归下载,wget -c http://…/file相当于wget http://…/file*,大致是这个意思,不是说wget支持通配符;
-nH :禁止建立前缀路径;
-np :递归时,避免回到父目录;
-b :在后台运行,——运行开始会给出PID,可以使用kill命令终止;
-m :开启镜像机制(Turn on options sui ...
- 2009-04-02 05:22
- 浏览 1186
- 评论(0)
—— 一直说TF-IDF,终于开始做真正的TF-IDF。
TF/IDF(term frequency/inverse document frequency) 的概念被公认为信息检索中最重要的发明。
一。TF/IDF描述单个term与特定document的相关性
TF(Term Frequency): 表示一个term与某个document的相关性 ...
- 2009-04-02 04:00
- 浏览 2116
- 评论(0)
昨天和周师兄等人一起聊了些本体和语义的话题。结合着我们目前在做的项目,考虑了一下构建新闻知识库的可行性,——从工程实现的角度。
首先说一下在新闻领域新闻关键词具有的一些特征:
第一:新闻的思路是比较清晰的,——我个人觉得,用特征值来描述比较恰当一点。一则新闻,可以分解为5W,什么人,什么时候,在什么地方,做了什么事,为了这么做 AND/OR 这样作会有什么影响。——如果能分析出相应的特征值,对比提取关键词算法会有更好的预期效果。
第二:新闻的频道相关性是很强的,这种相关性主要表现在两个方面,一方面,同一个关键词在不同的新闻领域有不同的意义;另一方面,不同的新闻频道关注的侧重点是 ...
- 2009-03-28 03:48
- 浏览 767
- 评论(0)
到目前为止,Google已经为iPhone,Android以及BlackBerry提供了语音搜索功能,语音搜索已经从逐步得从实验室进入了商业市场。
标记一下,IBM的语音识别 & Google的语音搜索。
- 2009-03-28 03:20
- 浏览 783
- 评论(1)