- 浏览: 1791252 次
- 性别:
- 来自: 北京
文章分类
最新评论
-
奔跑的小牛:
例子都打不开
如何使用JVisualVM进行性能分析 -
蜗牛coder:
好东西[color=blue][/color]
Lucene学习:全文检索的基本原理 -
lovesunweina:
不在haoop中是在linux系统中,映射IP的时候,不能使用 ...
java.io.IOException: Incomplete HDFS URI, no host -
evening_xxxy:
挺好的, 谢谢分享
如何利用 JConsole观察分析Java程序的运行,进行排错调优 -
di1984HIT:
学习了~~~
ant使用ssh和linux交互 如:上传文件
Google(www.Google.com),由两个斯坦福大学博士生Larry Page与Sergey
Brin于1998年9月发明,Google Inc.
于1999年创立。2000年7月份,Google替代Inktomi成为Yahoo公司的搜索引擎,98年至今,Google已经获得30多项业界大
奖。
搜索入门
第一次进入Google,它会根据你的操作系统,确定语言界面。需要提醒的是,Google是通过cookie来存储页面设定的,所以,如果你的系统
禁用cookie,就无法对Google界面进行个人设定了。
Google的首页很清爽,LOGO下面,排列了四大功能模块:网站、图像、新闻组和目录服务。默认是网站搜索。现在进行第一次搜索实践,假定你是个
搜索新手,想要了解一下搜索引擎的来龙去脉和搜索技巧。在搜索框内输入一个关键字“搜索引擎”,
选中“搜索中文(简体)网页”选项,然后点击下面的“Google搜索”按钮(或者直接回车),结果就出来了。
注意:文章中搜索语法外面的引号仅起引用作用,不能带入搜索栏内。
初阶搜索
上例中,单个关键字“搜索引擎”,搜索得的信息浩如烟海,而且绝大部分并不符合自己的要求,怎么办呢?我们需要进一步缩小搜索范围和结果。
1,搜索结果要求包含两个及两个以上关键字
一般搜索引擎需要在多个关键字之间加上“
”,而Google无需用明文的“
”来表示逻辑“与”操作,只要空格就可以了。现在,我们需要了解一下搜索引擎的历史,因此期望搜得的网页上有“搜索引擎”和“历史”两个关键字。
示例:搜索所有包含关键词“搜索引擎”和“历史”的中文网页
搜索:“搜索引擎 历史”
结果:已搜索有关搜索引擎 历史的中文(简体)网页。 共约有78,600项查询结果,这是第1-10项 。 搜索用时0.36秒。
用了两个关键字,查询结果已经从70多万项减少到7万多项。但查看一下搜索结果,发现前列的绝大部分结果还是不符合要求,大部分网页涉及的“历史”,
并不是我们所需要的“搜索引擎的历史”。
怎么办呢?删除与搜索引擎不相关的“历史”。我们发现,这部分无用的资讯,总是和“文化”这个词相关的,另外一些常见词是“中国历史”、“世界历史”、
“历史书籍”等。
2,搜索结果要求不包含某些特定信息
2.1,Google用减号“-”表示逻辑“非”操作。“A –B”表示搜索包含A但没有B的网页。
示例:搜索所有包含“搜索引擎”和“历史”但不含“文化”、“中国历史”和“世界历史”的中文网页
搜索:“搜索引擎
历史 -文化 -中国历史 -世界历史”
结果:已搜索有关搜索引擎 历史 -文化 -中国历史
-世界历史的中文(简体)网页。
示例:搜索所有包含“易筋经”而不含“吸星大法”的中文网页
搜索:“易筋经 -吸星大法”
结果:已搜索有关易筋经
-吸星大法的中文(简体)网页。共约有5,440项查询结果,这是第1-10项。搜索用时0.13秒。
注意:这里的“+”和“-”号,是英文字符,而不是中文字符的“+”和“-”。此外,操作符与作用的关键字之间,不能有空格。比如“易筋经 -
吸星大法”,搜索引擎将视为逻辑“与”操作,中间的“-”被忽略。
2.2,GOOGLE无需用明文的“+”来表示逻辑“与”操作,只要空格就可以了。
示例:搜索所有包含关键词“易筋经”和“吸星大法”的中文网页
搜索:“易筋经 吸星大法”
结果:已搜索有关易筋经 吸星大法的中文(简体)网页。共约有726项查询结果,这是第1-10项。搜索用时0.13秒。
注意:文章中搜索语法外面的引号仅起引用作用,不能带入搜索栏内。
注意:小写的“or”,在查询的时候将被忽略;这样上述的操作实际上变成了一次“与”查询。
“+”和“-”的作用有的时候是相同的,都是为了缩小搜索结果的范围,提高查询结果命中率。
例:查阅天龙八部具体是哪八部。
分析:如果光用“天龙八部”做关键字,搜索结果有26,500项,而且排前列的主要与金庸的小说《天龙八部》相关,很难找到所需要的资讯。可以用两个方法
减少无关结果。
1,如果你知道八部中的某一部,比如阿修罗,增加“阿修罗”关键字,搜索结果就只有995项,可以直接找到全部八部,“天龙八部 阿修罗”。
2,如果你不知道八部中的任何一部,但知道这与佛教相关,可以排除与金庸小说相关的记录,查询结果为1,010项,可以迅速找到需要的资料,“天龙八部
佛教 -金庸”。
注意:这里的“
”和“-”号,是英文字符,而不是中文字符的“+”和“-”。此外,操作符与作用的关键字之间,不能有空格
。比如“搜索引擎 -
文化”,搜索引擎将视为关键字为“搜索引擎”和“文化”的逻辑“与”操作,中间的“-”被忽略。
3,搜索结果至少包含多个关键字中的任意一个。
3.1,Google用大写的“OR”表示逻辑“或”操作
。搜索“A
OR
B”,意思就是说,搜索的网页中,要么有A,要么有B,要么同时有A和B。在上例中,我们希望搜索结果中最好含有“archie”、“lycos”、“蜘
蛛”等关键字中的一个或者几个,这样可以进一步的精简搜索结果。
示例:搜索如下网页,要求必须含有“搜索引擎”和“历史”,没有“文化”,可以含有以下关键字中人任何一个或者多个:“Archie”、“蜘蛛”、
“Lycos”、“Yahoo”。
搜索:“搜索引擎 历史 archie OR 蜘蛛 OR lycos OR
yahoo -文化”
结果:已搜索有关搜索引擎 历史 archie OR 蜘蛛 OR lycos OR yahoo
-文化的中文(简体)网页。 共约有8,400项查询结果,这是第1-10项 。 搜索用时0.16秒。
我们看到,搜索结果缩小到8千多项,前20项结果中,大部分都符合搜索要求。如果你想了解一下解搜索引擎的历史发展,就不妨研究一下现在搜索到的结果
吧。
注意:“与”操作必须用大写的“OR”,而不是小写的“or”。
在上面的例子中,我介绍了搜索引擎最基本的语法“与”“非”和“或”,这三种搜索语法Google分别用“
”(空格)、“-”和“OR”表示。顺着上例的思路,你也可以了解到如何缩小搜索范围,迅速找到目的资讯的一般方法:目标信息一定含有的关键字(用“
”连起来),目标信息不能含有的关键字(用“-”去掉),目标信息可能含有的关键字(用“OR”连起来)。
3.2,关键词的选择在搜索中起到决定性的作用,所有搜索技巧中,关键词选择是最基本也是最有效的。
例一:查找《镜花缘》一书中淑士国酒保的酸话原文。
分析:如果按照一般的思路,找某部小说中的具体段落,就需要用搜索引擎先找到这本书,然后再翻到该段落。这样做当然可以,但是效率很低。如果了解目标信息
的构成,用一些目标信息所特有的字词,可以非常迅速的查到所需要的资料。也就是说,高效率的搜索关键字不一定就是目标信息的主题。在上面的例子中,酒保谈
到酒的浓淡与贵贱的关系时,之乎者也横飞。因此,可以用特定的词语一下子找到目标资料。
搜索:“酒 贵 贱
之”,OK,找到的第一条信息就是镜花缘的这一段落:“先生听者:今以酒醋论之,酒价贱之,醋价贵之。因何贱之?为甚贵之?真所分之,在其味之。酒昧淡
之,故而贱之;醋味厚之,所以贵之。...”
以上的关键字选择技巧可以谓之“特定词法”。
例二:“黄花闺女”一词中“黄花”是什么意思。
分析:“黄花闺女”是一个约定的俗语,如果只用“黄花闺女
黄花”做关键词,搜索结果将浩如烟海,没什么价值,因此必须要加更多的关键词,约束搜索结果。选择什么关键词好呢?备选的有“意思”、“含义”、“来
历”、“由来”、“典故”、“出典”、“渊源”等,可以猜到的是,类似的资料,应该包含在一些民俗介绍性的文字里,所以用诸如“来历”、“由来”、“出
典”等词汇的概率更高一些。
搜索:“黄花闺女 黄花
由来”,查到“黄花”原来出典于《太平御览》,与南朝的寿阳公主相关。如果想获得第一手资料,那就可以用“太平御览 寿阳公主”做搜索了。
以上的关键字选择技巧可以谓之“近义词法”。
例三:刘德华同志的胸围是多少。
分析:首先声明,这是某个MM要我做的搜索,我把它作为搜索案例而已,没其他的意思。非常直接的搜索是,“刘德华
胸围”,但事实上,这么搜索出来的结果,尽是一些诸如“刘德华取笑莫文蔚胸围太小”之类的八卦新闻,无法快速得到所需要的资料。可以想到的是,需要的资料
应该包含在刘德华的全面介绍性文字中,除了胸围,应该还包括他的身高,体重,生日等一系列相关信息。OK,这样就可以进一步的增加其他约束性关键词以缩小
搜索范围。
搜索:“刘德华 胸围
身高”,没有料到的情况发生了,网上炙手可热的痞子蔡《第一次亲密接触》里居然含有这样关键字,阿泰“改编自刘德华《忘情水》的变态歪歌”、“用身高体重
三围和生日来加以编号”。好办,把这部小说去掉,“刘德华 胸围 身高
-阿泰”,OK,结果出来了,华仔胸围84cm。说明一下,为什么用“阿泰”而不用“第一次亲密接触”呢?这是因为小说的名字被转载的时候可能有变动,但
里面角色的名字是不会变的。
以上的关键字选择技巧可以谓之“相关词法”。
3.3,其他常用搜索个案
例一:找人
分析:一个人在网上揭示的资料通常有:姓名,网名,性别,年龄,毕业学校,工作单位,外号,住址,电话,信箱,BP,手机号码,ICQ号,OICQ号等
等。所以,如果你要了解一下你多年没见过的同学,那不妨用上述信息做关键字进行查询,也许会有大的收获。
例二:找软件
分析一:最简单的搜索当然就是直接以软件名称以及版本号为关键字查询。但是,仅仅有软件名称和目标网站,显然还不行,因为搜索到的可能是软件的相关新闻。
应该再增加一个关键字。考虑到下载页面上常有“点击此处下载”或者“download”的提示语,因此,可以增加“下载”或者“download”为关键
字。
搜索:“winzip 8.0 下载”
结果:已搜索有关winzip 8.0
下载的中文(简体)网页。共约有6,670项查询结果,这是第1-10项。搜索用时0.22秒。
分析二:很多网站设有专门的下载目录,而且就命名为“download”,因此,可以用INURL语法直接搜索这些下载目录。
搜索:“winzip 8.0 inurl:download”
结果:已搜索有关winzip 8.0
inurl:download的中文(简体)网页。共约有358项查询结果,这是第1-10项。搜索用时0.44秒。
在互联网上随意的下载软件是不安全的,因为供下载的软件有可能带有病毒或者捆绑了木马,所以,对下载网站作一个限定,是一个稳妥的思路。可以用SITE语
法达到这个目的。
共享软件下载完之后,使用的时候,软件总跳出警示框,或者软件的功能受到一定限制。由于中国的网民多是穷棒子,所以应该再找一个注册码。找注册码,除了软
件的名称和版本号外,还需要有诸如“serial number”、“sn”、“序列号”等关键字。现在,来搜索一下winzip8.0的注册码。
搜索:“winzip 8.0 sn”
结果:已向英特网搜索winzip 8.0 sn.
共约有777项查询结果,这是第1-10项。搜索用时0.30秒。
例三:找图片
除了GOOGLE提供的专门图片搜索功能,还可以组合使用一些搜索语法,达到图片搜索之目的。
分析一:专门的图片集合,提供图片的网站通常会把图片放在某个专门目录下,如“gallary”、“album”、“photo”、“image”等。这
样就可以使用INURL语法迅速找到这类目录。现在,试着找找小甜甜布兰妮的照片集。
搜索:“"britney spears"
inurl:photo”
结果:已向英特网搜索"britney spears" inurl:photo.
共约有2,720项查询结果,这是第1-10项。搜索用时0.23秒。
分析二:提供图片集合的网页,在标题栏内通常会注明,这是谁谁的图片集合。于是就可以用INTITLE语法找到这类网页。
搜索:“intitle:"britney spears" picture”
结果:已向英特网搜索intitle:"britney spears" picture.
共约有317项查询结果,这是第1-10项。搜索用时0.40秒。
分析三:明星的FANS通常会申请免费个人主页来存放他们偶像的靓照。于是用SITE语法指定某免费主页提供站点,是个迅速找到图片的好办法。
搜索:“"britney spears" site:geocities.com”
结果:已在geocities.com内搜索有关"britney
spears"的网页。共约有5,020项查询结果,这是第1-10项。搜索用时0.47秒。
例四:找MP3
分析一:提供MP3的网站,通常会建立一个叫做MP3的目录,目录底下分门别类的存放各种MP3乐曲。所以,可以用INURL语法迅速找到这类目录。现在
用这个办法找找老歌“say you say me”。
搜索:“"say you say me" inurl:mp3”
结果:已向英特网搜索inurl:mp3 "say you say me". 共约有155项查询结果,这是第1-10项。搜索用时0.17秒。
分析二:也可以通过网页标题,找到这类提供MP3的网页。
搜索:“"say you say me"
intitle:mp3”
结果:已向英特网搜索"say you say me" intitle:mp3.
共约有178项查询结果,这是第1-10项。搜索用时0.73秒。
当然,如果你知道某个网站的下载速度快,而且乐曲全,就可以用SITE语法先到该网站上看看有没有目标乐曲。
例五:找书
分析一:对我而言,常访问的电子图书馆类网站就那么几个,比如文艺类的“www.shuku.net”。于是可以用SITE语法很简单的找到某本书(如果
该网站上有的话)。比如,“旧唐书
site:shuku.net”,就可以马上找到该书。如果没有,通常别的网站上也很难找到。因此,找书的关键,是你了解一大批著名的图书馆网站。
分析二:我上面介绍的第一项关键字选择技巧特定词法,对于迅速找到某书或者文章也是极其有用的,当然,这得建立在你已经读过该书,对书的内容有印象的基础
上。比如如果了解堂吉诃德一书战风车的大致内容,就可以用“吉诃德 风车 桑乔”迅速找到该书。
4,杂项语法
4.1,通配符问题
很多搜索引擎支持通配符号,如“*”代表一连串字符,“?”代表单个字符等。Google对通配符支持有限。它目前只可以用“*”来替代单个字符,而
且包含“*”必须用""引起来。比如,“"以*治国"”,表示搜索第一个为“以”,末两个为“治国”的四字短语,中间的“*”可以为任何字符。
4.2,关键字的字母大小写
Google对英文字符大小写不敏感,“GOD”和“god”搜索的结果是一样的。
4.3,搜索整个短语或者句子
Google的关键字可以是单词(中间没有空格),也可以是短语(中间有空格)。但是,用短语做关键字,必须加英文引号,否则空格会被当作“与”操作
符。
示例:搜索关于第一次世界大战的英文信息。
搜索:“"world war I"”
结果:已向英特网搜索"world war i". 共约有937,000项查询结果,这是第1-10项 。 搜索用时0.06秒。
4.4,搜索引擎忽略的字符以及强制搜索
Google对一些网路上出现频率极高的英文单词,如“i”、“com”、“www”等,以及一些符号如“*”、“.”等,作忽略处理。
示例:搜索关于www起源的一些历史资料。
搜索:“www的历史 internet”
结果:以下的字词因为使用过于频繁,没有被列入搜索范围: www 的. 已搜索有关www的历史 internet的中文(简体)网页。
共约有75,100项查询结果,这是第1-10项 。 搜索用时0.22秒。
我们看到,搜索“www的历史
internet”,但搜索引擎把“www”和“的”都省略了。于是上述搜索只搜索了“历史”和“internet”。这显然不符合要求。这里我顺便说一
点搜索引擎分词的知识。当我们在搜索“www的历史”的时候,搜索引擎实际上把这个短语分成三部分,“www”、“的”和“历史”分别来检索,这就是搜索
引擎的分词。所以尽管你输入了连续的“www的历史”,但搜索引擎还是把这个短语当成三个关键字分别检索。
如果要对忽略的关键字进行强制搜索,则需要在该关键字前加上明文的“+”号。
搜索:“+www +的历史
internet”
结果:已搜索有关+www +的历史 internet的中文(简体)网页。
共约有25,000项查询结果,这是第1-10项 。 搜索用时0.05秒。
另一个强制搜索的方法是把上述的关键字用英文双引号引起来。在上例“”world war
I””中,“I”其实也是忽略词,但因为被英文双引号引起来,搜索引擎就强制搜索这一特定短语。
搜索:“"www的历史"
internet”
结果:已搜索有关"www的历史" internet的中文(简体)网页。 共约有7项查询结果,这是第1-6项
。 搜索用时0.26秒。
我们看到,这一搜索事实上把“www的历史”作为完整的一个关键字。显然,包含这样一个特定短语的网页并不是很多,不过,每一项都很符合要求。
注意:大部分常用英文符号(如问号,句号,逗号等)无法成为搜索关键字,加强制也不行。
5,Google的高级搜索查询语法
上面已经探讨了Google的一些最基础搜索语法。通常而言,这些简单的搜索语法已经能解决绝大部分问题了。不过,如果想更迅速更贴切找到需要的信
息,你还需要了解更多的东西。
[intitle:]
“intitle:”帮助Google将搜索结果限制在那些标题中含有检索单词的页面。例如,“intitle:login
password”(不包括引号)将返回标题中有单词“login”,页面中任何地方有单词“password”的那些页面的链接。
类似的,如果想在网页的标题中检索多个单词,可以用“allintitle”来代替“intitle”得到标题中包含所有这些单词的网页列表。例如使用
“intitle:login intitle:password”跟使用“allintitle:login password”是一样的。
[inurl:]
“inurl:”
将搜索结果限制在那些URL中含有检索单词的页面。例如:“inurl:passwd”(不包括引号)将返回URL中有“passwd”的那些页面的链
接。
类似的,如果想在URL中检索多个单词,可以用“allinurl”来代替“inurl”得到URL中包含所有检索单词的网页列表。例如
“allinurl:etc/passwd”会查找URL中包含“etc”和“passwd”的页面。单词之间的“/”会被Google忽略掉。
[site:]
“site:” 将限制Google只在特定的站点或域中检索关键词。例如:“exploits
site:hackingspirits.com”(不包括引号)将在所有“hackingspirits.com”域的链接页面中查找关键词
“exploits”。“site:”和“hackingspirits.com”之间不应有空格。
[filetype:]
“filetype:”
将限制Google只在internet上搜索特定扩展名的文件(就是doc,pdf或者ppt等等)。例如:“filetype:doc
site:gov
confidential”(不包括引号)将在所有政府域相关的网站中查找页面中或“.doc”文件中包含关键词“confidential”的扩展名为
“.doc”的文件。也就是结果会包含到所有政府网站中有confidential关键词的文档的链接。
[link:]
“link:”
将显示有到指定网页的链接的网页。例如:“link:www.securityfocus.com”会列出有到SecurityFocus的链接的网页。
注意“link:”和网页url之间不应有空格。
[related:]
“related:”
将显示跟指定网页类似的网页。例如:“related:www.securityfocus.com”会列出跟SecurityFocus主页类似的网
页。注意“related:”和网页url之间不应有空格。
[cache:]
“cache:”
将显示在Google cache中的网页。例如:“cache:www.hackingspirits.com”会列出Google
cache中hackingspirits的主页。注意“cache:”和网页url之间不应有空格。
如果查询串中包含其它词,Google会在cache的文档中高亮显示这些词。例
如: “cache:www.hackingspirits.com guest”会显示在cache中的网页内容,并高亮显示“guest”。
[intext:]
“intext:”
会在特定的网站中搜索单词。它忽略links或URL和页面标题。例如:“intext:exploits”(不包括引号)将只返回页面中含有搜索关键词
“exploits”的网页链接。
[phonebook:]
“phonebook:”
会搜索美国街道地址和电话号码信息。例如:“phonebook:Lisa+CA”会列出所有名字中有“Lisa”并且住在“加利福尼亚(CA)”的人的
名字。这对那些想要挖掘个人信息的黑客来说是再好不过的工具了。
6,其他重要功能
目录服务
如果不想搜索网页,而是想寻找某些专题网站,可以访问GOOGLE的分类目录 “http://directory.google.com/”,中
文目录是 “http://directory.google.com/Top/World/Chinese_Simplified/”。不过由于
GOOGLE的目录由志愿者服务,而GOOGLE在国内名气相对比较小,因此中文目录下收录站点很少。
工具条
为了方便搜索者,GOOGLE提供了工具条,集成于浏览器中,用户无需打开GOOGLE主页就可以在工具条内输入关键字进行搜索。此外,工具条还提供了其
他许多功能,如显示页面PageRank等。最方便的一点在于用户可以快捷的在GOOGLE主页、目录服务、新闻组搜索、高级搜索和搜索设定之间切换。欲
安装GOOGLE的工具条,可以访问“http://toolbar.google.com/”,按页面提示可以自动下载并安装。
新闻组(USENET)搜索
新闻组中有大量的有价值信息,DEJA一直是新闻组搜索引擎中的佼佼者。2001年2月份,GOOGLE将DEJA收购并提供了所有DEJA的功能。现
在,除了搜索之外,GOOGLE还支持新闻组的WEB方式浏览和张贴功能。
输入“http://groups.google.com/”后,便进入GOOGLE新闻组界面。可惜现在还没有中文界面。因为新闻组中的帖子实在是多,
所以我点击“Advaced Groups
Search”进入高级搜索界面http://groups.google.com/advanced_group_search。新闻组高级搜索界面提
供对关键字、新闻组、主题、作者、帖子序号、语言和发布日期的条件搜索。其中作者项指作者发帖所用的唯一识别号电子信箱。比如要在
alt.chinese.text内搜索著名老牌网络写手图雅的帖子,可以用下列指令“group:alt.chinese.text
author:tuya@ccmail.uoregon.edu”。不过一般而言,我更推荐使用图形搜索界面,方便而且直观。
搜索结果翻译
曾经为那些你不懂的法文、西班牙文页面烦恼么?现在,GOOGLE支持一项搜索结果翻译功能,可以把非英文的搜索结果翻译成英文!!虽然目前只支持有限的
拉丁语、法语、西班牙语、德语和葡萄牙文,但是我不得不承认,这是个伟大的改进。
不过,目前只能在英文状态GOOGLE下实现这个功能。进入GOOGLE的设置页面, http://www.google.com
/preferences,有一个“BETA: Enable translation of search results into
your interface language. ”的选项,把它选中,就OK了。
搜索结果过滤
网络上的成人内容浩如烟海,而且很多站点具有欺骗或者其他不良企图,浏览者很容易掉入其中的陷阱。为此,GOOGLE新设立了成人内容过滤功能,见
GOOGLE的设置页面,http://www.google.com/preferences,最底下有一个选项SafeSearch
Filtering。不过,中文状态下的GOOGLE尚没有这个功能。
PDF文档搜索
我对GOOGLE尤其欣赏的一点就是它提供对PDF文档内文的检索。目前GOOGLE检索的PDF文档大约有2500万左右。这真是太美妙了。PDF是
ADOBE公司开发的电子文档格式,现在已经成为互联网的电子化出版标准。PDF文档通常是一些图文并茂的综合性文档,提供的资讯一般比较集中全面。
示例:搜索关于电子商务(ECOMMERCE)的PDF文档。
搜索:“inurl:pdf ecommerce”
结果:已向英特网搜索inurl:pdf ecommerce. 共约有19,200项查询结果,这是第1-10项。搜索用时0.11秒。
下面是某项搜索结果:
[PDF] www.usi.net/pdf/outsoucing-ecommerce.pdf
Outsourcing Electronic Commerce Business Case White Paper By: John P.
Sahlin, Product
Marketing Professonial (PMP) Implementation
Manager, Web Engineering ...
一般文字档 - 类似网页
可以看到,GOOGLE在PDF档前加上了[PDF]的标记,而且,GOOGLE把PDF文件转换成了文字档,点击“一般文字档”,可以粗略的查看该
PDF文档的大致内容。当然,PDF原有的图片以及格式是没有了。
图像文档搜索
GOOGLE提供了Internet上图像文件的搜索功能!!目前该功能尚在B测试阶段,但已经非常好用。访问地址是
“images.google.com”。你可以在关键字栏位内输入描述图像内容的关键字,如“britney
spears”,也可以输入描述图像质量或者其他属性的关键字,如“high quality”。
GOOGLE给出的搜索结果具有一个直观的缩略图(THUMBNAIL),以及对该缩略图的简单描述,如图像文件名称,以及大小等。点击缩略图,页面分成
两祯,上祯是图像之缩略图,以及页面链接,而下祯,则是该图像所处的页面。屏幕右上角有一个“Remove
Frame”的按钮,可以把框架页面迅速切换到单祯的结果页面,非常方便。GOOGLE还提供了对成人内容图像的限制功能,可以让搜索者免受不必要的骚
扰。
不过,非常遗憾的是,图像搜索功能还不支持中文。
7.Google黑客揭秘
上面所说的Google查询语法能真正帮助人们来精确他们的搜索结果,得到他们真正想要的。
现在Google如此智能,黑客们当然不会介意利用它从互联网上来挖掘更多本来不应该让他们知道的保密和隐私的信息。现在我将要详细讨论这些技术,展示黑
客们是如何利用Google从网上挖掘信息的,以及如何利用这些信息来入侵远程服务器。
利用“index
of”与发来查找开放目录浏览的站点
一个开放了目录浏览的WEB服务器意味着任何人都可以像浏览通常的本地目录一样浏览它上面的目录。这里我将讨论如何利用“index
of”语法来得到开放目录浏览的WEB服务器列表。这对黑客来说是一种非常简单的信息搜集方法。试想如果得到了本不应该在internet上可见的密码文
件或其它敏感文件,结果会怎样。下面给出了一些能轻松得到敏感信息的例子。
Index of /admin
Index of /passwd
Index of /password
Index of /mail
"Index of /" +passwd
"Index of /" +password.txt
"Index of /"
+.htaccess
"Index of /secret"
"Index of /confidential"
"Index of /root"
"Index of /cgi-bin"
"Index of /credit-card"
"Index of /logs"
"Index of /config"
利用“inurl”或“allinurl”寻找缺陷站点或服务器
a.利用“allinurl:winnt/system32/”(不包括引号)会列出所有通过web可以访问限制目录如“system32”的服务器的链
接。如果你很幸运你就可以访问到“system32”目录中的cmd.exe。一旦你能够访问“cmd.exe”,就可以执行它,瞧!服务器归你所有了。
b.利用“allinurl:wwwboard/passwd.txt”(不包括引号)会列出所有存在“WWWBoard
密码缺陷”的服务器的链接。想了解更多关于这个缺陷的知识,你可以参看下面的链接:http://www.securiteam.com
/exploits/2BUQ4S0SAW.html
c.利用“inurl:bash_history”(不包括引号)会列出所有通过web可以访问“.bash_history”文件的服务器的链接。这是
一个历史命令文件。这个文件包含了管理员执行的命令列表,有时还包含敏感信息例如管理员输入的密码。如果这个文件被泄漏并且包含加密的unix密码,就可
以用“John The Ripper”来破解它。
d.利用“inurl:config.txt”(不包括引号)会列出所有通过web可以访问
“config.txt”文件的服务器的链接。这个文件包含敏感信息,包括管理员密码的哈希值和数据库认证凭证。例如:Ingenium
Learning Management
System是一个由Click2learn,Inc开发的基于Web的Windows应用程序。Ingenium Learning
Management
System5.1和6.1版本以非安全的方式在config.txt文件中存储了敏感信息。更多相关内容请参
看:http://www.securiteam.com/securitynews/6M00H2K5PG.html
其它类似的组合其它语法的“inurl:”或“allinurl:”用法:
inurl:admin filetype:txt
inurl:admin filetype:db
inurl:admin filetype:cfg
inurl:mysql
filetype:cfg
inurl:passwd filetype:txt
inurl:iisadmin
inurl:auth_user_file.txt
inurl:orders.txt
inurl:"wwwroot/*."
inurl:adpassword.txt
inurl:webeditor.php
inurl:file_upload.php
inurl:gov filetype:xls "restricted"
index of ftp +.mdb allinurl:/cgi-bin/ +mailto
利用“intitle”或“allintitle”寻找缺陷站点或服务器
a.
利用[allintitle:“index of
/root”](不包括括号)会列出所有通过web可以访问限制目录如“root”的服务器的链接。这个目录有时包含可通过简单Web查询得到的敏感信
息。
b. 利用[allintitle:“index of
/admin”](不包括括号)会列出所有开放如“admin”目录浏览权限的WEB站点列表链接。大多数Web应用程序通常使用“admin”来存储管
理凭证。这个目录有时包含可通过简单Web查询得到的敏感信息。
其它类似的组合其它语法的“intitle:”或“allintitle:”用法:
intitle:"Index of"
.sh_history
intitle:"Index of" .bash_history
intitle:"index
of" passwd
intitle:"index of" people.lst
intitle:"index of"
pwd.db
intitle:"index of" etc/shadow
intitle:"index of" spwd
intitle:"index of" master.passwd
intitle:"index of" htpasswd
intitle:"index of" members OR accounts
intitle:"index of"
user_carts OR user_cart
allintitle: sensitive filetype:doc
allintitle: restricted filetype :mail
allintitle: restricted
filetype:doc site:gov
其它搜索串
查找有跨站脚本漏洞(XSS)的站点:
allinurl:/script_s/cart32.exe
allinurl:/CuteNews/show_archives.php
allinurl:/phpinfo.php
查找有SQL注入漏洞的站点:
allinurl:/privmsg.php
发表评论
-
推荐:天下没有免费的午餐
2012-03-21 16:10 31371、今天发现一 ... -
言吾
2010-07-19 11:08 14741.不要怕被别人利用,人家利用你说明你还有用. 2.做人有三 ... -
江民科技创始人王江民因病去世,老前辈一路走好!
2010-04-05 23:02 84新民网: http://news.xinmin.cn/r ... -
影响个人创业成功的“5商”
2010-03-15 10:09 13871、情商(EQ)——五行 ... -
上班族适用的13个健康小妙招
2010-03-09 08:13 1869忙碌的上班生活就没时间做运动吗?其实,忙里偷闲,小小的运动也能 ... -
晒晒春节回家都带什么书
2010-02-04 13:37 2293春节要到了,回去一搞就半个月,不知道大家都会带什么书呢? 时刻 ... -
CMD命令收集
2010-02-03 09:55 1404一,ping 它 ... -
2010 北京源发 车票销售时间以及各位的购票情况
2010-02-02 09:45 1712我很迷茫,昨天到有人发博客: 买票记 说是下午三点 ... -
dos命令xcopy复制文件夹以及子文件夹
2010-02-02 09:27 7946xcopy Y:\000 F:\data2-4\000 /E ... -
如何做一个好的技术型领导
2009-12-18 16:09 1530对于程序员来说,大部分公司都提供了多条职业发展 ... -
Windows切换IP网关脚本
2009-12-16 18:16 4169方便生活,来个备份手册:Windows切换IP和网关的脚本 ... -
突然发现JE的博客改版了,我很激动
2009-12-08 11:05 1544突然发现JE的博客改版了,我很激动! 多的不说,就是觉 ... -
叫我如何放弃JAVA工程师的道路
2009-11-19 12:40 3512此事说来话长,提纲挈 ... -
5800与PC同步Google日历行程
2009-08-06 10:17 4831完全利用5800内置的软件,而且除了同步所需的网络流量 ... -
WindowsServer2003开启声音
2009-08-01 12:29 3736由于长时间开机不关,近来使用WindowsServer2003 ... -
预防流感漱饮方
2009-07-02 10:21 1501北京市中医管理局流感防控专家委员会,根据本次甲型 ...
相关推荐
除了基本的“site:”用法,还有几个相关的高级搜索技巧可以结合使用,以提高搜索效率: 1. **排除特定站点**:如果你不希望某个网站的页面出现在搜索结果中,可以使用“-site:”操作符。比如,“量子计算 -site:...
- 这一功能可以提高搜索效率,让用户能够更快地找到所需的信息。 3. **排除特定文件**: - 用户可以根据需要排除某些不希望被索引的文件或文件夹。例如,临时文件、日志文件等。 - 这些文件通常位于以下路径:`C...
谷歌桌面搜索(Google Desktop Search)是谷歌公司推出的一款桌面搜索工具,它允许用户在个人计算机上快速便捷地搜索本地文件、电子邮件、聊天记录、网页浏览历史等信息,如同使用谷歌搜索引擎一般。这款工具极大地...
总的来说,“搜索链接集合”是一个旨在提高搜索效率和用户体验的实用工具,通过整合多个知名搜索引擎,让用户在无广告的环境中快速获取信息,满足多样化的需求。无论是在学术研究、工作查询还是日常生活中的信息获取...
为了提高搜索效率,Google搜索提供了很多高级搜索技巧,例如使用引号进行精确匹配搜索、使用“-”排除不需要的关键词、使用“site:”来限定搜索的网站范围等。掌握了这些技巧,你就可以更加精确地搜索到想要的资料。...
### 编辑如何使用SEO提高工作效率 在当前的互联网时代,搜索引擎优化(SEO)成为了提升网站可见度、吸引流量以及增强用户体验的关键手段之一。对于编辑而言,掌握并运用SEO技术不仅可以帮助他们提升文章的曝光率,...
这两种桌面搜索工具都是为了提高用户的搜索效率,让用户无需在海量的文件夹和文档中手动寻找,只需输入关键词即可定位到所需内容。 ### 百度桌面搜索 百度桌面搜索是百度公司推出的一款免费的本地搜索软件。它具有...
2. 拼写检查:谷歌会自动识别并纠正拼写错误,但确保输入正确拼写可提高搜索准确性。 3. 使用引号:“”可以将多个词作为一个短语进行精确匹配,例如,“使用谷歌搜索攻略”。 二、高级搜索技巧 1. 排除关键词:...
3. **高级搜索技巧**:学习如何有效地使用Google搜索,包括使用引号、减号、加号、site:、filetype:等语法来提高搜索效率。 4. **搜索引擎优化(SEO)**:理解如何通过优化网站内容和结构,以提高其在Google搜索...
标题《强力推荐GOOGLE搜索引擎使用技巧》提到的是如何利用各种搜索方法和技巧来提高使用Google搜索引擎的效率。Google搜索引擎是互联网上最常用的工具之一,它提供的高级搜索功能可以帮助用户更快更准确地找到所需...
通过上述详尽的介绍,我们可以看出,合理利用Google搜索语法不仅能够提高搜索效率,还能让我们更快捷地找到所需的信息。无论是学术研究还是日常工作,掌握这些高级搜索技巧都将极大地提升我们的工作效率。希望本文的...
- **同步搜索**:在用户输入关键词时,同时向多个搜索引擎发送请求,获取并展示多个引擎的搜索结果,提高用户的查询效率。 文件名“search.html”可能是一个HTML页面,展示了如何使用这些搜索引擎的API或者通过HTTP...
4. **组合使用多个技巧**:为了提高搜索效率,可以同时使用多种技巧。例如,如果你想找到一个包含特定特殊符号且来自某个网站的页面,可以结合使用转义字符、引号以及`site:`等关键字。 #### 示例详解 假设我们要...
这种技术的关键在于平衡索引速度、资源占用和搜索效率。 "百度搜索"和"谷歌搜索"是中国和全球最知名的网络搜索引擎。虽然两者主要应用于在线搜索,但它们的一些核心技术,如信息检索、自然语言处理和用户行为分析,...
掌握这些谷歌搜索技巧,不仅能够提高搜索效率,还能帮助用户在海量信息中快速定位到他们真正需要的内容,对于日常工作和学习都极其有益。通过深入理解并灵活运用这些功能,你可以在互联网的海洋中成为一名高效的搜索...
这种代码主要由JavaScript、AJAX(异步JavaScript和XML)和可能的JSON(JavaScript Object Notation)数据格式组成,它们协同工作,提供动态的搜索建议,以提高用户的搜索效率。 【描述】:“2014最新百度GOOGLE...
10. **持续监控和改进**:使用工具如Google Search Console和Google Analytics跟踪性能,定期调整策略以适应搜索引擎算法变化。 综上所述,提高网页效率和进行SEO优化涉及多个层面,涵盖了从技术优化到内容策略的...