- 浏览: 135222 次
- 性别:
- 来自: 北京
最新评论
一、 一个文本文档有多行,每行为一个URL。请编写代码,统计出URL中的文档名及出现次数。
a) 文档名不包括域名、路径和URL参数,例如http://www.rs.com/n.op/q/rs?id=1中的文档名是rs。
b) 部分URL可能没有文档名,例如http://www.abc.com/,这类统计为“空文档名”。
c) 出现在不同URL中的相同文档名视为同一文档名,例如http://www.ceshi.com/hi.php
和ftp://ftp.cdef.com/hi.php为同一文档名
文档内容示例如下:
http://www.test.com/abc/de/fg.php?id=1&url=http://www.test.com/index.html
http://www.hello.com/cw/hi.jsp?k=8
http://www.hi.com/jk/l.html?id=1&s=a.html
http://www.rs.com/n.op/q/rs?id=1
二、 一个简单的论坛系统,以数据库储存如下数据:
用户名,email,主页,电话,联系地址,发帖标题,发帖内容,回复标题,回复内容。
每天论坛访问量300万左右,更新帖子10万左右。
请给出数据库表结构设计,并结合范式简要说明设计思路。
三、 现有两个文档,
a)数据文档A,格式为:关键词、IP地址、时间,记录条数为1000万左右,该文档是无序排列的。
b)数据文档B是关键词ID到关键词的对应表文档,格式为:ID、关键词,记录条数在100万左右,也是无序排列的。该对应表中的记录是一一对应的,不存在ID或关键词重复的情况。
需要将数据文档A对应的关键词替换为B中的ID,生成新的数据文档C,数据文档C的格式为:关键词ID、IP地址、时间。
请设计一个程式,实现上述功能,并分析时间复杂度和空间复杂度。运行程式所使用的服务器的内存为1G,硬盘足够大。(至少要给出关键算法和设计思路)
百度12-6试题.html
专家回答:
第一题简评 百度的主要业务是搜索,搜索的基本原理如下 1.编写爬虫程式到互连网上抓取网页海量的网页。 2.将抓取来的网页通过抽取,以一定的格式保存在能快速检索的文档系统中。 3.把用户输入的字符串进行拆分成关键字去文档系统中查询并返回结果。 由以上3点可见,字符串的分析,抽取在搜索引擎中的地位是何等重要。 因此,百度的笔试面试题中,出现这样的题就变得理所当然了。
转自:http://www.21ks.net/qzzpl/zpxx/lnzt/200808/49378.html
发表评论
-
Ubuntu 9.04中文件共享的设置
2009-09-01 11:36 1330在Ubuntu 9.04中,用新立德自动安装的方式安装了sam ... -
Java异常处理陋习
2009-08-11 13:51 827你觉得自己是一个Java专 ... -
JAVA程序员的好文章,程序迷途中的人来看
2009-08-11 13:47 883转自:http://hi.baidu.com/cf ... -
JSP避免Form重复提交的三种方案
2009-08-10 16:42 8751 javascript ,设置一个变量,只允许提交一 ... -
Java和JSP编程中应该注意的几个问题
2009-08-10 16:41 9101. 对应String类型的对 ... -
系统分析员、系统架构师、项目经理的区别
2009-08-10 09:41 1205转自:http://pm.csai.cn/mana ... -
LATEX使用之-字体颜色深浅不一
2009-03-13 16:31 5550今天用Ctex写论文,发现出来的pdf在屏幕上会出现字体颜色深 ... -
释放C盘空间的一种方法
2009-03-07 18:00 1047今天终于让C盘上可怜的500m的剩余空间变成了1G。 方法 ... -
T61 总蓝屏 错误代码为0X40000080
2009-03-06 21:30 3081这两天我的t61总是蓝屏,而且总是用的用的就速度巨慢。 今 ... -
windowXP 管理工具拒绝访问的解决方法
2009-03-06 21:25 2498我的电脑好一阵子都没有办法访问管理工具里的内容,除了ODBC。 ... -
数据库范式举例学习
2008-11-23 00:43 2698数据库太久没碰了,但笔试总是会碰上,没办法,现找些资料来学吧。 ... -
JAVA checkedException 与 uncheckedException
2008-11-22 23:35 2441今天笔试,遇到了一道题,问哪些exception是checke ... -
刚填完审协的在线职业测评
2008-10-23 16:18 2185刚刚填完审协的职业测评,分两部分,一部分是能力测试,和公务员的 ... -
SLB一面
2008-10-14 12:54 840刚从slb BGC的面试中回来 ... -
写申论的一点经验
2008-10-11 11:46 900避免《南周》化,着力《人报》化,总结一下给自己的几点警示: ... -
SLB活动日
2008-10-10 21:44 716刚从SLB活动日回来,人多啊………………,刚才系统死机,刚写的 ... -
面试官如何判断你是合适的人选(一位同事的review)
2008-10-10 16:10 2638http://forum.byr.edu.cn/wForum/ ... -
网申的惨痛经历
2008-10-06 22:45 804过了七天的悠闲时光,今天一开始就是惨痛的一盆凉水从头到脚。 ... -
求职箴言
2008-09-26 12:39 767求职,最重要的是研究这个行业的游戏规则。其中一个重要规则就是, ...
相关推荐
百度校园招聘在线笔试题及答案.docx百度校园招聘在线笔试题及答案.docx百度校园招聘在线笔试题及答案.docx百度校园招聘在线笔试题及答案.docx百度校园招聘在线笔试题及答案.docx百度校园招聘在线笔试题及答案.docx...
3. 百度笔试题汇总:这是一个集合了历年来百度笔试题目的文档,可能包含多届、多岗位的题目,有助于应聘者全面了解百度的出题风格和考察重点。 4. 百度2006,2007笔试题:这部分内容可能包含了百度在2006年和2007年...
百度历年java笔试面试150题 百度历年java笔试面试150题 百度历年java笔试面试150题 百度历年java笔试面试150题 百度历年java笔试面试150题 百度历年java笔试面试150题 百度历年java笔试面试150题 百度历年java笔试...
历年百度校园招聘笔试题目与面经
### 百度往年实习生笔试题目解析 #### 一、公交车站牌设计 **设计要点:** 1. **信息清晰易读:** 设计时需确保站牌上的信息(包括车次、路线、方向等)清晰易读。考虑到不同人群的需求(如老年人、视力不佳者)...
百度笔试题常常涉及到算法与数据结构的运用,如排序算法(快速排序、归并排序等)、查找算法(二分查找、哈希查找)以及常用的数据结构(链表、栈、队列、树、图)。这些基础知识是解决问题的基础,熟练掌握能提高...
百度校园招聘笔试面试题22个文档资料合集: 百度2010-2011年各部门招聘笔试题及面经总结.doc 百度2014校园招聘笔试试题-产品经理笔试题.doc 百度2014校园招聘笔试试题-北京站未知...百度笔试题面试题集总(总81页).docx
【百度技术招聘笔试题目】涉及的知识点主要集中在计算机科学的基础领域,包括算法、并发编程、内存管理、网络协议、数据结构以及程序设计等方面。以下是详细解释: 1. **排序算法**: - Shell排序是一种不稳定的...
### 百度技术类笔试知识点解析 #### 一、完成函数`size_t foo(unsigned int *a1, size_t al1, unsigned int *a2, size_t al2)` **题目描述**: - 函数接收两个无符号整数数组`a1`和`a2`及其对应的长度`al1`和`al2`...
【百度笔试题】涵盖的内容广泛,涉及编程、算法、系统设计等多个方面,下面将逐一解析这些题目中的知识点。 1. **编程题 - 字符串判断**: 这道题目要求编写一个函数来判断字符串b的所有字符是否都在字符串a中出现...
本篇将针对“百度校园招聘笔试题+Baidu必备”这一主题,详细解读历年的百度笔试题目,并提供备考策略,帮助即将参与百度笔试的同学们更好地准备。 首先,我们可以看到提供的压缩包文件包含了多个年份的百度笔试题目...
【标题】:“百度最全笔试题”所涵盖的IT知识点主要集中在Java编程语言上,这是一份集合了大量关于Java的面试与笔试问题的资源。Java作为广泛应用的面向对象编程语言,其知识点广泛且深入,涵盖了语法基础、数据结构...
很好的百度笔试题,想去百度的人可以做一下,预预热
### 百度笔试题知识点解析 #### 选择题解析 **1. 在以下选项中,哪一个不是编程语言?** A. Shell B. 鲢 C. 直译 D. 选 - **答案:B. 鲢** - **解析:**在给出的选项中,“鲢”并非一种编程语言。“Shell”是一种...
有txt格式的,有的是俺在网上搜的网页直接保存下来的。有的题目给出了参考答案,不过不一定正确。我当初笔试的是质量部的软开,笔试题附其中了,其余的更多是运维部的笔试题吧。
2010百度校园招聘笔试题,花了很多时间才找到的
百度校园招聘笔试面试题合集 深度学习、移动开发、系统研发、web前端
【百度笔试题】中的知识点主要涉及三个方面:编程题、算法题和系统设计。下面将分别对这三个方面进行详细的解析。 1. **编程题** 这道编程题要求编写一个函数`is_include(char *a, char *b)`,判断字符串`b`的所有...
从给定的百度公司笔试题中,我们可以提炼出多个IT领域的知识点,主要集中在数据结构、算法、编程语言特性以及操作系统原理上。以下是对这些知识点的详细解析: ### 数据结构与算法 1. **排序算法的特性**:题目...
首先,我们来看看百度笔试题目的常见类型。通常,这些题目包括但不限于: 1. **算法与数据结构**:这是程序员的基础,如排序算法(快速排序、归并排序、堆排序等)、查找算法(二分查找、哈希查找等)、树结构...