`
isiqi
  • 浏览: 16549399 次
  • 性别: Icon_minigender_1
  • 来自: 济南
社区版块
存档分类
最新评论

百度日文图片搜索面经

 
阅读更多
题外话,我服了QQ!什么内容不合法,你告诉我啊!我改还不行么??
英文都不准!!!
牢骚完毕,华丽分割线:


在朋友的帮助下,今天面百度 一共面了两面,第一个人面完,喊出另外一个工程师接着面。
面试三点开始。我去得比较早,就在大厅里面等了个把钟头,环境看上去不错。哈哈。具体后面说。

第一面, 一个哥哥,挺kind的。聊天知道貌似是浙大ACM的,而且还跟我们大组的一个博士gg是好朋友。
首先,自我介绍,稍微说了下。这里我觉得是每个人唯一可以准备得最好的了。说条理点,给人家一个立体印象会很好。然后就要“例行公事了”,开搞:
第一题 ,据说中的经典算法,数组a[len],找出其中最大的三个数。写程序,写个意思就行。
第二题 ,貌似搞算法的人都知道,应该也是据说中的经典题。有一个单向链表。对于单链表,链表尾部是NULL。突然有一天,某人没事把尾部的指针指向了链表中间的某个元素,这样就形成了一个网球拍状的链表,一个柄,然后前面一个圈。
问题1:如何遍历链表(可以重复访问)(hint:简单next访问的话,会死循环在圈里的哦,所以得想点办法)
问题2:如何确定柄和圈相接位置的元素是哪个?
第三题 ,开放题,关于图片搜索。
一个页面,例如http://esfang.house.sina.com.cn/n_news/news_show.php?id=20439这个link里面,有个图片。图片搜索的基本思想是候根据页面正文的内容来推测图片内容。这个页面中,除了正文上有文字,顶上、边上都有链接和广告,是与图片不相关的内容,需要过滤掉。如何过滤这些五官内容,提取正文?请说出你的思路。方法可以不拘一格,可以多种方法并用。我扯出了六七种,应该都还蛮靠谱。

OK,就这么多面试问题。我看了下表,刚好一个小时。这个gg喊了另外一个gg来接着面。

二面开始

还是先自我介绍,让随便讲讲。很快进入主题,开始做题:
第一题 : 100万行ip地址区间,已排序。给出一个ip地址,从100万行中找出该ip地址所属行。如果找不到,输出找不到即可。
已知,区间首尾两个ip的前三节的ip地址相等,只有最后一节不同。
例如:

127.0.0.3 ~ 127.0.0.6
127.0.0.16 ~ 127.0.0.49
.....
210.2.0.16 ~ 210.2.0.233
.....
上面每个区间前三节都等。
210.2.0.16 ~ 210.4.0.233这样的区间不合法,不回出现在给出的
数据中。
给出输入127.0.0.18,输出为127.0.0.16 ~ 127.0.0.49。

这个题目补充一句,最容易想到的算法就是二分查找了。可行。面试的人非得让我想出个更快的方法。没想出来,到最后结束的时候问了下他答案,也就是加快查找那些事,恩,你知道的。

第二题 ,你知道Cache替换算法有哪些嘛?你学过吗?
恩,我当然学过。blablabla
那么你能实现一个LRU Cache算法吗?
我走偏了。。。。。直接以为要实现一个硬件Cache LRU替换算法。。。太失误了。。。他一个搞软件的,关心硬件Cache干吗。。。
OK,软件LRU算法如何实现大家肯定都知道。
这个题目是他一个引子,后面开始才是重点。题目大意,百度贴吧这么多帖子,动不动还有“贾君鹏你妈喊你回家吃饭”的爆吧行为。如何设计一套存储系统以满足贴吧的需求。设计包括Cache、磁盘文件数据块的布局、结构、安排等等。总之,设计一个存储系统!我真有点汗。。。这个题目突然冒出来,挺不合适的吧。反正给我的感觉是太大了。
注,贴吧特征:
1、 老帖子一旦回复了,就跑到顶上了。玩bbs的同学都了解。
2、偶尔存在暴吧行为,如何抗住这种压力(这里指存储压力),如何保证这种帖子还能被正常阅读
3、很多用户只看贴吧头几页的帖子,所有针对这个特点应该可以做一些优化(Cache)。
OK,设计吧。。。反正这个题目把我搞得很不爽。我猜,他是揣着答案了,总希望我说的跟贴吧的设计相似:(

面完大概五点,说下周等消息。他直接撤了,一人在那,哈哈,正好可以乘机溜达一下百度。先电话我偶像,用她门卡到处溜了一圈,然后去百度健身房跑了半个小时的步,到了饭点,直接去百度地下食堂吃了顿饭,还凑合。OVER。
总结下,算法我有点卡,因为没有任何准备。我总觉得他们问的问题,《编程之美》上都涉及到了,并且比他们问的还深。所以,我决定开始好好看看《编程之美》了。 另外,他们都重复地问,能来实习么。不能。
------------------

Institute Of Comuting Technology,
Chinese AcademyofSciences.
Beijing, China

分享到:
评论

相关推荐

    谷歌百度搜狗日文输入法

    在这个压缩包文件中,包含了三款知名公司——谷歌、百度和搜狗开发的日文输入法。下面我们将详细探讨这些输入法的特点、功能以及它们在日文输入上的优势。 首先,让我们来看看谷歌日文输入法。谷歌是一家全球知名的...

    百度日文输入法 v3.5.2.36.zip

    【百度日文输入法 v3.5.2.36】是百度公司在日本推出的一款针对日语用户和学习者的输入法软件。这款输入法旨在提供高效、便捷的日语输入体验,特别适合那些需要频繁使用日语进行沟通或者学习的人群。 在功能特性上,...

    百度日文输入法在线安装

    百度日本在12月16日推出了日文输入法Baidu Type的Beta 1版,除了热门词库、词组预测这一类新一代输入法必备的功能之外,百度日文输入法还加入了国内已经非常流行的换肤功能,以及针对日本网民的使用习惯加入的颜文字...

    百度日文输入法

    百度日文输入法

    日文Shift_JIS码表

    总的来说,日文Shift_JIS码表是理解、处理和操作日文文本的基础工具,对于从事涉及日文内容的软件开发、数据处理和网络通信的IT专业人员来说,深入理解和使用这个码表至关重要。在实际工作中,我们需要根据具体需求...

    win7 8 10系统日文字库,可以为CAD正确识别日文

    然而,有些特定的应用程序,如CAD(Computer-Aided Design)软件,可能需要额外的日文字库来确保能够正确地显示和处理日文文本。 CAD软件主要用于工程设计、机械制图等领域,它需要精确地处理各种符号和文字。当CAD...

    百度ocr图片文字识别

    百度OCR作为业界领先的服务,其准确度高、识别速度快,支持多种语言,包括中文、英文、日文、韩文等。 百度OCR的核心功能主要包括以下几个方面: 1. 文字检测:识别图像中的文字区域,即使文字位于复杂背景中也能...

    BaiduType_Setup_Light_AA-百度IME日文输入法

    BaiduType_Setup_Light_AA 百度IME日文输入法,2012.8.31更新、

    pdf转图片支持日文韩文非常棒

    标题中的“pdf转图片支持日文韩文非常棒”表明这是一个关于将PDF文档转换为图像格式的工具或软件,而且特别强调它能有效处理包含日文和韩文的PDF文件。在描述中提到的“2个dll文件”,即itextsharp.dll和O2S....

    日文乱码解决利器

    标题中的“日文乱码解决利器”指的是针对中文系统下显示日文文本出现乱码问题的一种解决方案。在处理跨语言的计算机系统时,尤其是中文系统显示非中文字符集(如日文)时,由于编码不匹配,往往会出现乱码现象。这种...

    日文乱码转换工具

    【标题】"日文乱码转换工具"涉及的是在处理日语文本时可能出现的编码问题。乱码通常出现在计算机系统不支持或识别错误的字符编码格式时,导致文本无法正常显示。日文乱码尤其常见,因为日语使用了多种字符集,包括...

    ECSHOP日文语言包

    日文语言包是ECSHOP为了支持日本用户而特别设计的,使得在日本地区的用户能够更方便地使用该平台进行网上购物。这个"日文语言包"包含了所有ECSHOP系统中用到的界面文本、提示信息以及错误消息的日语翻译,确保了用户...

    DOS6.2 日文软盘镜像 6张盘

    标题中的“DOS6.2 日文软盘镜像 6张盘”指的是一个操作系统,即MS-DOS的6.2版本,这是微软在1991年发布的个人计算机操作系统。这个版本是DOS系列的一个重要里程碑,它包含了对FAT16文件系统的改进和支持,使得用户...

    WINRAR日文版 3.71

    WINRAR日文版 3.71 日文系统下蛮好用的。。

    PDF日文语言包

    PDF日文语言包

    WinRAR 日文版 解压

    - **查看预览**:在不解压的情况下预览文本文件、图片和其他支持的文件类型。 - **命令行模式**:对于高级用户,WinRAR还提供了命令行接口,便于自动化处理和脚本编写。 5. **优化和设置** 用户可以根据需要调整...

    日文简历模板 日文简历写作教程

    在撰写日文简历时,了解正确的格式和内容至关重要,这对于在日本找工作或申请学校至关重要。本教程将详述日文简历的制作过程,并提供两种不同风格的模板:中式风格和日式风格。 首先,我们来讨论日文简历的基本结构...

    日文全角半角转化

    "日文全角半角转化" 日文全角半角转换是指将日文中的全角字符转换为半角字符或将半角字符转换为全角字符的过程。在计算机编程中,日文全角半角转换是非常重要的一步,因为它可以确保日文字符的正确显示和处理。 在...

    IE8百度搜索乱码的解决办法

    在使用Internet Explorer 8(以下简称IE8)浏览器时,可能会遇到一个特定的问题:当在IE8中的“搜索提供程序”功能里添加“百度”作为快捷搜索选项后,如果用户在地址栏或搜索栏输入非英文字符(例如中文、日文等)...

    日文版的代码行数统计,只适用日文环境

    标题中的“日文版的代码行数统计”指的是一个专门针对日文编程环境设计的代码行统计工具。这种工具的主要功能是分析源代码文件,计算其中的代码行数,这对于软件开发过程中的代码质量管理、项目进度评估以及复杂度...

Global site tag (gtag.js) - Google Analytics