几乎是从进大学的时候开始,一直对于大学的教育觉得不满意,不只是我一个人,好像全国的大学生都在叫嚣着高等教育的垃圾,叫嚣着大学什么都学不到。
几个月前由于工作要求,用lucene写了一点东西,很简单的一个全文搜索。由于这个缘故,老大安排了一个给其他员工介绍一下lucene的内容。要介绍一个组件比使用一个组件难多了,至少,要介绍他必须 把那些主要的东西全部弄明白,否则其他人问起来 回答不出 脸丢大了。
打开源码,阅读注释,按照一个个的package 研究功能用法,看到好多东西觉得那么的熟悉:
这个不是编译原理词法分析的概念嘛,那个不是离散数学的理论嘛!
不知不觉,发现原来在叫嚣大学垃圾的同时,也在大学里面吸收了好多的东西。
以前也想过,如果不念大学 用四年时间自己学习编程是不是现在会更好,虽然这个只是WhatIf了,我相信很多人可能也都这么想。现在才知道有没有上过大学还是有本质区别的。是的计算机需要数学,但是自己学习往往会忽略数学忽略基础学科,学校“逼迫”学生学习这些东西,如果学生去学习始终是有好处的,就像我不认真学习的人都能树立了这方面的好多概念,至少现在看到这些东西的时候不会茫然不知所措。最简单的一个概念“权”,我最早接触是在图论里面,后来在网络原理、运筹学的时候也接触,我不知道其他地方有没有引用这个概念。如果一个人从没接触过,当代码里面看到一个叫做Weight的类或者变量的时候不知道回去如何理解呢。
其实上次在研究正则表达式的时候已经有了这方面的感觉只是这次看lucene的源码的时候感觉尤为强烈,呵呵 看来大学没白上,虽然忘记了好多东西浪费了好多课程,但是还是值得的。
最后还是要后悔一下,那天整理抽屉翻出一本当时的笔记,没记多少东西只有以下内容:
概率论 运筹学 计算方法 大学物理 线形代数 数学建模。 看到笔记的时候我当时就觉得发晕,居然大学上了那么多的课,可是学到的有多少呢?
我们可以设想WhatIf 设想future? 但是面对的只有current,而且我们只能生活在现在。
分享到:
相关推荐
《LuceneDemo详解:经典大学学习资源》 Lucene是一个高性能、全文检索库,由Apache软件基金会开发。它提供了一个简单但功能强大的API,用于在各种应用中实现文本的索引和搜索。在这个名为“我的大学资料LuceneDemo...
综合以上,这个项目涵盖了从数据获取(爬虫)、数据处理(Lucene索引)、服务器端逻辑(Java Web)到客户端展示(前端开发)的完整流程,对于学习和理解Web开发和信息检索技术具有很高的实践价值。
《Lucene in Action》第二版是一本全面介绍Apache Lucene 3.0的书籍,它被誉为是美国大学搜索引擎课程的标准教材之一。本书由Michael McCandless、Erik Hatcher和Otis Gospodnetic三位作者共同编写,并得到了Apache ...
- **基于统计的方法**:通过对大量语料库的统计分析,自动学习词语边界。这种方法在大数据集下效果较好,但对小规模数据集不够理想。 - **混合方法**:结合规则和统计方法的优点,先用规则方法快速过滤出大部分词汇...
- **教材定位**: 作为一本入门级教材,本书旨在为初学者提供一条清晰的学习路径,涵盖Lucene的基础理论与实践操作。 - **核心内容**: 重点介绍了Lucene的发展历程、索引建立及搜索的基本原理。 #### Lucene 历史与...
- **起源与发展**: Nutch最初是俄勒冈州立大学的一个开源项目,2005年加入Apache孵化器,同年成为Lucene的子项目。目前最新版本为Nutch 0.9。 - **定位**: - Nutch不同于Lucene,它提供了一个完整的搜索引擎解决...
3. **毕业设计**:这是一个学生在毕业前完成的综合性项目,旨在检验和展示其在大学期间学习的理论知识和实践技能。此公交搜索系统展示了开发者对Java编程语言、Web应用开发以及搜索引擎技术的理解和运用。 4. **...
总结,使用 Lucene 创建索引和搜索引擎涉及对文本的分析、文档的表示、查询的构造以及搜索结果的处理。这个大学项目提供了一个很好的起点,让你熟悉 Lucene 的基本操作,同时也可以在此基础上扩展功能,如支持更复杂...
【Apache Mahout】是一个基于Java的开源机器学习库,曾是Apache Lucene的子项目,后来发展为独立的顶级项目。Mahout的目标是提供一个机器学习平台,支持分布式计算,允许用户执行类似于R语言的线性代数运算和大数据...
本教程涵盖北京大学研究生课程中的核心概念和技术,旨在提供一个全面的文本挖掘学习框架。 在文本检索技术部分,讲解了Smart系统、Okapi系统、Lemur Toolkit系统和Lucene系统等重要的信息检索平台。Smart系统是最早...
"饮水思源BBS和渔网FTP"是一个学习资源,主要涵盖了两个方面:基于Lucene的BBS(Bulletin Board System,电子公告板)搜索引擎和FTP(File Transfer Protocol,文件传输协议)搜索引擎。这个资源对于想要了解和入门...
在这个项目中,我们关注的是一个基于Apache Lucene的搜索引擎框架,这是由CMU(卡内基梅隆大学)11-642课程设计的一个实践项目。Lucene是一个高性能、全文本搜索库,它提供了基础的索引和搜索功能,而这个项目的目标...
项目提供了一套完整的环境配置,包括Java开发环境(JDK)、构建工具(如Maven或Gradle)、数据库连接以及Lucene库的依赖。用户需按照指导设置好这些环境,导入项目源码,配置数据库连接参数,即可运行搜索引擎。 六...
在这个实例中,我们将学习如何使用Lucene.net创建索引,对PanGu分词后的结果进行存储,以及实现用户查询的解析和结果返回。 在"PanGuWebDemo"这个压缩包中,包含了完整的项目代码,包括以下几个关键部分: 1. **...
Lucene是apache软件基金会4 jakarta项目组的一个子项目,是一个开放源代码的全文检索引擎工具包,但它不是一个完整的全文检索引擎,而是一个全文检索引擎的架构,提供了完整的查询引擎和索引引擎,部分文本分析引擎...
随着计算机专业的普及,越来越多的大学生选择了该热门专业,毕业时的毕业设计需要完整的源码以及论文。此资源是已毕业前辈的毕业作品,包含项目的源码、毕业设计论文的模板,项目匹配的毕业设计论文以及项目的设计和...
《北邮信息检索实验》是北京邮电大学开设的一门涉及现代信息检索技术的实践性课程,旨在让学生深入理解并掌握信息检索系统的设计与实现。在这个实验中,学生将运用Lucene这一强大的全文搜索引擎库来构建一个能够处理...
对于熟悉C和C++的程序员来说,学习LUA可以极大地提高工作效率,因为它具有简洁的语法、高效的执行性能以及易于集成到已有的C或C++项目中的特性。 1. **LUA简介** LUA由葡萄牙的PUC-Rio大学开发,设计目标是提供一...
2022-2023山东大学软件学院信息检索知识点总结 信息检索是指从海量的非结构化数据中找出满足用户信息需求的资料的过程。信息检索模型描述了文档、查询和匹配函数之间的数学模型。搜索引擎的原理是根据用户的查询,...
4. 搜索引擎技术:ElasticSearch被用于搭建搜索服务,它是一种基于Lucene构建的开源搜索引擎,常用于全文搜索和实时分析。学习和掌握搜索引擎的搭建对于信息内容安全具有重要意义。 5. 数据库和爬虫的结合:在项目...