今天碰到了一个问题:
有两个文本文件,一个有二百万的数据,一个有一百万的数据,我怎样求两个文本文件数据的交集呢?
1:我的思路首先是这样的,那少的数据(一百万的数据)逐个跟二百万的数据相比,相等的拿出来,然后我写了个小程 序
跑了三个多小时,才出来五百多个。显然不能这样搞。
然后我们老大想了个算法,我真的很佩服:
1:首先把这两个数据去重,linus命令如下:uniq one.txt >one_uniq.txt, uniq two.txt>two_uniq.txt.
2: 然后把one_uniq.txt,two_uniq.txt放到一起取重复的,命令如下: cat one_uniq.txt two_uniq.txt|sort|uniq -d>result.txt
result.txt里的数据即为结果,一共花了不到五秒钟的时间,这就是差距啊。
分享到:
相关推荐
《算法问题实战策略》这本书是2015年2月出版的,主要涵盖了算法分析、设计、实战应用等多个方面的内容,对于想要深入理解和提升算法能力的读者来说是一份宝贵的资源。书中通过详细的目录结构,将内容划分为六个部分...
经典算法问题-TSP商旅问题(Traveling Salesman Problem),它是数学领域中著名问题之一。假设有一个旅行商人要拜访N个城市,他必须选择所要走的路径,路径的限制是每个城市只能拜访一次,而且最后要回到原来出发的...
最新的蓝桥杯相关的算法问题合集资料.zip最新的蓝桥杯相最新的蓝桥杯相关的算法问题合集资料.zip关的算法问题合集资料.zip最新的蓝桥杯相关的算法问题合集资料.zip最新的蓝桥杯相关的算法问题合集资料.zip最新的...
《迷茫的旅行商: 一个无处不在的计算机算法问题》概述了旅行商问题的起源和历史,并阐述了其许多重要的应用范围,如基因组测序、计算机处理器设计、音乐整理、行星寻找,等等。此外还探讨了人类如何在不借助计算机的...
虽然说在前端很少有机会接触到算法,大多都交互性的操作,然而从各大公司面试来看,算法依旧是考察的一...下面这篇文章就给大家总结了在前端JS面试中常见的算法问题,有需要的朋友们可以参考借鉴,下面来一起看看吧。
由于受文件过大限制,所以分成了三部分,请分别下载下来才能解压
排序算法问题.cpp
n皇后问题的回溯算法n皇后问题的回溯算法n皇后问题的回溯算法n皇后问题的回溯算法n皇后问题的回溯算法n皇后问题的回溯算法n皇后问题的回溯算法n皇后问题的回溯算法n皇后问题的回溯算法n皇后问题的回溯算法n皇后问题...
算法设计与分析:第1章 算法问题求解基础.ppt
目的:通过学习掌握算法设计的主要方法,并对算法的时、空复杂性有正确分析的能力,能够针对具体的应用问题选择合适的数据结构和设计结构清晰、正确有效的算法,为独立设计算法和对算法进行复杂性分析奠定坚实的理论...
- 数学谜题:运用数学原理解决算法问题,如概率论的应用。 - 几何谜题:处理几何对象之间的关系,例如最近点对问题。 #### 四、学习价值与应用前景 《算法谜题》不仅提供了一系列有趣的谜题供读者练习,更重要的...
算法小抄的目的是为了帮助程序员提高编程能力,特别是提升在编程面试中解决算法问题的能力。 从提供的部分内容来看,该文档大致分为以下几个章节,每个章节都对应一种算法或数据结构相关的主题: 第一部分,即开篇...
这是一个完整的基于遗传算法的TSP算法,调用格式为: [Shortroute,ShortLen]=GATSP(C) 其中,Shortroute为最优圈; ShortLen为最优圈的长度; C为节点(城市)的坐标矩阵:第一列为横坐标,第二列为纵坐标。
这是一个用MATLAB编写的旅行商遗传算法
这部分内容为读者提供了处理更复杂数据结构和算法问题的思路和方法。 知识点五:Java编程实践 《算法导论第四版》不仅仅是理论的阐述,更强调实践的重要性。书中提供了大量的Java源代码,涉及各种算法的实现,如...
采用了多线程和蚁群算法的思路,代码来自于其他博客,经过一定的修改
数据结构与算法经典问题解析:Java语言描述(原书第2版) 是一本数据结构方面的优秀教材,以Java为描述语言,介绍了...全书中大约有700个算法问题及相应的解法,对于许多问题,本书提供了多个具有不同复杂度的解决方法。
【标题】"经典算法题大全"揭示了这个压缩包的核心内容——它是一个包含大量算法问题的集合,专门针对像蓝桥杯这样的编程竞赛。蓝桥杯是中国一项知名的计算机编程比赛,旨在提升参赛者的算法设计与实现能力。这些题目...
这些题目涉及的算法知识点广泛,包括但不限于递归、动态规划、分治法、搜索算法和概率算法等,这些都是在解决算法问题时经常会用到的策略和技巧。通过对这些题目的学习和练习,学生可以深入理解算法设计的核心概念,...