现在校内网的一千万个用户的名字组成的一个文件,其中每行为一个名字,其中很多的名字是重复多次出现。一个名字重复次数越高,说明最常见,设计一个算法,把最常见的100个名字及重复次数以降序列出。
其他算法:1.先设计一个好的散列函数,用一个hash表存储所有用户名和出现次数,再应用堆排序,输出前100个用户。先HASH,统计完后, 建立一个100个元素的堆,一个一个更堆的最小元素比较就可以了
2.一个人的名字大体三字 占六个字节 1千万也就60M
内存完全够
我设计 数据结构
struct person
{
char *name;
int n;
struct person *next;
}
占内存16个字节 200个不重复的 共占内存32M
这样 就组成了一个链表
往里面插入数据的时候 比较n的大小 决定是不是让这个节点前移。保证链表是从大到小排列的。这样前一百个就是要找的人的名字
再者 可以节省一些移动比较次数:可以用两个链表,期中一个链表保持顺序从大到小,另一个仅是记录次数而已。这样每读入一个人,就寻找,不存在就插入第二个链表,存在 相应n加一,跟第一个链表的尾指针n比较,大于的话就把他插入到第一个链表,第一个链表的尾放到第二个链表。
第三个方法:减少寻找次数 hash存储那最大的一百个,其他的跟第二种方法一样!!
代码实现如下:但是没有实现map集合按映射值排序,排序有时间大家可以细细研究
import java.io.BufferedReader;
import java.io.FileReader;
import java.util.HashMap;
import java.util.Iterator;
import java.util.Map;
public class xiaonei {
private static String line="";
private static Map m=new HashMap();
static Iterator it=null;
static int value=1;
public static void main(String args[])
{
try
{
BufferedReader reader=new BufferedReader(new FileReader("D:/10-17编程/xiaonei.txt"));
while((line=reader.readLine())!=null)
{
if(m.containsKey(line))
{
value=Integer.parseInt(m.get(line).toString());
m.remove(line);
m.put(line,++value);
}
else
{
m.put(line,1);
}
}
it=m.entrySet().iterator();
while(it.hasNext())
{
Map.Entry me=(Map.Entry)it.next();
System.out.print(me.getKey());
System.out.println(me.getValue());
}
}
catch(Exception e)
{
e.printStackTrace();
}
finally
{
m.clear();
}
}
}
排序可以参考下面的
Map 按值排序 (Map sort by value) - Java
Map是键值对的集合,又叫作字典或关联数组等,是最常见的数据结构之一。在java如何让一个map按value排序呢? 看似简单,但却不容易!
比如,Map中key是String类型,表示一个单词,而value是int型,表示该单词出现的次数,现在我们想要按照单词出现的次数来排序:
Map map = new TreeMap();
map.put("me", 1000);
map.put("and", 4000);
map.put("you", 3000);
map.put("food", 10000);
map.put("hungry", 5000);
map.put("later", 6000);
按值排序的结果应该是:
key value
me 1000
you 3000
and 4000
hungry 5000
later 6000
food 10000
首先,不能采用SortedMap结构,因为SortedMap是按键排序的Map,而不是按值排序的Map,我们要的是按值排序的Map。
Couldn't you do this with a SortedMap?
No, because the map are being sorted by its keys.
方法一:
如下Java代码:
import java.util.Iterator;import java.util.Set;import java.util.TreeSet;public class Main { public static void main(String[] args) { Set set = new TreeSet(); set.add(new Pair("me", "1000")); set.add(new Pair("and", "4000")); set.add(new Pair("you", "3000")); set.add(new Pair("food", "10000")); set.add(new Pair("hungry", "5000")); set.add(new Pair("later", "6000")); set.add(new Pair("myself", "1000")); for (Iterator i = set.iterator(); i.hasNext();) System.out.println(i.next()); }}class Pair implements Comparable { private final String name; private final int number; public Pair(String name, int number) { this.name = name; this.number = number; } public Pair(String name, String number) throws NumberFormatException { this.name = name; this.number = Integer.parseInt(number); } public int compareTo(Object o) { if (o instanceof Pair) { int cmp = Double.compare(number, ((Pair) o).number); if (cmp != 0) { return cmp; } return name.compareTo(((Pair) o).name); } throw new ClassCastException("Cannot compare Pair with " + o.getClass().getName()); } public String toString() { return name + ' ' + number; }}
类似的C++代码:
typedef pair<string, int> PAIR;
int cmp(const PAIR& x, const PAIR& y)
{
return x.second > y.second;
}
map<string,int> m;
vector<PAIR> vec;
for (map<wstring,int>::iterator curr = m.begin(); curr != m.end(); ++curr)
{
vec.push_back(make_pair(curr->first, curr->second));
}
sort(vec.begin(), vec.end(), cmp);
上面方法的实质意义是:将Map结构中的键值对(Map.Entry)封装成一个自定义的类(结构),或者直接用Map.Entry类。自定义类知道自己应该如何排序,也就是按值排序,具体为自己实现Comparable接口或构造一个Comparator对象,然后不用Map结构而采用有序集合(SortedSet, TreeSet是SortedSet的一种实现),这样就实现了Map中sort by value要达到的目的。就是说,不用Map,而是把Map.Entry当作一个对象,这样问题变为实现一个该对象的有序集合或对该对象的集合做排序。既可以用SortedSet,这样插入完成后自然就是有序的了,又或者用一个List或数组,然后再对其做排序(Collections.sort() or Arrays.sort())。
Encapsulate the information in its own class. Either implement
Comparable and write rules for the natural ordering or write a
Comparator based on your criteria. Store the information in a sorted
collection, or use the Collections.sort() method.
方法二:
You can also use the following code to sort by value:
public static Map sortByValue(Map map) { List list = new LinkedList(map.entrySet()); Collections.sort(list, new Comparator() { public int compare(Object o1, Object o2) { return ((Comparable) ((Map.Entry) (o1)).getValue()) .compareTo(((Map.Entry) (o2)).getValue()); } }); Map result = new LinkedHashMap(); for (Iterator it = list.iterator(); it.hasNext();) { Map.Entry entry = (Map.Entry) it.next(); result.put(entry.getKey(), entry.getValue()); } return result; } public static Map sortByValue(Map map, final boolean reverse) { List list = new LinkedList(map.entrySet()); Collections.sort(list, new Comparator() { public int compare(Object o1, Object o2) { if (reverse) { return -((Comparable) ((Map.Entry) (o1)).getValue()) .compareTo(((Map.Entry) (o2)).getValue()); } return ((Comparable) ((Map.Entry) (o1)).getValue()) .compareTo(((Map.Entry) (o2)).getValue()); } }); Map result = new LinkedHashMap(); for (Iterator it = list.iterator(); it.hasNext();) { Map.Entry entry = (Map.Entry) it.next(); result.put(entry.getKey(), entry.getValue()); } return result; }
Map map = new HashMap(); map.put("a", 4); map.put("b", 1); map.put("c", 3); map.put("d", 2); Map sorted = sortByValue(map); System.out.println(sorted);
// output : {b=1, d=2, c=3, a=4}
或者还可以这样:
Map map = new HashMap(); map.put("a", 4); map.put("b", 1); map.put("c", 3); map.put("d", 2); Set<Map.Entry<String, Integer>> treeSet = new TreeSet<Map.Entry<String, Integer>>( new Comparator<Map.Entry<String, Integer>>() { public int compare(Map.Entry<String, Integer> o1, Map.Entry<String, Integer> o2) { Integer d1 = o1.getValue(); Integer d2 = o2.getValue(); int r = d2.compareTo(d1); if (r != 0) return r; else return o2.getKey().compareTo(o1.getKey()); } }); treeSet.addAll(map.entrySet()); System.out.println(treeSet); // output : [a=4, c=3, d=2, b=1]
另外,Groovy 中实现 sort map by value,当然本质是一样的,但却很简洁 :
用 groovy 中 map 的 sort 方法(需要 groovy 1.6),
def result = map.sort(){ a, b ->
b.value.compareTo(a.value)
}
如:
["a":3,"b":1,"c":4,"d":2].sort{ a,b -> a.value - b.value }
结果为: [b:1, d:2, a:3, c:4]
Python中也类似:
h = {"a":2,"b":1,"c":3}
i = h.items() // i = [('a', 2), ('c', 3), ('b', 1)]
i.sort(lambda (k1,v1),(k2,v2): cmp(v2,v1) ) // i = [('c', 3), ('a', 2), ('b', 1)]
分享到:
相关推荐
在千橡公司的笔试题目中,涵盖了计算机科学的基础知识,包括数据结构、算法、编程语言特性和面向对象编程等。以下是对这些知识点的详细解析: 1. **满3叉树高度计算**:满3叉树是一种每个节点最多有3个子节点的树形...
【标题解析】:“2009年千橡校园招聘笔试题”是指千橡互动集团在2009年进行的校园招聘中所采用的笔试题目,主要考察应聘者的基础计算机科学知识,包括数据结构、算法和编程能力。 【描述解析】:描述中提到的试题...
千橡笔试题软件测试千橡笔试题一,填空题1.有12345个结点的满3叉数的高度为_____写出计算过程,1个结点高度为1.2.最大空间为6的循环队列队头front为3,队尾rear为0,删除一个插入两个元素后的front和rear为多少3.N个...
【千橡(校内网)笔试面试】涉及的IT知识点主要集中在逻辑推理和概率计算上,这在软件工程师的面试中常作为考察候选者思维能力和问题解决能力的一部分。 首先,第一道逻辑推理题是一个典型的逻辑游戏。这类问题旨在...
千橡公司的笔试题,共10道,如果想去这个公司,还是很有用的。详情访问:http://hi.csdn.net/mamayingying
标题中的“千橡技术基础测试,千橡公司部分面试题目”揭示了这是一份与千橡公司相关的技术面试试题集,主要关注基础技术水平的考察。千橡公司可能是一家重视技术能力的企业,这样的测试通常用于筛选潜在的技术人才。...
千橡社区营销CRM.pptx
千橡移动社区平台发展趋势.pptx
【各大IT公司笔试真题汇总】是一份求职者必备的资源集合,包含了众多知名IT企业的笔试题目,旨在帮助应聘者更好地准备技术面试和笔试环节。这些题目覆盖了多个技术领域,如Java、C++、XML、游戏开发、软件测试、运维...
4. **千橡**(人人网):尽管千橡集团的业务主要集中在社交网络,但其面试题也可能涉及前端开发、后端架构、移动应用开发等。面试者需要具备HTML、CSS、JavaScript基础,理解Web标准,同时对服务器端编程和数据库...
2. **SNS2.0**(2006-2008年):随着Facebook的成功,中国的SNS开始寻求更多元化的发展,如千橡集团的校内网、亿聚网等瞄准了白领市场。这一阶段,SNS理念、产品和服务同质化严重,尽管尝试模仿Facebook,但缺乏其...
包含多家IT公司面试题,如瑞星、奇虎、千橡互动等,适合软件测评的人员
dudu下载加速器是一款...DuDu下载加速器,也叫DuDu加速器,是由领先的P2P技术公司千橡互联开发的一款基于P2P技术的极速下载软件。 音乐即搜即下,电影即看即下,游戏即玩即下。 DuDU下载加速器(DuDu Accelerate f
例如,2006年千橡公司收购校内网,随后与5Q校园网合并,形成了后来的校内网,这就是一个成功的SNS营销案例。\n\n在SNS网站上,广告的展现概率与其竞争力有关,出价高、质量好的广告更有可能出现在用户面前。为了提高...
- **样本来源**:样本主要来自新浪、网易、腾讯、迅雷、51.com、多玩、17173、256G和千橡等9家网站的用户。 ### 2. 概念定义 #### 网络游戏运营商 - 指的是那些通过自主研发游戏或是获得其他游戏开发商授权来运营...
2006年,因资金问题,校内网被陈一舟的千橡互动集团收购并整合进5Q网;2009年,正式更名为人人网。 - **业务范围扩展**:除了传统的社交功能外,人人网还涉足网络广告、电子商务、网络游戏和互联网增值业务等多个...
在2005年前后,人们普遍认为互联网社交应该面向陌生人,因为陌生人间的交流更开放,没有顾虑。然而,校内网的团队观察到即便功能有限,用户依然频繁回访,他们推测是因为网站上有很多用户的朋友。王兴和王慧文据此...
王秀娟,这位曾经的千橡首席营销官,是中国SNS领域的先驱者,曾参与ChinaRen和猫扑网校内网等社交网站的建设。2018年,她创立了商务人脉网——大街网,开启了她的创业之路。三年后,即2021年,王秀娟进一步推出手机...
在21世纪初,随着互联网的发展,网络营销的概念逐渐崛起,并在2006年前后,由千橡集团的陈一舟提出了一个新的思考方向——树立网络营销新维度。这一理念的核心是利用Web 2.0的特性,将网络广告与用户的个性化需求相...
em算法matlab代码此代码是在2015年国际计算机视觉会议(ICCV)会议上发表的着色算法的实现: “学习大规模自动图像着色”,作者:...千橡市,加利福尼亚州91320 2005年12月 ===说明=== 该代码是为Matlab R2014b / 2015