关于如何把baidu/google嵌入到自己的系统当中去做法

全部 Hibernate Spring Struts iBATIS 企业应用 Lucene SOA Java综合 Tomcat 设计模式 OO JBoss

浏览 2757 次

锁定老帖子主题：关于如何把baidu/google嵌入到自己的系统当中去做法精华帖 (0) :: 良好帖 (1) :: 新手帖 (0) :: 隐藏帖 (3)
作者	正文
p_x1984 等级: 性别: 文章: 207 积分: 850 来自: 北京	发表时间：2009-07-23 相关推荐: mfc集成 cef3 成vs工程及编译示例（MFC嵌入谷歌浏览器） MFC MDI多页面嵌入谷歌浏览器CEF实现百度地图浏览 MFC 嵌入百度谷歌搜索源码 winform嵌入浏览器谷歌ChromiumWebBrowser / 默认IE webBrowser 在VC/MFC中嵌入Google地图——图文并茂更多相关推荐企业应用项目当中需要进行元搜索。选择了百度。也可以选择谷歌。两者的处理方式是一样的。（1）：页面输入：日全食。请求到struts2中的action中。 public String findSearchKeyWordByBaidu() { List<WebScout> webScouts = Utilities.getWebScouts(keyWord, webpage);//分析百度页面处理。 Collections.sort(webScouts);//排序 this.getRequest().setAttribute("webScouts", webScouts); this.getRequest().setAttribute("keywordName", this.keyWord); this.getRequest().setAttribute("webpage", this.webpage); return "webScouts";//所返回struts.xml中的name值。 } （2）：getWebScouts这个方法中是通过java正则表达式处理了百度页面。大家可以在百度中随便搜索一个关键字，然后查看下源文件。分析下源文件中每一条记录的特点。 public static List<WebScout> getWebScouts(String keyword, int key) { List<WebScout> webs = new ArrayList<WebScout>(); keyword = keyword.replaceAll("\\s\|\\,\|\\-", "+"); // keyword = "北京+日全食+上海"; String regx = "<table\\sborder=\"0\".?><tr><td.?><a\\sonmousedown=.?><font.?>(.?)</a><br><font.?>(.?)<br><font.?>(.?)\\s\\d{1,4}K\\s(\\d{4}-\\d{1,2}-\\d{1,2}).?</font>\\s-\\s<a\\shref=\"(.?)\"\\starget=\"_blank\"\\sclass=m>百度快照</a>\\s<br>(<a.?</a>)?</font></td></tr></table>"; //处理源文件 // String urlSource = "http://www.baidu.com/s?wd=" + keyword; //String pageUrlSource = "http://www.baidu.com/s?lm=0&si=&rn=10&ie=gb2312&ct=0&wd="+keyword+"&pn="+key; String urlSource = "http://www.baidu.com/s?lm=0&si=&rn=10&ie=gb2312&ct=0&wd="+keyword+"&pn="+key; //String urlSource = "http://www.baidu.com/s?ie=gb2312&bs=%B1%B1%BE%A9+%C8%CB%C3%F1&sr=&z=&cl=3&f=8&wd=%B1%B1%BE%A9+%C8%CB%C3%F1&ct=0"; //将用户输入的url字符串传入URL类对象中 try { URL url = new URL(urlSource); //创建URLConnection对象，用URL的openConnection方法将连接通过返回给URLConnection对象 HttpURLConnection c = (HttpURLConnection) url.openConnection(); //用URLConnection的connect()方法建立连接 c.connect(); InputStream is = c.getInputStream(); BufferedReader br = new BufferedReader(new InputStreamReader(is)); StringBuffer sb = new StringBuffer(); String line = br.readLine(); while (line != null) { sb.append(line); line = br.readLine(); } is.close(); br.close(); Pattern pattern = Pattern.compile(regx); Matcher matcher = pattern.matcher(sb); WebScout webScout = null; /封装到一个bean中**/ while(matcher.find()) { webScout = new WebScout(); webScout.setTitle(matcher.group(1)); webScout.setContent(matcher.group(2)); webScout.setWebUrl(matcher.group(3)); webScout.setTime(matcher.group(4)); webScout.setKuaizhao(matcher.group(5)); webs.add(webScout); } } catch (Exception e) { e.printStackTrace(); } return webs; } 上面这个方法可以直接那过来测试的。（3）：struts.xml中返回到一个.jsp。然后把webScouts进行循环处理就ok了。声明：ITeye文章版权属于作者，受法律保护。没有作者书面许可不得转载。推荐链接
返回顶楼

zhuyx808 等级: 初级会员性别: 文章: 103 积分: 60 来自: 快来看~天上米有灰机	发表时间：2009-07-24 google不是提供的有搜索API吗？
返回顶楼	回帖地址 0 0 请登录后投票

p_x1984 等级: 性别: 文章: 207 积分: 850 来自: 北京	发表时间：2009-07-24 有很多种方式。有时间研究下google的API吧！
返回顶楼	回帖地址 0 0 请登录后投票

aaron7524 等级: 初级会员性别: 文章: 12 积分: 30 来自: 上海	发表时间：2009-07-24 我们在项目中获取别人的天气预报也用到了这种方式
返回顶楼	回帖地址 0 0 请登录后投票

Hooopo 等级: 性别: 文章: 710 积分: 720 来自: 北京	发表时间：2009-07-24 有现成的google api不用用正则........
返回顶楼	回帖地址 0 0 请登录后投票

论坛首页 → Java企业应用版

跳转论坛: