`
XiAoOMAn07
  • 浏览: 75825 次
  • 性别: Icon_minigender_1
  • 来自: 温州
社区版块
存档分类
最新评论

网页数据抓取 获取股票数据

阅读更多
/*
 * import java.io.BufferedReader;
 * import java.io.File;
 * import java.io.FileReader;
 * import java.io.IOException;
 * import java.util.regex.Matcher;
 * import java.util.regex.Pattern;
*/
import java.net.*;
import java.io.*;
import java.util.regex.*;
public class DataSpider {

	public static void main(String[] args) throws IOException {

		
		String s;
		int i = 0;
		
		//网页地址
		URL url = new URL(
				"http://money.finance.sina.com.cn/corp/go.php/vMS_MarketHistory/stockid/600006.phtml");
		//创建输入流
		BufferedReader br = new BufferedReader(new InputStreamReader(url.openStream()));
		//创建输出文档
		FileOutputStream fos = new FileOutputStream("D:\\XiAoOMAn\\GuPiao.txt");
		//创建输出流
		OutputStreamWriter ows = new OutputStreamWriter(fos);
		
		//匹配需要获取的数据的列名
		Pattern q = Pattern.compile("((?<=g>)(\\w*?)).*?(?=(</strong>))");
		//匹配数据
		Pattern p = Pattern.compile("((?<=date=)(\\w*?)).*?(?=('>))|((?<=center\">)(\\d{1,7}?)).*?(?=(</div>))");
		String str = null;
		//获取源文件内容 匹配 输出
		while ((str = br.readLine()) != null) {
			// Matcher b = q.matcher(str);
			//列名
			Matcher n = q.matcher(str);
			//数据
			Matcher m = p.matcher(str);

			//提取 列名
			while (n.find()) {
				//形式转换 成 String
				s = String.valueOf(n.group());
				//输出到文本文档
				ows.write(s + "		 ");
				System.out.printf("%-44s", n.group());
				
			}
			//提取 数据
			while (m.find()) {
				if (i == 0){
					System.out.println();
					ows.write("\r\n");
				}
				i++;
				s = String.valueOf(m.group());
				ows.write(s + "	   ");
				System.out.printf("%-22s", m.group());
				//每输出完一行 回车
				if (i % 7 == 0)
				{
					System.out.println();
					ows.write("\r\n");
				}
			}

		}
		ows.close();
		fos.close();
		br.close();
		br.close();

	}

}
分享到:
评论
3 楼 xxxyyyfff0623 2010-07-22  
谢谢你的资源!但要是有解释就更好了。而且字符串也可以完成吧!
2 楼 XiAoOMAn07 2009-09-26  
teaofnit 写道
DateSpider ?
or DataSpider


DataSpider....
1 楼 teaofnit 2009-09-25  
DateSpider ?
or DataSpider

相关推荐

    C#抓取网页股票年报数据程序源代码

    标题中的"C#抓取网页股票年报数据程序源代码"指的是一个使用C#编程语言开发的软件应用程序,其主要功能是从互联网上的网页中抓取股票年报的相关数据。在信息技术领域,这种程序通常被称为网络爬虫或者网页抓取工具,...

    Python网页数据抓取以及表格的制作

    在IT行业中,Python语言因其简洁明了的语法和强大的库支持而被广泛应用于网页数据抓取和数据分析领域。本主题将深入探讨如何使用Python进行网页数据抓取,并介绍如何利用这些数据创建表格,同时涉及CSS文件的生成和...

    网页数据抓取工具,ajax异步数据获取,模拟访问网页提取内容

    网页数据抓取是互联网时代获取信息的重要手段,它允许我们自动化地从网页中提取大量有用的数据,例如新闻、产品信息、用户评论等。在标题提到的"网页数据抓取工具"中,C#语言被用来开发这样的工具,这表明我们可以...

    自动抓取yahoo股票数据软件

    总的来说,"自动抓取yahoo股票数据软件"是一个集数据抓取、清洗、整合和分析于一体的工具,它简化了金融数据的获取过程,提高了分析效率,对于金融爱好者和专业人士来说都极具价值。而实现这一工具所需的技术知识...

    网页数据比分抓取源码

    在实际应用中,数据抓取可以结合数据清洗、数据分析等环节,形成完整的数据处理流程,用于竞彩策略分析、球队表现评估、市场趋势预测等。例如,收集多场比赛的比分数据,可以分析球队间的胜负规律;结合历史数据,还...

    采集软件 网页数据抓取的得力工具

    "采集软件 网页数据抓取的得力工具"是一款专门为此目的设计的应用程序,它能够帮助用户高效地从各种网页网站上抓取并处理数据,如图片、文字以及可下载的文件。 网页采集的核心技术主要包括网络爬虫(Web Crawler)...

    可自定义配置的网页数据抓取引擎

    网页数据抓取引擎是一种强大的工具,它允许用户根据自己的需求定制数据提取规则,从而能够从互联网上的各种网页中高效地获取所需信息。这种技术在数据分析、市场研究、内容聚合、竞争情报等领域广泛应用。 首先,...

    C#抓取网页数据,彩票数据查询

    网页数据抓取,也称为网络爬虫或Web抓取,是一种自动化过程,通过这个过程,程序可以按照一定的规则从互联网上抓取所需的信息。在这个案例中,我们的目标是获取彩票相关的数据,这可能包括历史开奖结果、赔率、销售...

    delphi抓取网页数据

    在IT行业中,Delphi是一种基于Object Pascal编程语言的集成开发环境(IDE),它以其高效、高性能的...在122考试平台的案例中,我们可以构建一个自动化的数据抓取程序,定期检查预约情况,以便提前了解学员的预约动态。

    Http,Jsoup-网页数据抓取

    在IT行业中,网络数据抓取是一项重要的技能,它允许开发者获取并分析网页上的信息,以进行各种用途,如数据分析、网站监控或者构建自己的应用程序。在这个主题中,我们将深入探讨两个关键概念:Http协议和Jsoup库,...

    网页数据抓取(专业实习报告)

    网页数据抓取的专业实习报告,图文并茂各种详细

    java网页抓取数据

    最后,数据抓取后通常需要存储或进一步处理。你可以选择将数据保存到文件(如CSV或JSON),或者直接导入数据库。例如,使用CSVWriter: ```java CSVWriter writer = new CSVWriter(new FileWriter("output.csv")); ...

    Java抓取网页数据Demo

    在IT领域,网络数据抓取是一项重要的技能,特别是在大数据分析、搜索引擎优化和市场研究中。...通过深入理解和实践,你将能熟练地利用Java进行网页数据抓取,为你的项目或研究提供强大的数据支持。

    htmlparser实现从网页上抓取数据

    ### HTMLParser实现从网页上抓取数据 #### 概述 HTMLParser是一种强大的工具,用于解析HTML文档并从中提取有用的信息。它适用于多种场景,包括但不限于网页爬虫、数据分析等。本文将详细介绍如何使用HTMLParser从...

    LABVIEW 获取网页数据_labview访问网页下载文章

    标题 "LABVIEW 获取网页数据_labview访问网页下载文章" 描述了一个使用LabVIEW(Laboratory Virtual Instrument Engineering Workbench)编程来获取和下载网页数据的过程。LabVIEW是美国国家仪器公司(NI)开发的一...

    抓取动态网页数据

    动态网页数据抓取是现代互联网应用中不可或缺的一部分,它涉及到网络爬虫技术、网页解析以及数据存储等多个领域。本文将详细讲解如何有效地抓取动态网页数据,并将其导入数据库。 首先,我们要理解动态网页的特性。...

    新浪网股票数据抓取以及存储

    本文将基于“新浪网股票数据抓取以及存储”的主题,深入探讨如何利用编程技术从新浪网获取股票数据,并将其有效地存储以供后续分析。 首先,我们需要了解数据抓取的基本概念。数据抓取,又称网页爬虫,是一种自动...

    Java抓取https网页数据

    Java抓取https网页数据,解决peer not authenticated异常。导入eclipse就能运行,带有所用的jar包(commons-httpclient-3.1.jar,commons-logging.jar,httpclient-4.2.5.jar,httpcore-4.2.4.jar)

    影刀RPA系列公开课3:网页自动化——数据抓取.rar

    影刀RPA系列公开课3的主题聚焦于网页自动化和数据抓取,这是一门针对自动流程化技术(Robotic Process Automation,简称RPA)的学习课程。RPA是一种先进的技术,它允许用户通过模拟人类在应用程序中的交互,实现业务...

Global site tag (gtag.js) - Google Analytics