java抓取京东省市区县数据

yulon

浏览: 119653 次
性别:
来自: 广州

最近访客更多访客>>

mengzipeng

brevity

2524195025

fsldg

博主相关

博客

微博

相册

留言

关于我

文章分类

社区版块

存档分类

博客分类：

java抓取数据

一般的系统都会有地区信息数据，如果要你一个个录取全国的地区信息，你可能会抓狂！下面的程序或许能帮到你：

public class AreaUtils {

	private final static Map<Integer,String> provinces=new HashMap<Integer,String>();
	
	static{
		provinces.put(1, "北京");
		provinces.put(2, "上海");
		provinces.put(3, "天津");
		provinces.put(4, "重庆");
		provinces.put(5, "河北");
		provinces.put(6, "山西");
		provinces.put(7, "河南");
		provinces.put(8, "辽宁");
		provinces.put(9, "吉林");
		provinces.put(10, "黑龙江");
		provinces.put(11, "内蒙古");
		provinces.put(12, "江苏");
		provinces.put(13, "山东");
		provinces.put(14, "安徽");
		provinces.put(15, "浙江");
		provinces.put(16, "福建");
		provinces.put(17, "湖北");
		provinces.put(18, "湖南");
		provinces.put(19, "广东");
		provinces.put(20, "广西");
		provinces.put(21, "江西");
		provinces.put(22, "四川");
		provinces.put(23, "海南");
		provinces.put(24, "贵州");
		provinces.put(25, "云南");
		provinces.put(26, "西藏");
		provinces.put(27, "陕西");
		provinces.put(28, "甘肃");
		provinces.put(29, "青海");
		provinces.put(30, "宁夏");
		provinces.put(31, "新疆");
		provinces.put(32, "台湾");
		provinces.put(42, "香港");
		provinces.put(43, "澳门");
		provinces.put(84, "钓鱼岛");
	}
	private static final String area_pattern="\\[.+?\\]";
	public static String areaUrl="http://passport.jd.com/emReg/AjaxService.aspx?action=GetAreas&level=[level]&parentId=[parentId]";
	/**
	 * 
	 * @author YLPan
	 * @date 2013-5-15
	 * @param level 1 获取市 2获取区县
	 * @param parentId
	 * @return
	 * @throws Exception
	 */
	public static List<Map<String,Object>> getAreas(Integer level,Integer parentId) throws Exception{
		String cityUrl=areaUrl.replaceAll("\\[level\\]",String.valueOf(level)).replaceAll("\\[parentId\\]", String.valueOf(parentId));
		System.out.println("cityUrl:"+cityUrl);
		String cityJson=NetTool.getTextContent(cityUrl, "gbk");
		Pattern pattern = Pattern.compile(area_pattern);
		Matcher matcher = pattern.matcher(cityJson);
		if(matcher.find()){
			cityJson=matcher.group();
			List<Map<String,Object>> cityList=JsonUtils.readJson2ListMap(cityJson);
			return cityList;
		}
		return null;
	}
	public static void areaInit() throws Exception{
		for(Entry<Integer,String> entry : provinces.entrySet()){
			System.out.println("province:"+entry.getValue());
				List<Map<String,Object>> cityList=getAreas(1,entry.getKey());
				if(cityList==null)continue;
				for(Map<String,Object> citymap : cityList){
					Integer cityId=(Integer)citymap.get("Id");
					String cityName=(String)citymap.get("Name");
					System.out.println("--cityName:"+cityName);
					List<Map<String,Object>> countyList=getAreas(2,cityId);
					if(countyList==null)continue;
						for(Map<String,Object> countyMap : countyList){
							Integer countyId=(Integer)countyMap.get("Id");
							String countyName=(String)countyMap.get("Name");
							System.out.println("----countyName:"+countyName);
					}
			}
		}
	}
	public static void main(String[] args) {
		try {
			areaInit();
		} catch (Exception e) {
			e.printStackTrace();
		}
	}
}

输出数据：

province:北京
cityUrl:http://passport.jd.com/emReg/AjaxService.aspx?action=GetAreas&level=1&parentId=1
--cityName:朝阳区
cityUrl:http://passport.jd.com/emReg/AjaxService.aspx?action=GetAreas&level=2&parentId=72
----countyName:三环以内
----countyName:三环到四环之间
----countyName:四环到五环之间
----countyName:五环到六环之间
----countyName:管庄
----countyName:北苑
----countyName:定福庄
--cityName:海淀区
cityUrl:http://passport.jd.com/emReg/AjaxService.aspx?action=GetAreas&level=2&parentId=2800
----countyName:三环以内
----countyName:三环到四环之间
----countyName:四环到五环之间
----countyName:五环到六环之间
----countyName:六环以外
----countyName:上地
----countyName:西三旗
----countyName:清河
----countyName:圆明园西路
----countyName:农业大学西校区
----countyName:西二旗
........................................

可能要浏览器是访问http://passport.jd.com/emReg/AjaxService.aspx?action=GetAreas&level=1&parentId=1，返回的数据格式如下：

({"Areas":[{"Id":72,"Name":"朝阳区"},{"Id":2800,"Name":"海淀区"},{"Id":2801,"Name":"西城区"},{"Id":2802,"Name":"东城区"},{"Id":2803,"Name":"崇文区"},{"Id":2804,"Name":"宣武区"},{"Id":2805,"Name":"丰台区"},{"Id":2806,"Name":"石景山区"},{"Id":2807,"Name":"门头沟"},{"Id":2808,"Name":"房山区"},{"Id":2809,"Name":"通州区"},{"Id":2810,"Name":"大兴区"},{"Id":2812,"Name":"顺义区"},{"Id":2814,"Name":"怀柔区"},{"Id":2816,"Name":"密云区"},{"Id":2901,"Name":"昌平区"},{"Id":2953,"Name":"平谷区"},{"Id":3065,"Name":"延庆县"}]})

说明：其他NetTool，JsonUtils是封装好的工具类，已上传

NetTool_JsonUtils.tar.gz (3.4 KB)
下载次数: 177

分享到：

基于JFinal的后台业务框架通用模块 | android之自定义带图片的title

2013-06-25 18:04
浏览 6726
评论(0)
分类:编程语言
查看更多

发表评论

您还没有登录,请您登录后再发表评论

最近访客更多访客>>

博主相关

文章分类

社区版块

存档分类

最新评论

java抓取京东省市区县数据

评论

发表评论

相关推荐

最近访客 更多访客>>

博主相关

文章分类

社区版块

存档分类

最新评论

java抓取京东省市区县数据

评论

发表评论

相关推荐

最近访客更多访客>>