`

Python数据分析实战-Boston Public Schools GEO数据分析-Part1

阅读更多

     由于从事人工智能的工作,接下来打算分享一系列的以案例形式的人工智能、

    数据分析的博客文章。欢迎大家持续关注。本次我来分享一个数据分析的案例

  

项目目标:

      

      Boston Public Schools Geo数据是来自于Boston地区的公共学校的数据,具体描述了学校的坐标,名字,类型等。基于此数据,我们可以学习一些基本的Python数据分析的方法。例如,研究学校的分布情况,类型统计等。

 

数据集介绍:

 

   数据集的介绍如下,其中比较重要的字段有X,Y坐标,ADDRESS地址,ZIPCODE,School类型

 

 

Data columns (total 21 columns):

X 131 non-null float64

Y 131 non-null float64

OBJECTID_1 131 non-null int64

OBJECTID 131 non-null int64

BLDG_ID 131 non-null int64

BLDG_NAME 131 non-null object

ADDRESS 131 non-null object

CITY 131 non-null object

ZIPCODE 131 non-null int64

CSP_SCH_ID 131 non-null int64

SCH_ID 131 non-null int64

SCH_NAME 131 non-null object

SCH_LABEL 131 non-null object

SCH_TYPE 131 non-null object

SHARED 131 non-null object

COMPLEX 131 non-null object

Label 131 non-null int64

TLT 131 non-null int64

PL 131 non-null object

POINT_X 131 non-null float64

POINT_Y 131 non-null float64

 

 

 

关键代码实现:

 

  1.     加载数据

      

schools = pd.read_csv('../input/Public_Schools.csv')
schools.info()

 

 

    可以看到数据字段如下,一共有21个字段,其中有9个Object类型,4个float64, 8个int64

    

<class 'pandas.core.frame.DataFrame'>

RangeIndex: 131 entries, 0 to 130

Data columns (total 21 columns):

X 131 non-null float64

Y 131 non-null float64

OBJECTID_1 131 non-null int64

OBJECTID 131 non-null int64

BLDG_ID 131 non-null int64

BLDG_NAME 131 non-null object

ADDRESS 131 non-null object

CITY 131 non-null object

ZIPCODE 131 non-null int64

CSP_SCH_ID 131 non-null int64

SCH_ID 131 non-null int64

SCH_NAME 131 non-null object

SCH_LABEL 131 non-null object

SCH_TYPE 131 non-null object

SHARED 131 non-null object

COMPLEX 131 non-null object

Label 131 non-null int64

TLT 131 non-null int64

PL 131 non-null object

POINT_X 131 non-null float64

POINT_Y 131 non-null float64

dtypes: float64(4), int64(8), object(9)

memory usage: 21.6+ KB

 

 

2.接下来,探索数据的缺失值

    

schools.isnull().any() 

 

 

   可以看到,数据没有缺失值

 

   

1 X False

 2 Y False

 3 OBJECTID_1 False

 4 OBJECTID False

 5 BLDG_ID False

 6 BLDG_NAME False

 7 ADDRESS False

 8 CITY False

 9 ZIPCODE False

10 CSP_SCH_ID False

11 SCH_ID False

12 SCH_NAME False

13 SCH_LABEL False

14 SCH_TYPE False

15 SHARED False

16 COMPLEX False

17 Label False

18 TLT False

19 PL False

20 POINT_X False

21 POINT_Y False

22 dtype: bool

 

 

    接下来,Count frequency of schools in each city

    

1 schools_per_city = schools['CITY'].value_counts()
2 sns.set()
3 plt.rcParams['figure.figsize'] = [20, 7]
4 sns.barplot(x=schools_per_city.index, y=schools_per_city.get_values())


 

    

 

       可以看到不同地区的公立学校不同数量,Boston接近15所。

 

      按照ZIPCode统计学校情况 : 其中sns 为seaborn包

     

school_zipcode = schools['ZIPCODE'].value_counts() sns.set() 
sns.barplot(x=school_zipcode.index, y=school_zipcode.get_values())

 

 


 

 

     可以看到随着zipcode的变化,学校数量也是发生变化的。

     未完待续~  欢迎大家关注我的公众号,“思享会Club”,获取该内容资源。欢迎大家访问http://gkhelp.cn 获取更多项目。个人公众号图片如下:

     

 

  • 大小: 13.2 KB
  • 大小: 9.1 KB
  • 大小: 28.1 KB
0
0
分享到:
评论

相关推荐

    Python数据分析实战源代码

    Python数据分析实战源代码是针对那些想要深入理解和应用Python进行数据处理和分析的初学者和专业人士的宝贵资源。这个综合性的教程共分为六个章节,每个章节都涵盖了数据分析过程中的一个重要环节,确保学习者能够...

    Python 数据分析与挖掘实战-张良均-数据集

    1. **Python基础**:在进行数据分析之前,你需要熟悉Python的基本语法和常用库,如NumPy、Pandas和Matplotlib。NumPy提供了强大的数组和矩阵运算,Pandas是数据操作和分析的核心库,而Matplotlib则用于数据可视化。 ...

    Python数据分析实战 内利著 学习笔记

    Python数据分析实战 内利著 学习笔记 Python数据分析实战 内利著 学习笔记 Python数据分析实战 内利著 学习笔记 Python数据分析实战 内利著 学习笔记 Python数据分析实战 内利著 学习笔记 Python数据分析实战 内利著...

    基于python数据分析-探索电影数据集.zip

    探索电影数据集.zip基于python数据分析-探索电影数据集.zip基于python数据分析-探索电影数据集.zip基于python数据分析-探索电影数据集.zip基于python数据分析-探索电影数据集.zip基于python数据分析-探索电影数据集....

    Python数据分析案例-药店销售数据分析.pdf

    "Python数据分析案例-药店销售数据分析.pdf" 本篇文章主要讲述了Python数据分析的案例,通过对朝阳医院2018年销售数据的分析,了解朝阳医院的患者的月均消费次数、月均消费金额、客单价以及消费趋势、需求量前几位...

    Python气象数据分析--《Python 数据分析实战》-内含源码以及设计说明书(可以自己运行复现).zip

    在本资源中,我们主要探讨的是使用Python进行气象数据分析的主题,源自《Python数据分析实战》一书。这本书通过实例和源代码的方式,引导读者深入理解如何利用Python强大的数据处理能力来处理气象领域的复杂数据。...

    Python数据分析实战源码.zip

    Python数据分析实战源码.zip是一个包含Python编程语言的数据分析实践项目的压缩包。这个资源可能是与《Python数据分析实战(第2版)》这本书相关的配套代码。在深入解析这些源码之前,让我们先了解一下Python在数据...

    Python数据分析库--Pandas视频教程

    Python数据分析库--Pandas视频教程,pandas 是基于NumPy 的一种工具,该工具是为了解决数据分析任务而创建的。Pandas 纳入了大量库和一些标准的数据模型,提供了高效地操作大型数据集所需的工具。pandas提供了大量能...

    Python数据清洗实战-英国电商公司销售数据

    Python数据清洗实战-英国电商公司销售数据

    python_geohash-0.8.5-cp310-cp310-win_amd64.whl.zip

    标题中的“python_geohash-0.8.5-cp310-cp310-win_amd64.whl.zip”是一个Python软件包的压缩文件,它包含了...因此,了解并熟练掌握Python Geohash库的使用对于进行地理位置相关的数据分析和应用开发是非常有益的。

    python项目数据分析--人口普查

    1. **Python编程基础**:Python是数据科学领域广泛使用的语言,其简洁的语法和丰富的库使其成为数据分析的理想选择。在这个项目中,我们需要熟悉Python的基本语法,如变量、控制流、函数和模块。 2. **数据导入与...

    Python数据分析库--Pandas视频教程.rar

    Python数据分析库--Pandas视频教程,pandas 是基于NumPy 的一种工具,该工具是为了解决数据分析任务而创建的。Pandas 纳入了大量库和一些标准的数据模型,提供了高效地操作大型数据集所需的工具。 pandas提供了大量...

    python_geohash-0.8.5-cp39-cp39-win_amd64.whl.zip

    标题中的"python_geohash-0.8.5-cp39-cp39-win_amd64.whl.zip"表明这是一个与Python相关的压缩包,其中包含了一个名为"python_geohash-0.8.5-cp39-cp39-win_amd64.whl"的文件,这个文件是Python的轮子(wheel)格式...

    Python数据分析与挖掘实战_PPT课件.zip

    1. **第2章 Python数据分析简介**:本章主要介绍Python作为数据分析工具的优势,包括其丰富的库支持(如NumPy、Pandas和Matplotlib)以及数据操作的基本语法。此外,还会讲解如何安装和配置Python环境,以及如何导入...

    python_geohash-0.8.5-cp37-cp37m-win_amd64

    python_geohash-0.8.5-cp37-cp37m-win_amd64

    python_geohash-0.8.5-cp39-cp39-win_amd64

    python_geohash-0.8.5-cp39-cp39-win_amd64

    【Python-数据分析-1】Python数据分析概述37页 PPT.ppt

    ### Python 数据分析概述 #### 一、数据分析定义与范畴 - **广义的数据分析**:包含狭义的数据分析和数据挖掘。 - **狭义数据分析**:基于特定目标,运用对比、分组、交叉及回归等多种分析手段处理数据,提取有...

    《Python数据分析与挖掘实战》-PPT.zip

    《Python数据分析与挖掘实战》是一本深入探讨Python在数据处理领域的专著,其PPT版本提供了清晰、详尽的教程,适合对数据科学感兴趣的初学者和专业人士。通过这份PPT,学习者可以了解到如何利用Python进行高效的数据...

    Python数据分析案例实战-教学大纲.docx

    Python数据分析案例实战教学大纲 本课程大纲旨在培养学生使用 Python 进行数据分析、可视化、处理和建模的实践能力,通过学习 Python 数据分析的基础知识和实践案例,学生将掌握使用 Python 实现数据分析、可视化和...

Global site tag (gtag.js) - Google Analytics