`
shaojiashuai123456
  • 浏览: 262681 次
  • 性别: Icon_minigender_1
  • 来自: 吉林
社区版块
存档分类
最新评论

python pandas

 
阅读更多
import sys
from pandas import Series,DataFrame
import pandas as pd
import numpy as np
import matplotlib.pyplot as plt
from sklearn import preprocessing

plt.rcParams['font.sans-serif']=['SimHei'] #用来正常显示中文标签
plt.rcParams['axes.unicode_minus']=False #用来正常显示负号
data = pd.read_csv("./train_samples_all.csv")

x = np.array(data[["dis","time"]])
scaler = preprocessing.StandardScaler().fit(np.array(x))
#print scaler.mean_
#print scaler.scale_

data["l_num"] = data.apply(lambda x:x["num1"]*0.5 + x["num2"], axis=1)

data_true = data[(data.label == 1)]      #过滤特征
data_false = data[(data.label == 0)]

true_des = data_true.describe()
false_des = data_false.describe()

dd = data.describe()
print dd.to_dict()

 

from scipy import stats, integrate
import seaborn as sns
sns.set(color_codes=True)
sns.pairplot(data[["label","dis","time"]],hue="label") #查看两两特征

 

#遍历dataframe
df = pd.read_csv(self.ifn)
for index, row in df.iterrows():
    print index,row

 

plt.figure(figsize=(10, 5))
plt.xticks(np.arange(0,3000,200))
plt.xlim((0,4000))
sns.distplot(data_true["dis"],kde=True,bins = 50,kde_kws={"lw": 4, "label": "true","alpha":0.4})
sns.distplot(data_false["dis"],kde=True,bins = 50,kde_kws={"lw": 3, "label": "false","alpha":0.4})

 

分享到:
评论

相关推荐

    python pandas 官网文档

    python pandas 官网文档 2000多页 目录包括: 1-What's New 2-Installation 3-Contributing to pandas 4-Package overview 【*】5-10 Minutes to pandas 【*】6-Tutorials 【*】7-Cookbook 【*】8-Intro to Data ...

    Python pandas 数据清洗 基础教程

    Python pandas 数据清洗基础教程 Python pandas 是一个非常流行的数据处理库,它提供了许多强大的功能来处理和分析数据。在数据处理过程中,数据清洗是一个非常重要的步骤,它可以帮助我们将原始数据转换为可以用于...

    数据分析excel python pandas教程及相关例子源码.zip

    数据分析excel python pandas教程及相关例子源码.zip pandas 是基于NumPy 的一种工具,该工具是为解决数据分析任务而创建的。Pandas 纳入了大量库和一些标准的数据模型,提供了高效地操作大型数据集所需的工具。...

    Python Pandas使用教程

    Python Pandas 使用教程 Python Pandas 是一种功能强大的 Python 数据分析工具包,由 Wes McKinney 和 Pandas 开发团队开发,最新版本为 1.4.2,发布于 2022 年 4 月 2 日。 安装 要开始使用 Pandas,首先需要...

    Python 解决pandas.to-excel()函数覆盖原有Sheet页的问题 Python源码

    Python 解决pandas.to_excel()函数覆盖原有Sheet页的问题 Python源码Python 解决pandas.to_excel()函数覆盖原有Sheet页的问题 Python源码Python 解决pandas.to_excel()函数覆盖原有Sheet页的问题 Python源码Python ...

    python pandas说明文档

    ### Python Pandas 0.18.0 官方说明文档关键知识点解析 #### 一、概述 Python Pandas 是一款强大的数据处理与分析工具包,由 Wes McKinney 创建,并得到了 PyData 开发团队的支持。Pandas 的核心功能在于提供高...

    Python pandas怎么使用.docx

    ### Python Pandas 使用详解 #### 一、简介 Pandas 是 Python 编程语言中一个非常重要的数据分析库,它提供了一系列高效的数据处理和分析工具。Pandas 的核心数据结构包括 Series(一维数组)和 DataFrame(二维...

    Python pandas EPD Anaconda安装说明

    ### Python pandas EPD Anaconda 安装说明 #### 一、EPD+Pandas安装步骤详解 ##### 1. 下载并安装EPD Free EPD (Enthought Python Distribution) 是一个面向科学计算领域的 Python 发行版,包含了大量用于数据...

    基于python pandas数据分析基础demo

    在数据分析领域,Python的pandas库是不可或缺的工具,它为数据处理提供了高效且易用的接口。本项目“基于python pandas数据分析基础demo”旨在通过一个实际案例介绍pandas的基本用法,特别是针对数据清洗、探索性...

    python pandas库的golang版本的整合

    python pandas库的golang版本的整合 介绍 golang版本的pandas 2. 功能/模块划分 参考的代码: https://github.com/go-gota/gota https://github.com/WinPooh32/series ...

    python pandas模块使用笔记

    python pandas模块使用笔记 包含可运行代码

    Python Pandas Cheat Sheet (DQ).pdf

    Python Pandas Cheat Sheet DQ版 Pandas速查手册DQ版

    Python pandas 库的使用方法.zip

    Python pandas 库的使用方法熊猫食谱使用 Jupyter Lite 在浏览器中尝试一下pandas是一个用于数据分析的 Python 库。它非常快,可以让你以极快的速度进行探索性工作。本指南的目的是为您提供一些关于如何开始使用 ...

    python——pandas总结1

    ### Python Pandas 基本用法和例程详解 #### 一、Pandas概述 Pandas 是 Python 中用于数据分析和处理的一种强大的库。它基于 NumPy 构建,提供了非常灵活高效的 DataFrame 和 Series 数据结构,能够高效地处理各种...

    python pandas数值转换

    python pandas数值转换

    Python-pandas基础习题与答案

    ### Python-pandas基础习题与答案 #### 一、题目解析及知识点概述 根据题目描述,这份材料主要涉及Python中的pandas库的基础操作,包括数据读取、数据处理、数据分析等多个方面。通过这些习题,我们可以了解到如何...

    B站 Python Pandas 数据分析,编程练习100例

    在"B站 Python Pandas 数据分析,编程练习100例"这个主题中,我们主要探讨的是如何使用Python的Pandas库进行数据处理和分析。Pandas是Python中一个强大的数据分析工具,它提供了丰富的数据结构(如DataFrame和Series...

    pandas题目练习(Python Pandas 数据分析,编程练习100例).zip

    【Python Pandas 数据分析】 Pandas是Python编程中用于数据处理和分析的重要库,它提供了高效的数据结构,如DataFrame和Series,使得数据清洗、转换、聚合等操作变得简单易行。Pandas库的设计目标是使数据科学家...

    python pandas测试数据集

    python pandas测试数据集

Global site tag (gtag.js) - Google Analytics