`

pandas交集、差集、并集

 
阅读更多

      python3使用pandas进行数据的整合。有时候需要取交集、差集、并集。

 

 

# coding:utf-8

import nothing as my_project
import pandas as pd


def get_data():
    file_1 = my_project.project_root + '/resources/' + '1_uniq.txt'
    file_2 = my_project.project_root + '/resources/' + '2_uniq.txt'

    # 加一个额外列
    order_id_me = pd.read_table(file_1, names=['order_id'])
    order_id_me['v1'] = order_id_me.apply(lambda x: 1, axis=1)
    order_id_you = pd.read_table(file_2, names=['order_id'])
    order_id_you['v2'] = order_id_you.apply(lambda x: 2, axis=1)

    # 并集
    union_set = pd.merge(order_id_you, order_id_me, how='outer')
    # 差集
    difference_set = union_set[(union_set['v1'].isnull()) | (union_set['v2'].isnull())]
    # 交集
    intersection_set = union_set[(union_set['v1'].notnull()) & (union_set['v2'].notnull())]

 

     以上代码只针对某些特定的情况,主旨是灵活运用merge函数里的how参数。

 

分享到:
评论

相关推荐

    技巧篇:pyspark常用操作梳理

    pyspark常用操作梳理 基于spark.sql进行操作 创建临时表 创建临时视图 基于dataframe进行操作 了解表结构 查看数据 查看列名 持久化 列操作 列名称重命名 ... 利用pandas取差集、交集和并集

    geopandas-0.12.1.tar.gz

    它提供了丰富的空间操作函数,如缓冲区分析、交集、并集、差集等,使得用户可以方便地进行地理空间数据分析。 3. 数据可视化 GeoPandas内置了数据可视化功能,可以绘制地理空间数据的地图。用户可以使用matplotlib...

    geopandas-0.7.0.tar.gz

    它提供了丰富的空间操作函数,如缓冲区分析、交集、并集、差集等,使得用户可以方便地进行地理空间数据分析。 3. 数据可视化 GeoPandas内置了数据可视化功能,可以绘制地理空间数据的地图。用户可以使用matplotlib...

    geopandas-0.11.0.tar.gz

    它提供了丰富的空间操作函数,如缓冲区分析、交集、并集、差集等,使得用户可以方便地进行地理空间数据分析。 3. 数据可视化 GeoPandas内置了数据可视化功能,可以绘制地理空间数据的地图。用户可以使用matplotlib...

    geopandas-0.10.2.tar.gz

    它提供了丰富的空间操作函数,如缓冲区分析、交集、并集、差集等,使得用户可以方便地进行地理空间数据分析。 3. 数据可视化 GeoPandas内置了数据可视化功能,可以绘制地理空间数据的地图。用户可以使用matplotlib...

    geopandas-0.10.0.tar.gz

    它提供了丰富的空间操作函数,如缓冲区分析、交集、并集、差集等,使得用户可以方便地进行地理空间数据分析。 3. 数据可视化 GeoPandas内置了数据可视化功能,可以绘制地理空间数据的地图。用户可以使用matplotlib...

    geopandas-0.9.0.tar.gz

    它提供了丰富的空间操作函数,如缓冲区分析、交集、并集、差集等,使得用户可以方便地进行地理空间数据分析。 3. 数据可视化 GeoPandas内置了数据可视化功能,可以绘制地理空间数据的地图。用户可以使用matplotlib...

    geopandas-0.6.1.tar.gz

    它提供了丰富的空间操作函数,如缓冲区分析、交集、并集、差集等,使得用户可以方便地进行地理空间数据分析。 3. 数据可视化 GeoPandas内置了数据可视化功能,可以绘制地理空间数据的地图。用户可以使用matplotlib...

    geopandas-0.13.0.tar.gz

    它提供了丰富的空间操作函数,如缓冲区分析、交集、并集、差集等,使得用户可以方便地进行地理空间数据分析。 3. 数据可视化 GeoPandas内置了数据可视化功能,可以绘制地理空间数据的地图。用户可以使用matplotlib...

    geopandas-1.0.0rc1.tar.gz

    它提供了丰富的空间操作函数,如缓冲区分析、交集、并集、差集等,使得用户可以方便地进行地理空间数据分析。 3. 数据可视化 GeoPandas内置了数据可视化功能,可以绘制地理空间数据的地图。用户可以使用matplotlib...

    geopandas-0.8.2.tar.gz

    它提供了丰富的空间操作函数,如缓冲区分析、交集、并集、差集等,使得用户可以方便地进行地理空间数据分析。 3. 数据可视化 GeoPandas内置了数据可视化功能,可以绘制地理空间数据的地图。用户可以使用matplotlib...

    geopandas-0.12.0.tar.gz

    它提供了丰富的空间操作函数,如缓冲区分析、交集、并集、差集等,使得用户可以方便地进行地理空间数据分析。 3. 数据可视化 GeoPandas内置了数据可视化功能,可以绘制地理空间数据的地图。用户可以使用matplotlib...

    geopandas-0.8.1.tar.gz

    它提供了丰富的空间操作函数,如缓冲区分析、交集、并集、差集等,使得用户可以方便地进行地理空间数据分析。 3. 数据可视化 GeoPandas内置了数据可视化功能,可以绘制地理空间数据的地图。用户可以使用matplotlib...

    geopandas-0.14.2.tar.gz

    它提供了丰富的空间操作函数,如缓冲区分析、交集、并集、差集等,使得用户可以方便地进行地理空间数据分析。 3. 数据可视化 GeoPandas内置了数据可视化功能,可以绘制地理空间数据的地图。用户可以使用matplotlib...

    geopandas-0.14.1.tar.gz

    它提供了丰富的空间操作函数,如缓冲区分析、交集、并集、差集等,使得用户可以方便地进行地理空间数据分析。 3. 数据可视化 GeoPandas内置了数据可视化功能,可以绘制地理空间数据的地图。用户可以使用matplotlib...

    geopandas-0.11.1.tar.gz

    它提供了丰富的空间操作函数,如缓冲区分析、交集、并集、差集等,使得用户可以方便地进行地理空间数据分析。 3. 数据可视化 GeoPandas内置了数据可视化功能,可以绘制地理空间数据的地图。用户可以使用matplotlib...

    geopandas-0.6.3.tar.gz

    它提供了丰富的空间操作函数,如缓冲区分析、交集、并集、差集等,使得用户可以方便地进行地理空间数据分析。 3. 数据可视化 GeoPandas内置了数据可视化功能,可以绘制地理空间数据的地图。用户可以使用matplotlib...

    geopandas-0.6.2.tar.gz

    它提供了丰富的空间操作函数,如缓冲区分析、交集、并集、差集等,使得用户可以方便地进行地理空间数据分析。 3. 数据可视化 GeoPandas内置了数据可视化功能,可以绘制地理空间数据的地图。用户可以使用matplotlib...

    geopandas-0.14.0.tar.gz

    它提供了丰富的空间操作函数,如缓冲区分析、交集、并集、差集等,使得用户可以方便地进行地理空间数据分析。 3. 数据可视化 GeoPandas内置了数据可视化功能,可以绘制地理空间数据的地图。用户可以使用matplotlib...

Global site tag (gtag.js) - Google Analytics