加入收藏 | 设为首页 | 会员中心 | 我要投稿 晋中站长网 (https://www.0354zz.com/)- 科技、建站、经验、云计算、5G、大数据,站长网!
当前位置: 首页 > 运营中心 > 网站设计 > 教程 > 正文

一文看懂怎么用Python做数据分析

发布时间:2019-06-26 22:03:24 所属栏目:教程 来源:程序员ACE
导读:常遇到两类朋友。一类是会爬虫但不知道如何进一步做数据分析的,一类是平常用 Excel 做分析但不太会用 Python 分析的。如果和你很像,那下面这篇系统长文会很适合你,建议先收藏。 Excel 是数据分析中最常用的工具,本文通过 Python 与 excel 的功能对比介

使用冒号可以限定提取数据的范围,冒号前面为开始的标签值,后面为结束的标签值。下面提取了 0 到 5 的数据行。

  1. #按索引提取区域行数值 
  2. df_inner.loc[0:5] 
一文看懂怎么用 Python 做数据分析

Reset_index 函数用于恢复索引,这里我们重新将 date 字段的日期设置为数据表的索引,并按日期进行数据提取。

  1. #重设索引 
  2. df_inner.reset_index() 
一文看懂怎么用 Python 做数据分析
  1. #设置日期为索引 
  2. df_inner=df_inner.set_index('date') 
一文看懂怎么用 Python 做数据分析

使用冒号限定提取数据的范围,冒号前面为空表示从 0 开始。提取所有 2013 年 1 月 4 日以前的数据。

  1. #提取4日之前的所有数据 
  2. df_inner[:'2013-01-04'] 
一文看懂怎么用 Python 做数据分析

按位置提取(iloc)

使用 iloc 函数按位置对数据表中的数据进行提取,这里冒号前后的数字不再是索引的标签名称,而是数据所在的位置,从 0 开始。

  1. #使用iloc按位置区域提取数据 
  2. df_inner.iloc[:3,:2] 
一文看懂怎么用 Python 做数据分析

iloc 函数除了可以按区域提取数据,还可以按位置逐条提取,前面方括号中的 0,2,5 表示数据所在行的位置,后面方括号中的数表示所在列的位置。

  1. #使用iloc按位置单独提取数据 
  2. df_inner.iloc[[0,2,5],[4,5]] 
一文看懂怎么用 Python 做数据分析

按标签和位置提取(ix)

ix 是 loc 和 iloc 的混合,既能按索引标签提取,也能按位置进行数据提取。下面代码中行的位置按索引日期设置,列按位置设置。

  1. #使用ix按索引标签和位置混合提取数据 
  2. df_inner.ix[:'2013-01-03',:4] 
一文看懂怎么用 Python 做数据分析

按条件提取(区域和条件值)

除了按标签和位置提起数据以外,还可以按具体的条件进行数据。下面使用 loc 和 isin 两个函数配合使用,按指定条件对数据进行提取 。

使用 isin 函数对 city 中的值是否为 beijing 进行判断。

  1. #判断city列的值是否为beijing 
  2. df_inner['city'].isin(['beijing']) 
  3.   
  4. date 
  5. 2013-01-02 True 
  6. 2013-01-05 False 
  7. 2013-01-07 True 
  8. 2013-01-06 False 
  9. 2013-01-03 False 
  10. 2013-01-04 False 
  11. Name: city, dtype: bool 

将 isin 函数嵌套到 loc 的数据提取函数中,将判断结果为 Ture 数据提取出来。这里我们把判断条件改为 city 值是否为 beijing 和 shanghai。如果是就把这条数据提取出来。

  1. #先判断city列里是否包含beijing和shanghai,然后将复合条件的数据提取出来。 
  2. df_inner.loc[df_inner['city'].isin(['beijing','shanghai'])] 
一文看懂怎么用 Python 做数据分析

(编辑:晋中站长网)

【声明】本站内容均来自网络,其相关言论仅代表作者个人观点,不代表本站立场。若无意侵犯到您的权利,请及时与联系站长删除相关内容!

热点阅读