Excel 中通过选中单元格并查看开始菜单中的数值类型来判断数据的格式。Python 中使用 dtypes 函数来返回数据格式。
Dtypes 是一个查看数据格式的函数,可以一次性查看数据表中所有数据的格式,也可以指定一列来单独查看。
- #查看数据表各列格式
- df.dtypes
-
- id int64
- date datetime64[ns]
- city object
- category object
- age int64
- price float64
- dtype: object
- #查看单列格式
- df['B'].dtype
-
- dtype('int64')
查看空值
Excel 中查看空值的方法是使用“定位条件”功能对数据表中的空值进行定位。“定位条件”在“开始”目录下的“查找和选择”目录中。
Isnull 是 Python 中检验空值的函数,返回的结果是逻辑值,包含空值返回 True,不包含则返回 False。可以对整个数据表进行检查,也可以单独对某一列进行空值检查。
- #检查数据空值
- df.isnull()
- #检查特定列空值
- df['price'].isnull()
-
- 0 False
- 1 True
- 2 False
- 3 False
- 4 True
- 5 False
- Name: price, dtype: bool
查看唯一值
Excel 中查看唯一值的方法是使用“条件格式”对唯一值进行颜色标记。Python 中使用 unique 函数查看唯一值。
Unique 是查看唯一值的函数,只能对数据表中的特定列进行检查。下面是代码,返回的结果是该列中的唯一值。类似与 Excel 中删除重复项后的结果。
- #查看city列中的唯一值
- df['city'].unique()
-
- array(['Beijing ', 'SH', ' guangzhou ', 'Shenzhen', 'shanghai', 'BEIJING '], dtype=object)
查看数据表数值
Python 中的 Values 函数用来查看数据表中的数值。以数组的形式返回,不包含表头信息。
- #查看数据表的值
- df.values
-
- array([[1001, Timestamp('2013-01-02 00:00:00'), 'Beijing ', '100-A', 23,
- 1200.0],
- [1002, Timestamp('2013-01-03 00:00:00'), 'SH', '100-B', 44, nan],
- [1003, Timestamp('2013-01-04 00:00:00'), ' guangzhou ', '110-A', 54,
- 2133.0],
- [1004, Timestamp('2013-01-05 00:00:00'), 'Shenzhen', '110-C', 32,
- 5433.0],
- [1005, Timestamp('2013-01-06 00:00:00'), 'shanghai', '210-A', 34,
- nan],
- [1006, Timestamp('2013-01-07 00:00:00'), 'BEIJING ', '130-F', 32,
- 4432.0]], dtype=object)
查看列名称 (编辑:晋中站长网)
【声明】本站内容均来自网络,其相关言论仅代表作者个人观点,不代表本站立场。若无意侵犯到您的权利,请及时与联系站长删除相关内容!
|