Python プログラミング

Pandasで欠損値があるか確認する

読み込んだデータの各カラム(特徴量)の中に、それぞれどの程度欠損値が存在するか確認する方法のメモ。

(Kaggleタイタニックの訓練データの例で出力値を記載します。train=訓練データのCSVを読み込んだデータフレーム)

 

 

 

1つでも欠損値が存在するか確認

train.isnull().any()
PassengerId    False
Survived       False
Pclass         False
Name           False
Sex            False
Age             True
SibSp          False
Parch          False
Ticket         False
Fare           False
Cabin           True
Embarked        True
dtype: bool

 

欠損値の個数を確認

train.isnull().sum()

PassengerId      0
Survived         0
Pclass           0
Name             0
Sex              0
Age            177
SibSp            0
Parch            0
Ticket           0
Fare             0
Cabin          687
Embarked         2
dtype: int64

-Python, プログラミング
-, ,

© 2020 クラインの備忘壺