ものづくりのブログ

うちのネコを題材にしたものづくりができたらいいなと思っていろいろ奮闘してます。

【pandas】read_csv でどのようなデータが空データになるか検証

pandas の read_csv でどのようなデータが空データになるか検証を行いました。

入力情報

検証したいこと

  • ダブルクォーテーション(")のみ
  • シングルクォーテーション(')のみ
  • 半角スペースのみ
  • 全角スペースのみ

csv

$ cat sample.csv
1,1-1,"1-2"
2,"",'',
3,,
4, , ,hoge

コード

$ python              
Python 3.11.3 (main, Apr 17 2023, 18:50:53) [GCC 11.3.0] on linux
Type "help", "copyright", "credits" or "license" for more information.
>>> import pandas as pd
>>> df = pd.read_csv('./sample.csv')
>>> df
     1  1-1   1-2
2  NaN   ''   NaN
3  NaN  NaN   NaN
4            hoge
>>> exit()

結果

  • ダブルクォーテーション(")で囲まれている:空データとして扱われる
  • シングルクォーテーション(')で囲まれている:空データとして扱われる
  • 空: 空データとして扱われる
  • 半角スペース: 空データではない
  • 全角スペース: 空データではない

値がある(空白だけを含む)場合は,空データとNullデータを区別をしないため,Nullデータとして扱われませんでした。