pandas の read_csv でどのようなデータが空データになるか検証を行いました。
入力情報
検証したいこと
- ダブルクォーテーション(")のみ
- シングルクォーテーション(')のみ
- 空
- 半角スペースのみ
- 全角スペースのみ
csv
$ cat sample.csv 1,1-1,"1-2" 2,"",'', 3,, 4, , ,hoge
コード
$ python Python 3.11.3 (main, Apr 17 2023, 18:50:53) [GCC 11.3.0] on linux Type "help", "copyright", "credits" or "license" for more information. >>> import pandas as pd >>> df = pd.read_csv('./sample.csv') >>> df 1 1-1 1-2 2 NaN '' NaN 3 NaN NaN NaN 4 hoge >>> exit()
結果
- ダブルクォーテーション(")で囲まれている:空データとして扱われる
- シングルクォーテーション(')で囲まれている:空データとして扱われる
- 空: 空データとして扱われる
- 半角スペース: 空データではない
- 全角スペース: 空データではない
値がある(空白だけを含む)場合は,空データとNullデータを区別をしないため,Nullデータとして扱われませんでした。