Atypical 2023. 1. 15. 21:56

df.loc[df.TotalCharges.str.contains('\d')] : 7032 rows × 21 columns

df.loc[df.TotalCharges.str.contains('\D')] : 6719 rows × 21 columns
  • \d: 숫자와 매치, [0-9]와 동일한 표현식
  • \D: 숫자 아닌 것과 매치, [^0-9]와 동일한 표현식

인덱스를 보니 그냥 둘이 비슷하게 나옴. 중복도 나오고.

str에서 float으로 변환못하는건 ''라고 했는데..

 

Change Empty TotalCharges to 0

df.loc[df.index[df.TotalCharges.str.contains("\s")], "TotalCharges"] = 0

#또는

df.TotalCharges.replace(to_replace = "\s", value = 0, inplace=True, regex=True)