DataSet1 인도네시아 School Dataset 캐글에서 구한 이 데이터셋은, 인도네시아 내에 있는 학교의 정보를 갖고 있다. 딱히 피쳐가 많지 않고, 유의미한 데이터가 없어 어떠한 EDA를 할 수 있을까 고민해봤는데, 결론 역시 뭐 특별한게 떠오르지는 않았다. 일단, data의 피처는 다음과 같다. 피처의 항목을 자세히 보면, id와 name이라는 컬럼은 서로 다른 데이터를 갖고 있지만, 의미적으로 보면 중복되는 컬럼이다. 데이터의 shape이 13개의 컬럼을 갖고 있다 할지라도 결국엔, 10의 컬럼이라 보는게 맞다. province_name 별로 학교의 수를 파악해 봤다. 특정 지방에서 압도적인 학교의 수가 몰려 있음을 확인할 수 있다. 아마도 이 지방에서의 인구 수 역시 많지 않을까 한다. 세군데의 province를 뽑아보자면, 'Jawa Bar.. 2022. 11. 23. 이전 1 다음