Ethan's Values
Pandas study - pandas 튜토리얼(1) 본문
반응형
Pandas는 어떤 종류의 데이터를 처리하나요?
판다스 구조
DataFrame은 2차원 데이터 구조이다.
각열은 DataFrame안에 있고, 각각 Series이다.
df['Age]
각 컬럼에 접근할 때는 아래와 같은 코드를 사용해 접근함
그 결과의 형태는 Series다.
Series를 처음부터 만들 수 있다.
DataFrame & Series 시작하기
승객의 최대 연령을 알고자 할 때 아래코드와 같이 DataFrame.max()를 하거나 Series.max() 함수로 사용 가능하다.
#DataFrame에서 최대 연령 검색시
df["Age"].max()
#Series에서 최대 연령 검색시
ages.max()
테이블의 기본적인 통계값을 알고자 할 때 describe()함수를 사용하여 count, mean, std 와 같은 통계값을 확인할 수 있다.
단, 테이블에서 numeric한 데이터의 통계만 검색한다. 텍스트 데이터인 Name, Sex열에 대해서는 반환되지 않는다.
In : df.describe()
Out:
Age
count 3.000000
mean 38.333333
std 18.230012
min 22.000000
25% 28.500000
50% 35.000000
75% 46.500000
max 58.000000
REMEMBER
1. pandas는 import pandas as pd로 패키지 IMPORT
2. 각 Dataframe은 Series
3. DataFrame 이나 Series는 함수를 붙여서 사용할 수 있다.
'Python' 카테고리의 다른 글
Pandas study - pandas 튜토리얼(6) (2) | 2023.10.19 |
---|---|
Pandas study - pandas 튜토리얼(5) (0) | 2023.10.19 |
Pandas study - pandas 튜토리얼(4) (0) | 2023.10.19 |
Pandas study - pandas 튜토리얼(3) (2) | 2023.10.19 |
Pandas study - pandas 튜토리얼(2) (0) | 2023.10.19 |
Comments