반응형
Notice
Recent Posts
Recent Comments
Link
«   2025/04   »
1 2 3 4 5
6 7 8 9 10 11 12
13 14 15 16 17 18 19
20 21 22 23 24 25 26
27 28 29 30
Tags
more
Archives
Today
Total
관리 메뉴

Ethan's Values

Pandas study - pandas 튜토리얼(1) 본문

Python

Pandas study - pandas 튜토리얼(1)

Ethan_hyk 2023. 10. 18. 18:49
반응형

Pandas는 어떤 종류의 데이터를 처리하나요? 

판다스 구조

 

DataFrame은 2차원 데이터 구조이다.

각열은 DataFrame안에 있고, 각각 Series이다.

df['Age]

각 컬럼에 접근할 때는 아래와 같은 코드를 사용해 접근함

그 결과의 형태는 Series다.

 

Series를 처음부터 만들 수 있다.

DataFrame & Series 시작하기

승객의 최대 연령을 알고자 할 때 아래코드와 같이  DataFrame.max()를 하거나 Series.max() 함수로 사용 가능하다.

#DataFrame에서 최대 연령 검색시
df["Age"].max()

#Series에서 최대 연령 검색시
ages.max()

테이블의 기본적인 통계값을 알고자 할 때 describe()함수를 사용하여 count, mean, std 와 같은 통계값을 확인할 수 있다.

단, 테이블에서 numeric한 데이터의 통계만 검색한다. 텍스트 데이터인 Name, Sex열에 대해서는 반환되지 않는다.

In : df.describe()
Out: 
             Age
count   3.000000
mean   38.333333
std    18.230012
min    22.000000
25%    28.500000
50%    35.000000
75%    46.500000
max    58.000000
REMEMBER
1. pandas는 import pandas as pd로 패키지 IMPORT
2. 각 Dataframe은 Series
3. DataFrame 이나 Series는 함수를 붙여서 사용할 수 있다.

 

Comments