반응형
06. 판다스 데이터프레임(Pandas DataFrame) 만드는 3가지 방법
0) 사용 이유
- 2차원 데이터를 다루기 위하여 사용
- 시리즈는 1차원 데이터만 사용 가능
- R의 DataFrame을 참고해서 만듬 -> 데이터 편집, 관리에 용의
1) 기본 코드
import pandas as pd
#딕셔너리 사용
data1 = {'제품명': ['새우깡', '양파링', '계란과자'],
'유통기한': ['2022-11-01', '2023-01-31', '2022-06-03'],
'판매가' : [1600, 1200, 1400]}
df1 = pd.DataFrame(data=data1)
print(df1)
#리스트 사용
data2 = [['새우깡', '2022-11-01', 1600],
['양파링', '2023-01-31', 1200],
['계란과자', '2022-06-03', 1400]]
columns2 = ['제품명', '유통기한', '판매가']
df2 = pd.DataFrame(data=data2, columns=columns2)
print(df2)
#리스트 + 딕셔너리 사용
data3 = [{'제품명':'새우깡', '유통기한':'2022-11-01', '판매가':1600},
{'제품명':'양파링', '유통기한':'2023-01-31', '판매가':1200},
{'제품명':'계란과자', '유통기한':'2022-06-03', '판매가':1400}]
df3 = pd.DataFrame(data=data3)
print(df3)
반응형
2) 실행 결과
#딕셔너리 사용
data1 = {'제품명': ['새우깡', '양파링', '계란과자'],
'유통기한': ['2022-11-01', '2023-01-31', '2022-06-03'],
'판매가' : [1600, 1200, 1400]}
df1 = pd.DataFrame(data=data1)
print(df1)
제품명 유통기한 판매가
0 새우깡 2022-11-01 1600
1 양파링 2023-01-31 1200
2 계란과자 2022-06-03 1400
- 각 행을 기준으로 딕셔너리로 묶어서 데이터 프레임을 만드는 방법
#리스트 사용
data2 = [['새우깡', '2022-11-01', 1600],
['양파링', '2023-01-31', 1200],
['계란과자', '2022-06-03', 1400]]
columns2 = ['제품명', '유통기한', '판매가']
df2 = pd.DataFrame(data=data2, columns=columns2)
print(df2)
제품명 유통기한 판매가
0 새우깡 2022-11-01 1600
1 양파링 2023-01-31 1200
2 계란과자 2022-06-03 1400
- 각 행별 데이터입력과 컬럼명을 따로 입력하는 방법
#리스트 + 딕셔너리 사용
data3 = [{'제품명':'새우깡', '유통기한':'2022-11-01', '판매가':1600},
{'제품명':'양파링', '유통기한':'2023-01-31', '판매가':1200},
{'제품명':'계란과자', '유통기한':'2022-06-03', '판매가':1400}]
df3 = pd.DataFrame(data=data3)
print(df3)
제품명 유통기한 판매가
0 새우깡 2022-11-01 1600
1 양파링 2023-01-31 1200
2 계란과자 2022-06-03 1400
- 리스트 안에 각 데이터를 딕셔너리로 묶어서 만드는 방법
3) 각 방법별 차이
- 만드는 방법에서의 차이는 있으나 결과적으로 DataFrame으로 만들어 사용하면 같은 형식
- 결론적으로 차이는 없음
반응형
'Phython > Python Pandas' 카테고리의 다른 글
08. 판다스 데이터프레임(Pandas DataFrame) 범위 데이터 사용하기 (0) | 2022.02.04 |
---|---|
07. 판다스 데이터프레임(DataFrame) row, column 데이터 출력 방법 (0) | 2022.02.03 |
05. 판다스 시리즈(Pandas Series) 필터, 정렬 (filltering, sort) (0) | 2022.02.03 |
04. 판다스 시리즈(Pandas Series) 연산 (min(), max(), mean(), diff(), rank()) (0) | 2022.02.02 |
03. 판다스 시리즈(Pandas Series) Values 수정, 삭제 (0) | 2022.02.02 |