반응형

06. 판다스 데이터프레임(Pandas DataFrame) 만드는 3가지 방법

0) 사용 이유

  1. 2차원 데이터를 다루기 위하여 사용
    1. 시리즈는 1차원 데이터만 사용 가능
  2. R의 DataFrame을 참고해서 만듬 -> 데이터 편집, 관리에 용의

1) 기본 코드

import pandas as pd

#딕셔너리 사용
data1 = {'제품명': ['새우깡', '양파링', '계란과자'],
        '유통기한': ['2022-11-01', '2023-01-31', '2022-06-03'],
        '판매가' : [1600, 1200, 1400]}

df1 = pd.DataFrame(data=data1)
print(df1)

#리스트 사용
data2 = [['새우깡', '2022-11-01', 1600],
         ['양파링', '2023-01-31', 1200],
         ['계란과자', '2022-06-03', 1400]]
columns2 = ['제품명', '유통기한', '판매가']

df2 = pd.DataFrame(data=data2, columns=columns2)
print(df2)

#리스트 + 딕셔너리 사용
data3 = [{'제품명':'새우깡', '유통기한':'2022-11-01', '판매가':1600},
         {'제품명':'양파링', '유통기한':'2023-01-31', '판매가':1200},
         {'제품명':'계란과자', '유통기한':'2022-06-03', '판매가':1400}]

df3 = pd.DataFrame(data=data3)
print(df3)

 

반응형

 

2) 실행 결과

#딕셔너리 사용
data1 = {'제품명': ['새우깡', '양파링', '계란과자'],
        '유통기한': ['2022-11-01', '2023-01-31', '2022-06-03'],
        '판매가' : [1600, 1200, 1400]}

df1 = pd.DataFrame(data=data1)
print(df1)
    제품명        유통기한   판매가
0   새우깡  2022-11-01  1600
1   양파링  2023-01-31  1200
2  계란과자  2022-06-03  1400
  • 각 행을 기준으로 딕셔너리로 묶어서 데이터 프레임을 만드는 방법
#리스트 사용
data2 = [['새우깡', '2022-11-01', 1600],
         ['양파링', '2023-01-31', 1200],
         ['계란과자', '2022-06-03', 1400]]
columns2 = ['제품명', '유통기한', '판매가']

df2 = pd.DataFrame(data=data2, columns=columns2)
print(df2)
    제품명        유통기한   판매가
0   새우깡  2022-11-01  1600
1   양파링  2023-01-31  1200
2  계란과자  2022-06-03  1400
  • 각 행별 데이터입력과 컬럼명을 따로 입력하는 방법
#리스트 + 딕셔너리 사용
data3 = [{'제품명':'새우깡', '유통기한':'2022-11-01', '판매가':1600},
         {'제품명':'양파링', '유통기한':'2023-01-31', '판매가':1200},
         {'제품명':'계란과자', '유통기한':'2022-06-03', '판매가':1400}]

df3 = pd.DataFrame(data=data3)
print(df3)
    제품명        유통기한   판매가
0   새우깡  2022-11-01  1600
1   양파링  2023-01-31  1200
2  계란과자  2022-06-03  1400
  • 리스트 안에 각 데이터를 딕셔너리로 묶어서 만드는 방법

3) 각 방법별 차이

  1. 만드는 방법에서의 차이는 있으나 결과적으로 DataFrame으로 만들어 사용하면 같은 형식
  2. 결론적으로 차이는 없음
반응형

+ Recent posts