import pandas as pd # 라이브러리 선언은 필수
## Series 생성 예제 1 - 리스트############## # index 입력값이 없다면 0부터 순서대로 인덱스번호 부여 data1 = Series(["토트넘", "손흥민" , 30], index = ["팀명","선수명","Goal수"])
## Series 생성 예제 2 - 딕셔너리############ #사전형으로 Series를 생성하면 사전형 key값이 index
dict = {'a' : 0., 'b' : 1., 'c' : 2.} data1 = Series(dict)
## dataframe 생성 예제1 - 딕셔너리 ######## # 열이름을 key로 하고, 리스트를 value로 갖는 딕셔너리 정의 dict_data = ({'KOSPI' :[1915,1961,2026,2467,2041], 'KOSDAQ' : [542,682,631,798,675]}, df = pd.DataFrame(dict_data, index=[2014,2015,2016,2017,2018])
######## dataframe 생성 예제2- 시리즈 ######## kospi = pd.Series([1915, 1961, 2026, 2467, 2041], index=[2014,2015,2016,2017,2018], name='KOSPI') kosdaq = pd.Series([542, 682, 631, 798, 675], index=[2014,2015,2016,2017,2018], name='KOSDAQ')
df = pd.DataFrame({kospi.name:kospi, kosdaq.name:kosdaq})
######## dataframe 생성 예제3- 리스트 ######## columns = ['KOSPI', 'KOSDAQ'] index = [2014,2015,2016,2017,2018] rows=[] rows.append([1915, 542]) rows.append([1961, 682]) rows.append([2026, 631]) rows.append([2467, 798]) rows.append([2041, 675]) |
import numpy as np # 라이브러리 선언은 필수
######## 배열 생성 예제 : array ##############
alist = [1,2,3] ## 리스트 또는 튜플 타입 사용
data_array=np.array(alist) ## 1차원, 변수
data_array=np.array([[1,2,3],[4,5,6]]) ## 2차원, 상수
######## 배열 생성 예제 : zeros, ones, full ##############
data_array=np.zeros((2,2)) ## 배열전체를 0 로
data_array=np.ones((2,2)) ## 배열전체를 1 로
data_array=np.full((2,3), 10) ## 배열전체를 10으로
######## 배열 생성 예제 : arange, linspace ##########
### .arange([start, ] stop, [step, ] dtype=None)
np.arange(3,7,2) # => array([3, 5]) np.linspace(0,1,5) # => array([0. , 0.25, 0.5 , 0.75, 1. ])
|
# 파일 입출력 예제 df = pd.read_csv('data/Ch4_2_sep.txt', sep='\s+') ( sep : 구분자 Default 는 쉼표(','), \s+ 는 공백이 하나 이상)
pd.read_excel('data/Ch4_9_fifa19.xlsx', sheet_name = ' ') pd.read_sql(sql_option, conn)
df.to_excel('파일명')
|
# 정렬 : a.sort() 또는 c.sort(axis=0) # 삽입 insert : 특정 인덱스에 원하는 배열을 삽입 # 삽입 ppend : 항상 마지막 인덱스에 배열을 추가
np.delete(arr, obj, axis=None) np.insert(arr, obj, values, axis=None) np.append(arr, values, axis=None) np.hsplit(a,3) # Split the array horizontally at the 3rd np.vsplit(c,2) # Split the array vertically at the 2nd index |
댓글