반응형

판다스 5

[Python] Pandas 여러가지 정렬방법(Multi Column, Index 제외 정렬 등)

목차 Python Pandas 정렬(Sorting) 파이썬의 판다스를 이용해서 정렬을 하려고 합니다. 엑셀에서 정렬을 해보시면 아시겠지만 열을 하나만 선택하거나 두개를 선택해서 정렬하거나 다양한 방법들이 있습니다. 이번 포스트는 index 사용 정렬이 아닌 column 관련 정렬로 sort_values 함수를 사용해서 정렬할 것입니다. 아래 예제 실습을 통해 사용 방법을 익혀보겠습니다. 기본 Column 하나로 정렬하기 예제 코드>> import pandas as pd import numpy as np df = pd.DataFrame({ "name" : ["James", "James", "Kevin", "Adam", np.nan], "math" : [90,50,50,30,100], "physics" : ..

[Python] Pandas 이동평균 함수 사용법 (Rolling)

목차 [Python] Pandas 이동평균 함수 사용법 (Rolling) 파이썬의 판다스에서 제공하는 함수 중에 Rolling이라는 함수가 있습니다. 테이블에 많은 데이터가 있고 전체에 대한 평균이나 최소 최대값을 알고 싶은 것이아니라 Window 창이 이동하듯이 X축의 창을 이동하면서 Y값의 평균 최소 최대 값을 구해야 하는 경우들이 있습니다. 일반적인 코딩은 for문을 여러번 사용하여 복잡하게 계산하지만 Pandas rolling을 사용하게 되면 간단하게 이동하는 윈도우의 수치결과를 얻을 수 있습니다. 참고로 앞서 포스트에서 rolling 함수를 사용해서 30일간 이동 평균 Window를 이동시키면서 코스피 고점 대비 하락률을 계산하고 그리는 예제를 하였습니다. 해당 내용이 궁금하시면 아래 링크 참조..

[Python] Pandas DataFrames이란? 선언, 데이터 찾기, 정렬하기 예제(find, sort)

목차 [Python] Pandas DataFrames이란? 파이썬의 판다스는 데이터 처리에 용이한 라이브러리 입니다. 앞서 설명한 Pandas Series와 마찬가지로 DataFrames은 데이터를 엑셀과 비슷한 방식으로 관리하기 위해 필요한 함수 입니다. Dataframes은 2차원 배열로 행과 열로 구성되어 있습니다. 간단히 설명하자면 우리가 사용하는 엑셀의 대부분의 기능을 Dataframes의 내장 함수를 이용해서 사용할 수 있다고 생각하시면 됩니다. Series와의 차이는 Series는 1차원 배열(array)였고 Dataframes은 2차원 배열이라는 것입니다. 아래는 간단하게 DataFrame 사용에 대한 예제 코드 입니다. 코드 & 결과>> import pandas as pd dict_var..

[Python] Pandas로 네이버 금융 재무분석 항목 가져오기(에러해결 추가)

목차 [Python] 설치에 필요한 라이브러리 Pandas로 네이버 금융의 재무분석 정보를 가져오려고 합니다. Pandas의 장점은 데이터를 엑셀과 같은 양식으로 쉽게 관리하고 내부에 강력한 수학 함수들이 있어서 주식의 차트 분석이나 수학의 확률 분석 그리고 빅데이터로 데이터 분석을 하는 데 유용합니다. 네이버 파이넌스에서 정보를 가져올 것인데 해당 HTML의 정보를 테이블로 쉽게 정리해서 전달해주는 함수가 Pandas에 Html_read라는 함수가 있습니다. 저는 Visual Studio Code를 사용해서 Pandas를 설치했는데 Html_read 함수를 사용하기 위해 아래와 같이 추가적인 라이브러리를 설치해야합니다. 웹크롤링(web crawling)과 관련된 라이브러리로 Html_read함수가 해당..

[Python] Pandas Series란? 선언방법, 합치기 (append)

목차 [Python] Pandas Series란? Pandas Series란 엑셀의 행열 중에 한줄의 열로만 구성된 테이블입니다. 다양한 데이터 타입을 지원하는 1차원 배열이라고도 합니다. import pandas as pd a_var = [2, "hi", 5, "안녕"] pd_var = pd.Series(a_var) print(pd_var) ###결과### 0 2 1 hi 2 5 3 안녕 dtype: object 위 예제처럼 리스트 값을 Series에 넣으면 1차원 열(Column)의 테이블이 생기고 print를 하면 index번호와 value와 data type을 알려줍니다. [Python] Pandas Series 인덱싱 하기 아래 코드 4번째 라인처럼 라벨을 직접 설정할 수 있습니다. 그리고 설정..

반응형