반응형

분류 전체보기 764

[Python] Numpy 행렬(Matrix) 함수(Shape, Reshape)

목차 파이썬 Numpy 행렬(Matrix) 함수 : Shape Shpae 함수는 numpy array 로 만든 행렬의 행의 수와 열의 수를 카운트 해줍니다. 사용 방법은 아래와 같습니다. tuple 값(행,열) = numpy.shape(numpy array) 위와 같이 넘파이 어레이 값을 입력으로 넣으면 입력의 행과 열을 tuple(튜플)로 출력해 줍니다. arry에 들어 가는 [[ ]] 괄호를 두번 중첩해야지 matrix로 인식합니다. 한번만 사용하면 행만 있는 것으로 인식 합니다. 아래 예제를 보시면 쉽게 이해할 수 있습니다. 예제 코드>> import numpy as np; np_list0 = np.array([1,2,3,4]) np_list1 = np.array([[1,2,3,4]]) print(..

[Python]Numpy 기본 팁: Max, Min, 조건검색(where), 정렬(Sort)

목차 파이썬 Numpy 최대값 찾기 Numpy 리스트 중에서 최대값 찾는 것은 argmax 함수를 사용해서 검색 합니다. index 리턴 값 = np.argmax(리스트) 위와 같이 index 값을 return 해 줍니다. 예제 코드>> import random import numpy as np a_list = [random.randint(0,200) for x in range(10)] max_list = np.argmax(a_list) print("a_list : ", a_list) print("a_list max index : ", max_list) print("a_list max : ", a_list[max_list]) 4번 라인: 랜덤 함수로 임의의 리스트 값을 만듭니다. 9번 라인: 출력 값은 ..

[Python] 프로그램 동작 시간 측정 함수 timeit 사용방법(Visual Studio)

목차 파이썬 timeit 함수 Syntax sort (정렬)이나 랜덤(Random)값을 만들거나 함수를 만들어서 동작하는데 시간이 얼마나 걸리는지 확인하는 작업은 중요합니다. 코드가 얼마나 효율적으로 만들었는지 알 수 있는 지표이기 때문입니다. 시간 측정을 위해 파이썬(Python)에서 제공하는 timeit 이라는 함수를 사용하면 쉽게 동작 시간(Operation Time)을 측정 할 수 있습니다. Syntax는 아래와 같습니다. timeit.timeit(stmt='함수/코드', setup='경로포함', number=동작횟수) timeit.repeat(stmt='함수/코드', setup='경로포함', number=동작횟수, repeat=반복횟수) timeit 은 반복 측정이냐 한번 측정이냐에 따라 tim..

[Python] Pandas CSV 파일 읽기 (에러 발생/해결)

목차 파이썬 판다스로 CSV 파일 읽기 문제 발생 이번 포스트는 어떤 프로그램을 통해서 데이터를 저장하였고 저장은 csv file로 하였습니다. 데이터 분석을 위해 pandas dataframe을 사용하려고 하는데 csv 를 불러 오는 과정에서 에러가 발생하였습니다. 해결 방법에는 2가지가 있는데 아래에서 소개하겠습니다.(CSV file to dataframe/series)) 우선 아래 예제 코드 처럼 pandas의 read_csv 함수를 사용해서 동일 폴더 안에 있는 csv file을 읽는 코드를 작성했습니다. 예제 코드>> import pandas as pd data = pd.read_csv('Driving_data_long.csv') print(data) 에러 코드>> Traceback (most ..

[Pymongo] 엑셀파일 mongodb에 업로드하기(Excel to mongoDB)

목차 [Pymongo] 엑셀파일 mongodb에 업로드하기(Excel to mongoDB) 이번 포스트에서는 엑셀파일에 있는 데이터를 파이썬의 pymongo 라이브러리를 사용해서 Mongodb에 올려보겠습니다. 코드 실행에 앞서 아래 작업들이 선행되어있다고 생각하고 진행하겠습니다. 파이썬 설치 mongodb 설치 (윈도우 버전, windows) pymongo 라이브러리 설치 mongodb 연결은 localhost로 연결할 것이고 Port는 기본 default에서 변경하지 않은 27017번으로 사용 합니다. [Pymongo] MongoDB에 연결하기 예제 코드>> import pymongo def Connect_DB(): connect_to = pymongo.MongoClient("localhost", 2..

[Python]Matplotlib 그래프 그리기 팁(사이즈, subplot, 주석

목차 파이썬 matplotlib을 사용하기 위해서는 pip install matplotlib으로 설치를 우선 진행하여야 합니다. 아래는 matplotlib을 효과적으로 사용하기 위한 팁과 트릭입니다. Plot 크기 조절하기 plot의 크기는 figure의 figsize로 x축과 y축 사이즈를 결정 합니다. 예제 코드>> import matplotlib.pyplot as plt import random fig=plt.figure(figsize=(4,4)) x=list(range(10)) y=[random.random() for _ in x] print(x) print(y) plt.title("graph title") plt.xlabel('x-axis') plt.ylabel('y-axis') plt.plot..

[Python]Pandas Dataframe 데이터 불러오기, loc, iloc 차이, 필터(Filter) 처리

목차 [파이썬] Pandas Dataframe loc, iloc 함수 정의 및 차이 loc 함수는 라벨(Label) 기준으로 행(Row)과 열(Colum)을 필터(Filter)해 줍니다. 예를 들어 3번 index에 내용을 찾을 때 3번 Index가 가지는 라벨 이름(name)을 통해서 검색합니다. 그리고 index 값을 이용해서 검색도 가능해서 index 검색 시 형 전체를 표기 해줍니다. iloc는 정수로된 index를 기준으로 필터링 해줍니다. index 값을 이용해서 행과 열 모두 검색 가능합니다. 아래 예제를 통해 쉽게 이해할 수 있습니다. [파이썬] Pandas Dataframe loc label 필터링 예제 아래 예제는 loc에 조건식을 넣어서 조건에 맞는 값만 출력되게 만든 loc 예제 입..

[Python] Pandas dataframe 중복 (동일)값 찾고 삭제하는 방법

목차 [파이썬] Pandas Dataframe 중복 값 찾기 판다스 Dataframe은 열과 행 (Column and row)로 구성되어 있습니다. 여기서 열 값 중에 같은 값들을 찾는 방법에 대해 알아 보겠습니다. 중복 값 찾기는 duplicate 함수로 구현 가능 합니다. 예제 코드>> import pandas as pd import numpy as np df = pd.DataFrame({ "name" : ["James", "James", "Kevin", "Adam", "David", "Adam"], "math" : [90,50,50,30,100,90], "physics" : [30,40,80,50,10,50], "english" : [90,70,30,90,90,40] }) print("Origial..

[Python] Pandas 여러가지 정렬방법(Multi Column, Index 제외 정렬 등)

목차 Python Pandas 정렬(Sorting) 파이썬의 판다스를 이용해서 정렬을 하려고 합니다. 엑셀에서 정렬을 해보시면 아시겠지만 열을 하나만 선택하거나 두개를 선택해서 정렬하거나 다양한 방법들이 있습니다. 이번 포스트는 index 사용 정렬이 아닌 column 관련 정렬로 sort_values 함수를 사용해서 정렬할 것입니다. 아래 예제 실습을 통해 사용 방법을 익혀보겠습니다. 기본 Column 하나로 정렬하기 예제 코드>> import pandas as pd import numpy as np df = pd.DataFrame({ "name" : ["James", "James", "Kevin", "Adam", np.nan], "math" : [90,50,50,30,100], "physics" : ..

반응형