파이썬(Python)/문법

Python 파일 (한글 포함) 읽어서 동일한 문장 개수 카운트 하기

끄적끄적아무거나 2021. 10. 12. 17:44
반응형

 

목차

     

     

     

     

     


     

     

     

     

    Python 파일 읽어서 동일한 문장 개수 세기

     

     

    코드>>

    #리스트, 딕션너리 선언 
    list_words = []
    dic_words = {} 
    
    #파일에서 내용 읽어오기
    file = open('D:\\test.txt', "r", encoding="utf-8")
    words = file.read() 
    
    #띄워쓰기로 나눈 단어 리스트로 넣기
    list_words = words.split()
    
    #단어들을 키값으로 넣고 새로운 단어가 나오면 0 + 1로 카운터 시작 
    for word in list_words:
        dic_words[word] = dic_words.get(word, 0) + 1 
        keys = sorted(dic_words.keys())
     
    for word in keys:
        print("{0} 단어 개수 : {1} 개".format(word, str(dic_words[word])))

     

     

    text.txt 내용>>

    하지만 개인 투자자들의 반도체 업종 투자 수익률은 마이너스를 기록 중이다. 올해 개인 투자자의 순매수 금액을 순매수 주식 수량으로 나눠 구한 ‘평균 순매수 가격’과 12일 종가를 비교해보면 삼성전자 보통주의 추정 수익률

     

     

     

    결과>>

    12일 단어 개수 : 1 개
    ‘평균 단어 개수 : 1 개
    가격’과 단어 개수 : 1 개
    개인 단어 개수 : 2 개
    구한 단어 개수 : 1 개
    금액을 단어 개수 : 1 개
    기록 단어 개수 : 1 개
    나눠 단어 개수 : 1 개
    마이너스를 단어 개수 : 1 개
    반도체 단어 개수 : 1 개
    보통주의 단어 개수 : 1 개
    비교해보면 단어 개수 : 1 개
    삼성전자 단어 개수 : 1 개
    수량으로 단어 개수 : 1 개
    수익률 단어 개수 : 1 개
    수익률은 단어 개수 : 1 개
    순매수 단어 개수 : 3 개
    업종 단어 개수 : 1 개
    올해 단어 개수 : 1 개
    종가를 단어 개수 : 1 개
    주식 단어 개수 : 1 개
    중이다. 단어 개수 : 1 개
    추정 단어 개수 : 1 개
    투자 단어 개수 : 1 개
    투자자들의 단어 개수 : 1 개
    투자자의 단어 개수 : 1 개
    하지만 단어 개수 : 1 개

     

     

    반응형