Python练习册(四)——统计英文单词

problem0004统计英文单词

第 0004 题:任一个英文的纯文本文件,统计其中的单词出现的个数。

demo:

#!/bin/python3

import re
def get_word_frequencies(file_name):
    dic = {}
    txt = open(file_name, 'r').read().splitlines()
    no_flag=0
    for line in txt:
        line = re.sub(r'[.?!,""/\W]', ' ', line)   #要替换的标点符号,英文字符可能出现的
        for word in line.split():
            #当字符为纯数字的时候,跳过不统计
            if word.isdigit():
                    pass
       #         print("number is ++++++++++++++++++++:",word)
            else:
                dic.setdefault(word.lower(), 0)  #不区分大小写
                dic[word.lower()] += 1
    print (dic)

if __name__ == '__main__': 
       get_word_frequencies("WhatisPython.txt")   

参考:[Python]任一个英文的纯文本文件,统计其中的单词出现的个数。(考虑单词-分行)

效果:

原文本:
这里写图片描述
统计图:
这里写图片描述

版权声明:本文为qq_30650153原创文章,遵循 CC 4.0 BY-SA 版权协议,转载请附上原文出处链接和本声明。
本文链接:https://blog.csdn.net/qq_30650153/article/details/80866844