Python根据表格每行数据,匹配在txt文章中出现的次数统计

标签: Python  python

用途: 根据表格每行数据,匹配在txt文章中出现的次数统计 

示例:

 

 

注意事项:

1. 环境:pip install re & pandas & xlrd; python 3;

2. 表格第一行会被忽略,往下才是关键词;关键词页放在第一个表单,最好只有这一个表单;

3. 表格与TXT文件都放在.py同级目录,或者在代码中显示绝对路径;

import re
import pandas as pd
import xlrd


# 读取匹配关键字表格并输出为列表(忽略第一行),读取源数据TXT,
df = pd.read_excel('list.xlsx')
data = df[0:].values
print(data, "\n")
doc = open('list_doc.txt', 'r', encoding = 'utf-8')

# 把源数据输出为列表
list_doc = []
for line in doc.readlines():
    line = line.strip().split("\n")
    list_doc.append(line)
# print(list_doc, "\n")

# 把源数据列表输出为字符串
strdoc = ""
for i in range(len(list_doc)):
    strdoc += list_doc[i][0]
    strdoc += ","
# print(strdoc, "\n")

# 利用正则表达式进行匹配
for i in range (len(data)):
    count3 =len(re.findall(data[i][0], strdoc))
    print(i, data[i][0], "---匹配次数---", count3)

 

执行结果:

版权声明:本文为zengchengxi原创文章,遵循 CC 4.0 BY-SA 版权协议,转载请附上原文出处链接和本声明。
本文链接:https://blog.csdn.net/zengchengxi/article/details/109363482

智能推荐

restful+ci框架 实践

restful架构: 是就是目前最流行的一种互联网软件架构。它结构清晰、符合标准、易于理解、扩展方便,所以正得到越来越多网站的采用。具体理论请看我上一篇写的restful理论。本篇主要记录下关于restful的实践。 restful实践: 工具: 这次在ci框架+restful 主要文件: 在控制器中添加控制器类:Restful.php。 在头部包含REST_Controller.php文件并继承...

Configuration, ConfigurationProperties和EnableConfigurationProperties用法

最近刚刚解决了个错误,突然又发现这个类在spring容器中找不到, 于是我就加一个 @Component的注解,哈哈直接启动成功,那我如果吧这个注解去掉,加上一个@Configuration的注解呢,哈哈还是可以的,毕竟里面已经有这个@Component的注解了。所以我就整理下Configuration,ConfigurationProperties,EnableConfigurationProp...

备战蓝桥杯--贪心算法刷题整理5

翻硬币(贪心算法) 看了一下网上的题解,感觉挺强,网友的做题思想值得借鉴,这里分享一下网友的链接,同时再分享一下自己的解题方案 链接:https://blog.csdn.net/qq_34594236/article/details/60326782 题目描述: 小明正在玩一个“翻硬币”的游戏。 桌上放着排成一排的若干硬币。我们用 * 表示正面,用 o 表示反面(是小写字母...

部署高可用RabbitMQ

安装 准备工作 这里我们使用三个RabbitMQ节点: 开通端口(具体见官方文档): 安装ErLang和RabbitMQ Server 安装文档见:https://www.rabbitmq.com/install-rpm.html。 采用RPM包而不是Repo的安装命令如下(以下的版本号可根据实际情况修改): 安装管理插件 安装文档见:https://www.rabbitmq.com/manage...

Opencv常用代码总结

文章目录 读取显示图像 保存图片 查看图片信息 读取视频 截取部分图像数据 颜色通道提取、融合与保留 边界填充 数值计算 图像融合 图像阈值 图像平滑(降噪) 形态学-腐蚀操作 形态学-膨胀操作 开运算与闭运算 梯度运算 礼帽与黑帽 图像梯度 Sobel算子 Scharr算子 laplacian算子 Canny边缘检测 图像金字塔 高斯金字塔:向下采样(缩小) 高斯金字塔:向上采样(放大) 拉普拉...

猜你喜欢

Numpy实现LDA

LDA与PCA的区别如下表: LDA的原理如下: 代码实现如下,这里使用的a,b是Nx2的二维点集合,经过LDA后,二维的点变为一维。更高维度的也是可以做到的。函数里的dim是原始数据的维度,d是想要降到的维度。  初始的数据如下图,红色点和蓝色点代表不同的分类。 经过LDA后,投影的一维数值如下图所示。 可见LDA实现了降维,而且两种分类的间距较大,类内的散度较小。...

Java反射机制

相关类型:  java.lang.Class  java.lang.reflect.Constructor  java.lang.reflect.Field  java.lang.reflect.Method  java.lang.reflect.Modifier 作用:  1、反编译 .class –> .java&n...

Linux(Centos7)安装oracle12c

第一步:到oracle官网上下载oracle12c的镜像文件 第二步:添加用户和组 用普通用户登录后,打开命令行工具(terminal) 转到root用户 [vmtest@localhost ~]$ su root Password: 添加组 [root@localhost vmtest]# groupadd dba 添加用户 [root@localhost vmtest]# useradd or...

bootstrap中表格内容过长成省略号,鼠标悬停表格显示全部内容【页面标签中实现】

页面效果展示: 1. 先判断该对象是否存在,再使用freemarker的list语法进行遍历 2. <#if> 中对象.属性值的非空判断和字符串长度的判断,必须得有非空判断,否则报错 3. 字符串的截取显示, <td title=”悬浮显示的值”> 4. 页面代码展示...