一、背景 随着互联网的普及,网络购物已经成了人们购物的首选。用户只需在电商平台搜索商品名,便可得到成百上千条商品信息。商品信息的排序算法很复杂,但总的说来基本上都是根据与搜索关键词的关联度和商品的人气或商家排名来排序最终对用户进行展示的。而好评率即是排名中的重要因素。商品的评价分为星级评价和文本评价。星级评价和好评率在排序算法中占据重要地位。有的商家为了提升排名,采取“五星好评返现&r...

数据集查看 ## 任务描述: “可爱的老式和愚蠢的人之间有一条细线,而基督山伯爵……从未在两边安定下来。” Rotten Tomatoes电影评论数据集是用于情感分析的电影评论语料库,最初由Pang和Lee [1]收集。在他们关于情感树库的工作中,Socher等人。[2]使用亚马逊的Mechanical Turk为语料库中的所有解析短语创建细粒度...

稀疏数据和嵌入简介 学习目标: 将影评字符串数据转换为稀疏特征矢量 使用稀疏特征矢量实现情感分析线性模型 通过将数据投射到二维空间的嵌入来实现情感分析 DNN 模型 将嵌入可视化,以便查看模型学到的词语之间的关系 在此练习中,我们将探讨稀疏数据,并使用影评文本数据(来自 ACL 2011 IMDB 数据集)进行嵌入。这些数据已被处理成 tf.Example 格式。 设...

1 概述 情感分析是自然语言处理中常见的场景,比如淘宝商品评价,饿了么外卖评价等,对于指导产品更新迭代具有关键性作用。通过情感分析,可以挖掘产品在各个维度的优劣,从而明确如何改进产品。比如对外卖评价,可以分析菜品口味、送达时间、送餐态度、菜品丰富度等多个维度的用户情感指数,从而从各个维度上改进外卖服务。 情感分析可以采用基于情感词典的传统方法,也可以采用基于深度学习的方法,下面详细讲解 2 基于情...

Incapsula js加密混淆分析

JS分析

  

2019-06-03 11:04:39

js破解之Incapsula cdn 网址:https://booking.volotea.com 上抓包,3次请求才返回正常的数据,本文目的分析图中这个参数值 从上一条数据看到js代码 简单分析下eval函数 拿到混淆的代码 代码量不大 1000多行 没有通过AST反混淆 直接调试 中间会有死循环代码导致浏览器崩溃 直接删掉即可 慢慢跟即可找到生成的函数 rc4 最后整理下思路: 首先数组重组 ...

目录​​​​​​​​​​​​​​​​​​​​​ 前言 流程简介 源码分析 前言       上一篇博客picasso使用详解(一)详细介绍了picasso的各种使用方法与他的一些特性,这次从源码的角度详细讲解他的流程和原理。它的整体流程可以分为2个部分,一个是设置加载条件,确定需要展示的图片的各种属性,第二是加载然后对图片进行实际的处理,然后显示到目标对象上。 流程简...

· 问题引入 · 当你配置好 anaconda的环境变量时 原本的Python 3.7 和 anaconda python运行环境是冲突的。这很好解决 ,你可以将anaconda下的python.exe文件 改成 an-python.exe 这样的完美的解决 可以运行不同的python环境了。 但是这样再次启动jupyter notebook 发现 运行环境还是 pyt...

android Activity启动流程分析 之前一直对于activity的启动流程不甚了解,几天一鼓作气看完相关源码特来分享。 首先我们从ActivityThread分析起。程序的入口在main方法里 在main方法里重点请看attach方法 在这个方法里我们看到IActivityManage,IActivityManage为AIDL接口,不明白Android Binder机制的建议先补充相关知...

201X届XX学院毕业生就业情况分析   今天拿到了X年XX学院的就业情况表,就想着做个关于就业的统计分析。花了3个小时做整个分析的构思、设计和实现,也算是费尽心思了吧!(里面没有用到任何与个人信息对应的数据,如果有任何侵犯个人隐私的,本人承诺立马删除)。 读取文件 就业单位性质 就业状况 生源地区 实际就业单位 实际所在地 0 待就业 待就业 四川省眉山市 NaN NaN 1...

1、概述 AsyncTask的作用:首先看看API中对AsyncTask的官方解释 上述这句话翻译的意思是:AsyncTask能够正确使用UI线程。允许您在UI线程上执行后台操作和发布结果,而不必操纵线程和/或处理程序 AsyncTask的主要方法: AsyncTask<Params, Progress, Result>: 继承AsyncTask需要传入三个参数类型;Params:后台...

ELK日志分析平台

elk  日志分析

  

2019-06-10 11:10:51

什么是ELK呢? ELK是三个组件的缩写, 分别是elasticsearch, logstash, kibana. ELK平台可以用于实现日志收集、日志搜索和日志分析 1.elasticsearch(es): 它是个开源分布式搜索引擎,它的特点有:分布式,零配置,自动发现,索引自动分片,索引副本机制,restful风格接口,多数据源,自动搜索负载等。 2.logstash: 简单说是一个日志收集工...

三国演义字数统计

数据分析

  

2019-06-13 08:43:49

统计结果图 三国演义字数统计 资料下载地址 三国演义txt下载 密码:rqau 相关代码 lambda生成一个临时函数 d表示字典的每一对键值对,d[0]为key,d[1]为value reverse为True表示降序排序...

SLA(service level agreement,服务水平协议)可在性能测试过程中,定义性能测试的目标和度量性能,在性能测试过程中LR会收集和保存性能的相关数据,在分析运行结果时,分析器分将收集的数据与SLA中定义的度量数据进行比较,并将分析结果显示在分析器中,SLA三种状态分别是:a.pass:表示SLA获得该项测试数据,并且该数据达到目标要求;b.fail:表示SLA获得该项测试数据,但...

前言 最做流量分析的题目感觉还是不太熟悉,所以最近几篇博客都应该都是练习流量分析的题目了,就从安恒8月赛这个应急响应讲起吧,记录一下加深印象,顺便小结一下自己的做题领悟。 题目地址 https://pan.baidu.com/s/13SoD6xB7YBiqpUDCIcb8mg 正文 题目概述 还得了解一下一些前置的知识 过滤IP,如源IP或者目标 x.x.x.x ip.src == x.x.x.x...

数据分析学习笔记

数据分析

  

2019-06-20 14:46:18

目录 一.介绍 二.代码实现 一.介绍 集中趋势:均值,中位数,众数,分位数(常用四分位数)                                       离中趋势:标准差,方差 数据分布:偏态与...