Airbin_0720

分析

  

2020-08-04 07:38:43

项目背景 数据是从kaggle下载的,Airbnb是一个让大众出租住宿民宿的网站,提供短期出租房屋或房间的服务,并且以其独特性的居住体验发展迅速,这里我们拿到的数据是2019年纽约的民宿数据。 这里需要注意一点,有的压缩包解压之后直接使用csv文件会有问题,正确的方式是,1)右击csv文件,打开方式选择txt,然后保存,Encloding选ANSI保存,2)再使用Excel打开csv文件,然后另存...

电商数据分析-Pandas

分析  数据分析

  

2020-06-12 02:32:40

四、参照RFM模型,对用户进行分类找出有价值的用户 RFM模型是衡量客户价值和客户创利能力的重要工具。该模型通过客户的**最近交易行为(Recency)、交易频率(Frequency)以及交易金额(Monetary)**三项指标来描述该客户的价值状况。一般来说,会将这三项指标分成几个区间进行评分,通过计算评分找到有价值的用户,并对用户进行分类。 最近一次消费(Recency):是指最近一次消费距离...

电商数据分析-SQL

分析  数据分析

  

2020-06-12 04:32:31

1. 项目背景: 通过对现有用户购物行为的数据进行分析,深度探索用户的消费行为、消费规律、消费偏好,针对不同的用户群体,以便更精细化运营,取得更好的业务; 2. 数据来源 数据来源:https://tianchi.aliyun.com/dataset/dataDetail?dataId=649&userId=1 注:如果数据太大,可以通过系统抽样选取部分数据 UserBehavior是阿里...

Exploratory data analysis (EDA) 探索性数据分析 一、Data Clean 数据清洗 1.1对空值、NA进行处理 hotel is_canceled lead_time arrival_date_year arrival_date_month arrival_date_week_number arrival_date_day_of_month stays_in_wee...

本文于2015年4月1号发表于看雪,2015年7月22号发表于52pojie。 以前博客:http://youngs-rsr.blog.163.com/ 首选先自我介绍一下吧,我在病毒分析方面纯小白! 此篇文章是自己第一次分析病毒,第一次写病毒分析报告! 此分析报告是前几天面试一家安全公司时需要上交的题目! 自己的基础方面:C/C++、逆向等有一定入门基础!所以打算自己边学边写一个病毒分析系列的教...

本文主要介绍LLVM的基本用法,如遍历函数、基本块、指令;指令类型判断与转换;增减代码;编写pass、在pass中调用别的pass;如何进行过程间分析。 1.简介 官网:http://llvm.org/ LLVM有很多自带工具:$> cd llvm/Debug+Asserts/bin 编译成bc文件:$> clang -c -emit-llvm identity.c -o identi...

Incapsula js加密混淆分析

JS分析

  

2019-06-03 11:04:39

js**之Incapsula cdn 网址:https://booking.volotea.com 上抓包,3次请求才返回正常的数据,本文目的分析图中这个参数值 从上一条数据看到js代码 简单分析下eval函数 拿到混淆的代码 代码量不大 1000多行 没有通过AST反混淆 直接调试 中间会有死循环代码导致浏览器崩溃 直接删掉即可 慢慢跟即可找到生成的函数 rc4 最后整理下思路: 首先数组重组 ...

源码分析—先看主干,再看分支 看源码,先看主干,把握主干,然后再看你自己关心的分支。 切记不要沿着源码一直一直点下来,这样很自己容易看蒙。 小技巧: 在源码中设置断点,然后按 F5 (进入方法中) 和 F6(向下执行)执行程序 在开源框架中,名字一般都是见名知意的,通过名字,可以大概知道方法的作用,从而选择是否跟进读 Servlet 源码分析 小技巧:使用 Maven 技术可以轻松查看...

中文情感分析

情感分析

  

2019-09-20 01:03:42

情感分析在NLP领域中是应用很广泛的技术,一般用深度学习来解决这一类的问题。其实我的理解就是情感分析就是一个分类问题。这里我爬取了京东小米9的用户评论,正面和负面的评价各1000条,爬虫和整体的代码我放在了 GitHub 。然后我把预训练的词向量文件放在了 百度网盘,提取码:rxci。 我们一起来看看数据长得啥样,首先是小米9正面的评价: 然后是小米9负面的评价: 从这些数据印证了一句话,幸福的人...

TraceView性能分析 我们在使用APP的时候会经常使用Log去看一下运行时间的问题,运行时间的时长与用户体验有直接的关系。而这种通过Log计算的方式计算出来的时间影响因素有很多,因此我们需要对运行时间有一个更为准确的分析。通过TraceView我们就可以分析每个函数具体的运行时间占用的CPU的时长等等。 同时往往存在内存泄漏的地方运行时间也会更长,因此在这里说明使用TarceView进行的分...

(PS:趋势分析) 我选的是周大生2018年第二季度的股市行情,在这里选择周大生 直接复制粘贴得到xlsx文件(文件内容如下) (已在Win7、python3.6上运行成功) 运行K线图如下: (情感分析和K线联系续集)...

自然语言处理(NLP)中的文本情感分析是一个重要的应用领域,多用于评价性的用户信息回馈,如电影影评和购物后的评价。而情感分析主要是通过用户的回答文本数据(中文),进行文本情感量化分析,现有的情感分析方法:1.情感词典分析方法。2.机器学习分析方法。 情感词典分析方法 一句话来总结,就是对文本进行切词,出除掉停用词,提取出关键词中的积极关键词和消极关键词,计算出情感得分。 先是对文本数据进行切词,这...

这里以我的一篇meta分析为例,详细描述meta分析的一般步骤,该例子实现的是效应量β的合并 R包:metafor或meta包,第一个例子以metafor包为例 1.准备数据集 2.异质性检验   可以看到I^2为28.34%,属于低度异质性,可采用固定效应模型。异质性低的时候可以采用固定效应模型和随机效应模型,结果差别不大,但高异质性只能选择随机效应模型,否则会使结果外推性受...