对学习器的泛化性能进行评估,不仅需要有效可行的实验估计方法,还需要有衡量模型泛化能力的评价标准,这就是性能度量(performance measure)。 性能度量反映了任务需求,在对比不同模型的能力时,使用不同的性能度量往往会导致不同的评判结果,这意味着模型的“好坏”是相对的,什么样的模型是好的,不仅取决于算法和数据,还决定于任务需求。 在预测任务中,给定数据集 D=(x...

聚类的性能度量大致有两类:“外部指标”和“内部指标”。 外部指标:是指把算法得到的划分结果跟某个外部的“参考模型”(如专家给出的划分结果)比较。 定义: 有如下常用的聚类性能度量的外部指标: Jaccard系数(JC): FM指数(FMI): Rand指数(RI): 容易看出,这些指标的值都在[0,1]之间,且越大越好。 内部...

功能点 用例点 案例1 案例2 UUCP=13+70=83UUCP=13+70=83 Halstead 案例2 Object Point 4 screens: 2 simple (weight 1) and 2 medium (weight 2) 3 reports: 2 simple (weight 2) and 1 medium (weight 5) 2 component: weight 1...

LK Metrics CS (Class Size) NOO (Number of Operations Overridden) NOA (Number of Added) SI (Specialization Index) CK metrics Weighted Methods per Class(WMC) Response for a Class (RFC) Number of Childre...

1.混淆矩阵 对于二分类问题,可将样例根据其真实类别与分类器预测类别的组合划分为: 真正例(true positive):将一个正例正确判断为正例 假正例(false positive):将一个反例错误判断为正例 真反例(true negative):将一个反例正确判断为反例 假反例(false negative):将一个正例错误判断为反例 令TP、FP、TN、FN分别表示对应的样例数,这四个指标...

最近正式进入到机器学习的理论学习中啦,准备写一些笔记来加深我对机器学习算法的理解~ 所谓聚类在我的理解中是: 将数据集中的样本划分为若干个不相交的子集,每个子集即为一个簇: 它可用于寻找数据内在的分布结构,也可作为其它学习任务的前驱过程,来提炼数据 以下是聚类算法涉及的两个基本问题: 性能度量和距离计算: 聚类是将样本划分为若干互不相交的子集(样本簇),当然我们希望是簇内相似度高,簇间相似度底 此...

聚类分析是一种无监督机器学习(训练样本的标记信息是未知的)算法,它的目标是将相似的对象归到同一个簇中,将不相似的对象归到不同的簇中。如果要使用聚类分析算法对一堆文本分类,关键要解决这几个问题: 如何衡量两个对象是否相似 算法的性能怎么度量 如何确定分类的个数或聚类结束的条件 选择哪种分类算法  下面就带着这几个问题,以我工作中的一个业务需求为例,来学习一下怎么对中文文本进行聚类。(此文略...

**模型性能度量 1.留出法: 对于一个机器学习问题,我们通常有数据集D(用于训练模型),但我们还需要评估模型,因此不能把整个D用于训练,因为拿训练过的数据再去评估必然无效。那么最基本的方法就是留出法: 把D划分为两部分:训练集S和测试集T,其中SUT=D,S∩T=Φ。 划分时一般不宜随机划分,因为如果T中正好只取到某一种特殊类型数据,从而带来了额外的误差。此时处理方法要视具体情况...

9光照对直方图EMD匹配产生的影响 与上例一样,收集手的肤色直方图。以其中的一个室内直方图样本作为模型,并计算其与另一个室内直方图、一个室外阴影直方图、一个室外光照直方图的EMD距离,利用这些测量值设置一个距离阈值,再次比较EMD距离,程序中三幅图像已经过处理,依次比前一幅亮度增加25,具体代码如下: 结果如下:...

在机器学习和数据挖掘中,我们经常需要知道个体间差异的大小,进而评价个体的相似性和类别。最常见的是数据分析中的相关分析,数据挖掘中的分类和聚类算法,如 K 最近邻(KNN)和 K 均值(K-Means)等等。在做分类时常常需要估算不同样本之间的相似性度量(Similarity Measurement),这时通常采用的方法就是计算样本间的“距离”(Distance)。采用什么样...

String字符串是系统里最常用的类型之一,在系统中占据了很大的内存,因此,高效地使用字符串,对系统的性能有较好的提升。 针对字符串的优化,我在工作与学习过程总结了以下三种方案作分享: 一.优化构建的超大字符串 验证环境:jdk1.8 反编译工具:jad 1.下载反编译工具jad,百度云盘下载: 链接:https://pan.baidu.com/s/1TK1_N769NqtDtLn28jR-Xg ...

Ubuntu 安装JMeter测试工具

性能

  

2020-04-02 16:31:17

Ubuntu 16.04安装JMeter测试工具 JMeter是Java的测试工具,由Apache开发。 同样,JMeter是跨平台的。 下载: http://jmeter.apache.org/download_jmeter.cgi 安装: 启动: 创建Dash图标: 内容...

懒加载的原理及实现

性能

  

2020-04-20 11:26:15

1.懒加载概念 对于页面有很多静态资源的情况下(比如网商购物页面),为了节省用户流量和提高页面性能,可以在用户浏览到当前资源的时候,再对资源进行请求和加载。 2.懒加载实现原理 2.1监听onscroll事件判断资源位置 首先为所有懒加载的静态资源添加自定义属性字段,比如如果是图片,可以指定data-src为真实的图片地址,src指向loading的图片。 然后当资源进入视口的时候,将src属性值...