对学习器的泛化性能进行评估,不仅需要有效可行的实验估计方法,还需要有衡量模型泛化能力的评价标准,这就是性能度量(performance measure)。 性能度量反映了任务需求,在对比不同模型的能力时,使用不同的性能度量往往会导致不同的评判结果,这意味着模型的“好坏”是相对的,什么样的模型是好的,不仅取决于算法和数据,还决定于任务需求。 在预测任务中,给定数据集 D=(x...

聚类的性能度量大致有两类:“外部指标”和“内部指标”。 外部指标:是指把算法得到的划分结果跟某个外部的“参考模型”(如专家给出的划分结果)比较。 定义: 有如下常用的聚类性能度量的外部指标: Jaccard系数(JC): FM指数(FMI): Rand指数(RI): 容易看出,这些指标的值都在[0,1]之间,且越大越好。 内部...

聚类分析是一种无监督机器学习(训练样本的标记信息是未知的)算法,它的目标是将相似的对象归到同一个簇中,将不相似的对象归到不同的簇中。如果要使用聚类分析算法对一堆文本分类,关键要解决这几个问题: 如何衡量两个对象是否相似 算法的性能怎么度量 如何确定分类的个数或聚类结束的条件 选择哪种分类算法  下面就带着这几个问题,以我工作中的一个业务需求为例,来学习一下怎么对中文文本进行聚类。(此文略...

在机器学习和数据挖掘中,我们经常需要知道个体间差异的大小,进而评价个体的相似性和类别。最常见的是数据分析中的相关分析,数据挖掘中的分类和聚类算法,如 K 最近邻(KNN)和 K 均值(K-Means)等等。在做分类时常常需要估算不同样本之间的相似性度量(Similarity Measurement),这时通常采用的方法就是计算样本间的“距离”(Distance)。采用什么样...

本系列日记GitHub: https://github.com/zhengyuv/MyTFRoad 欢迎follow和star。 1 回归度量        继房价预测后,导入糖尿病数据集diabetes进行回归预测。这次观察的超参数除了stddev和lr外还观察了隐藏层神经元个数的影响,并应魏聪明的要求加入了公式化的评价指标,主要使用sklearn.met...

一.数据库访问优化法则 要正确的优化SQL,我们需要快速定位能性的瓶颈点,也就是说快速找到我们SQL主要的开销在哪里?而大多数情况性能最慢的设备会是瓶颈点,如下载时网络速度可能会是瓶颈点,本地复制文件时硬盘可能会是瓶颈点,为什么这些一般的工作我们能快速确认瓶颈点呢,因为我们对这些慢速设备的性能数据有一些基本的认识,如网络带宽是2Mbps,硬盘是每分钟7200转等等。因此,为了快速找到SQL的性能瓶...

性能

JS性能

  

2019-07-04 06:39:46

如何衡量代码速度?如何编写合理高效的代码?全面学习 JS 事件循环以及它会如何影响代码编写过程? 高效添加页面内容 使用循环添加内容 上述代码的运行过程是: 创建一个段落元素 向段落中添加一些文本 将段落添加到页面上 循环执行两百次这样的操作 改进上述代码: 在循环外创建一个父容器元素 将所有新的段落元素附加到这个父容器 将这个父容器附加到 <body> 元素,而不是每次都通过循环来附...

在网上看到过这样一段话,觉得挺有道理?不过实践出真知啊,咋就不能理解这些话了。。 这种情况在我们的实际应用中经常遇到,而且我们很容易犯类似的错误,例如下面的代码:   Java代码   for (int i = 0; i < 10000; ++i) {   Object obj = new Object();   System.out.println("obj= " + ...

一、celery简述: 应用场景:在程序运行过程中,要执行一个很久的任务,但是我们又不想主程序被阻塞,常见的方法是多线程。可是当并发量过大时,多线程也会扛不住,必须要用线程池来限制并发个数,而且多线程对共享资源的使用也是很麻烦的事情。还有就是前面几篇介绍过的协程,但是协程毕竟还是在同一线程内执行的,如果一个任务本身就要执行很长时间,而不是因为等待IO被挂起,那其他协程照样无法得到运行。 (当请求很...

TraceView性能分析 我们在使用APP的时候会经常使用Log去看一下运行时间的问题,运行时间的时长与用户体验有直接的关系。而这种通过Log计算的方式计算出来的时间影响因素有很多,因此我们需要对运行时间有一个更为准确的分析。通过TraceView我们就可以分析每个函数具体的运行时间占用的CPU的时长等等。 同时往往存在内存泄漏的地方运行时间也会更长,因此在这里说明使用TarceView进行的分...

对于调优这个事情来说,一般就是三个过程: 性能监控:问题没有发生,你并不知道你需要调优什么?此时需要一些系统、应用的监控工具来发现问题。 性能分析:问题已经发生,但是你并不知道问题到底出在哪里。此时就需要使用工具、经验对系统、应用进行瓶颈分析,以求定位到问题原因。 性能调优:经过上一步的分析定位到了问题所在,需要对问题进行解决,使用代码、配置等手段进行优化。 Java调优也不外乎这三步。 此外,本...