数据预处理的常用流程: 1)去除唯一属性 2)处理缺失值 3)属性编码 4)数据标准化、正则化 5)特征选择 6)主成分分析 (1)去除唯一属性 在获取的数据集中,经常会遇到唯一属性。这些属性通常是添加的一些di属性,如存放在数据库中自增的主键。这些属性并不能刻画样本自身的分布规律,所以只需要简单地 ...
前言 在分析一个 包时发现他把关键类采用了运行时使用 的方式加载了。懒得分析算法了,可以使用 自带的工具 出需要的 . 正文 从运行的java进程里dump出运行中的类的class文件的方法,所知道的有两种 用agent attatch 到进程,然后利用 Instrumentation和 Class ...
目前,我国沪深A股上市公司的数量为3524家[2018/05/31],如果能够从某个财经网站上批量获取这些公司的基本信息,将对研究工作起到一定帮助。进行这项工作之前,先让我们梳理一下我们的数据及其来源。 第一,我们需要哪些公司基本信息? 根据巨潮资讯网提供的数据,公司基本信息包含公司全称、英文名称、 ...
springboot中有三种拦截器可供选择:filter、interceptort和aop。本文主要讨论三种拦截器的使用场景与使用方式。 下文中的举例功能是计算每个请求的从开始到结束的时间,例子来源是慕课网。 一、filter 特点:可以获取原始的ServletRequest,但无法获取具体方法 实 ...
基础知识:1HashMap会使用key,根据hashcode进行默认排序。2LinkedHashMap根据存入先后进行排序代码展示:1随机排序
0-背景临近毕业答辩,检测重复率,抽盲审等事宜接踵而至。很不幸,女票抽中盲审。我送助攻,和她一起修改论文,所以,这几天写了点代码,可以整理一下。多机器作业排序问题很简单,举个栗子🌰(从她论文中偷了一张图,23333),把所有工件,A,B,C,D加工完要用多久?前提是一台机器只能一次加工一个工件。(...
修改配置: setting: project structure: ...
我们已常用的请假来设计一个流程。 流程设计器参见springboot2+activiti 7 整合(二) IDEA安装Activiti工作流设计器,通过在项目中右键找到External Tools -> camunda-modeler开始流程设计。 相同的业务流程,流程定义的 id 名字定义一样,比 ...
1、PCA降维 降维有什么作用呢?数据在低维下更容易处理、更容易使用;相关特征,特别是重要特征更能在数据中明确的显示出来;如果只有两维或者三维的话,更便于可视化展示;去除数据噪声降低算法开销 常见的降维算法有主成分分析(principal component analysis,PCA)、因子分析(F ...
网上找了几个合并pdf的软件,发现不是很好用,一般都没有添加书签的功能。 在网上查找了python合并pdf的脚本,发现也没有添加书签的功能。于是自己动手编写了一个小工具,代码如下: ...
作者:小村长 出处:http://blog.csdn.net/lu597203933 欢迎转载或分享,但请务必声明文章出处。 (新浪微博:小村长zack, 欢迎交流!) 1:简单概念描述 假设现在有一些数据点,我们用一条直线对这些点进行拟合(该线称为最佳拟合直线),这个拟合过程就称为回归。训练分类器
前几日,调试一BUG,过程先不说,最后调试到MM,即Debug dcu,然后进入到GetMem.inc中的Get/FreeMem函数处后,出现AV。 然后一通找。。。郁闷了N天,后来发现将MM切换到QMM后,一切正常,然后再切回原MM,BUG出现。。。 按经验,此类问题一般由于线程未有锁保护引起,但 ...
安装python,setuptools,get-pip.py,ipython,构建python开发环境安装环境:Centos6.7,安装时选项为桌面,增加了开发工具包。1、python2.7.11安装下载源代码:wgethttps://www.python.org/ftp/python/2.7.11/Python-2.7.11.tgz安装:./configuremakemakeinstall2、安装setuptoo..
文件上传在Spring-boot中本身配置起来非常简单,但是有个多文件传递和单个传递的问题。 两者配置是略有不同的,而且还有一些让我这个技术小白很容易踩坑的地方。 重要的几点: 上传的是单个文件: MultipartFile file 上传的是多个文件: MultipartFile[] file 先 ...
django2.0集成xadmin0.6报错集锦 http://www.lybbn.cn/data/bbsdatas.php?lybbs=50 django2.0集成xadmin0.6报错集锦 http://www.lybbn.cn/data/bbsdatas.php?lybbs=50 1、djan ...
Part3文本聚类分类和聚类算法,都是数据挖掘中最常接触到的算法,分类聚类算法分别有很多种。可以看下下面两篇文章对常见的分类聚类算法的简介:分类算法:http://blog.csdn.net/chl033/article/details/5204220聚类算法:http://blog.chinaun...
将某二进制文件放在Resources目录下,希望用Resources.Load<TextAsset>的方式读取,发现TextAsset是null 查阅Unity文档得知,使用Resources.Load读二进制文件,则文件扩展名必须为bytes 另外注意,Resources.Load的路径不要包含扩 ...
安装python3遇到报错: wget https://www.python.org/ftp/python/3.5.2/Python-3.5.2.tgz ./configure --prefix=/usr/local/Python-3.5.2 --enable-shared make make in ...