python的scikit-learn包下有计算tf-idf的api,研究了下做个笔记
1 安装scikit-learn包
sudo pip install scikit-learn
2 中文分词采用的jieba分词,安装jieba分词包
sudo pip install jieba
3 关于jieba分词的使用非常简单,参考这里,关键的语句就是(这里简单试水,不追求效...
2014.06.15 22:14简介: 堆是一种非常实用的数据结构,其中以二叉堆最为常用。二叉堆可以看作一棵完全二叉树,每个节点的键值都大于(小于)其子节点,但左右孩子之间不需要有序。我们关心的通常只有堆顶的元素,而整个堆则被封装起来,保存在一个数组中。图示: 下图是一个最大堆: 实现: 优...
我们知道java中可以用MessageFormat.format来格式化字符串。这个方法在我们的实际开发中经常用到,有点类似模板,这样我们就不需要用很恶心的拼接字符串了。如下面 String s1="my blogWebSite is {0} and sinaWeiBo is {1} ";Strin...
String对象提供的方法用于处理字符串及字符。常用的一些方法:charAt(index):返回字符串中index处的字符。indexOf(searchValue,[fromIndex]):该方法在字符串中寻找第一次出现的searchValue。如果给定了fromIndex,则从字符串内该位置开始搜...
C语言操作符优先级 优先级 运算符 含 义 要求运算 对象的个数 结合方向 1 () [] -> . 圆括号 下标运算符 指向结构体成员运算符 结构体成员运算符 自左至右 2 ! 逻辑非运算符 1 (单目运算符) 自右至左 ~ 按位取反运算符 ++ 自增运算符 -- 自减运算符 - 负号运算符 (类...
一、jvm内存结构程序计数器(Program Counter Register)、JVM虚拟机栈(JVM Stacks)、本地方法栈(Native Method Stacks)、堆(Heap)、方法区(Method Area)(1)PCR尾随线程生命周期,记录当前运行到的.class字节码行数,用于...
1. auto_ptr 的设计动机:函数操作经常依照下列模式进行:获取一些资源执行一些动作释放所获取的资源那么面对这些资源的释放问题就会出现下面的两种情况:一开始获得的资源被绑定于局部对象,那么当函数退出的时候,这些局部对象的析构函数被自动的调用,从而自动释放掉这些资源;一开始获得的资源是通过某种显...
请注意:在构造和析构期间不要调用virtual函数,因为这类调用从不下降至derived class。