1、动态规划算法:
动态规划:通过把原问题分解为相对简单的子问题的方式求解复杂问题的方法。动态规划常常适用于有重叠子问题和最优子结构性质的问题。
基本思想:若要解一个给定问题,我们需要解其不同部分(即子问题),再合并子问题的解以得出原问题的解。 通常许多子问题非常相似,为此动态规划法试图仅仅解决每个子问题一次,从而减少计算量: 一旦某个给定子问题的解已经算出,则将其记忆化存储,以便下次需要同一个子问题解之时直接查表。 这种做法在重复子问题的数目关于输入的规模呈指数增长时特别有用。
与分治法区别:动态规划算法与分治法类似,都使用了将问题实例归纳为更小的、相似的子问题,并通过求解子问题产生一个全局最优值的思路,但动态规划不是分治法:关键在于分解出来的各个子问题的性质不同。分治法要求各个子问题是独立的(即不包含公共的子问题),因此一旦递归地求出各个子问题的解后,便可自下而上地将子问题的解合并成原问题的解。如果各子问题是不独立的,那么分治法就要做许多不必要的工作,重复地解公共的子问题。动态规划与分治法的不同之处在于动态规划允许这些子问题不独立(即各子问题可包含公共的子问题),它对每个子问题只解一次,并将结果保存起来,避免每次碰到时都要重复计算。
相关术语:
(1)阶段:把所给求解问题的过程恰当地分成若干个相互联系的阶段,以便于求解,过程不同,阶段数就可能不
同,描述阶段的变量称为阶段变量。在多数情况下,阶段变量是离散的。此外,也有阶段变量是连续的情形。如果过程可以在任何时刻作出决策,且在任意两个不同的时刻之间允许有无穷多个决策时,阶段变量就是连续的。
(2)状态:状态表示每个阶段开始面临的自然状况或客观条件,也称为不可控因素。过程的状态通常可以用一个或一组数来描述,称为状态变量。一般状态是离散的,但有时为了方便也将状态取成连续的。
(3)无后效性:状态具有下面的性质,如果给定某一阶段的状态,则在这一阶段以后过程的发展不受这阶段以前各段状态的影响,所有各阶段都确定时,整个过程也就确定了。换句话说,过程的每一次实现可以用一个状态序列表示,在前面的例子中每阶段的状态是该线路的始点,确定了这些点的序列,整个线路也就完全确定。从某一阶段以后的线路开始,当这段的始点给定时,不受以前线路,所通过的点,的影响。状态的这个性质意味着过程的历史只能通过当前的状态去影响它的未来的发展,这个性质称为无后效性。
(4)决策:一个阶段的状态给定以后,从该状态演变到下一阶段某个状态的一种选择(行动)称为决策。在最优控制中,也称为控制。在许多间题中,决策可以自然而然地表示为一个数或一组数。不同的决策对应着不同的数值。描述决策的变量称决策变量,因状态满足无后效性,故在每个阶段选择决策时只需考虑当前的状态而无须考虑过程的历史。决策变量的范围称为允许决策集合。
(5)策略:由每个阶段的决策组成的序列称为策略。对于每一个实际的多阶段决策过程,可供选取的策略有一定的范围限制,这个范围称为允许策略集合。允许策略集合中达到最优效果的策略称为最优策略。
(6)最优性原理: 作为整个过程的最优策略,它满足,相对前面决策所形成的状态而言,余下的子策略必然构成―最优子策略。
问题特征:
(1)最优子结构:当问题的最优解包含了其子问题的最优解时,称该问题具有最优子结构性质。
(2)重叠子问题:在用递归算法自顶向下解问题时,每次产生的子问题并不总是新问题,有些子问题被反复计算多次。动态规划算法正是利用了这种子问题的重叠性质,对每一个子问题只解一次,而后将其解保存在一个表格中,在以后尽可能多地利用这些子问题的解。
算法步骤:
(1)分析最优值的结构,刻画其结构特征;
(2)递归地定义最优值;
(3)按自底向上或自顶向下记忆化的方式计算最优
2、斐波那契数列(Fibonacci polynomial)
计算斐波那契数列(Fibonacci polynomial)的一个最基础的算法是,直接按照定义计算:
//2m1 未优化斐波那契数列计算 #include "stdafx.h" #include<iostream> using namespace std; void input(int &n); int fib(int n); int main() { int n; input(n); cout<<"fib("<<n<<")="<<fib(n)<<endl; return 0; } void input(int &n) { cout<<"请输入n:"<<endl; cin>>n; } int fib(int n) { if(n==0 || n==1) { return 1; } else { return fib(n-1) + fib(n-2); } }以上代码在n=5时,fib(5)的计算过程如下:
//2m1 避免重复运算的斐波那契数列运算 #include "stdafx.h" #include <iostream> #include <map> using namespace std; void input(int &n); int fib(int n,map<int,int>); int main() { map<int,int> my_Map; int n; input(n); cout<<"fib("<<n<<")="<<fib(n,my_Map)<<endl; return 0; } void input(int &n) { cout<<"请输入n:"<<endl; cin>>n; } int fib(int n,map<int,int> my_Map) { if(n==0 || n==1) { return 1; } else { map<int,int>::iterator iter = my_Map.find(n); if(iter==my_Map.end()) { int temp = fib(n-1,my_Map) + fib(n-2,my_Map); my_Map.insert(pair<int,int>(n,temp)); return temp; } else { return iter->second; } } }
尽管网上介绍GitHub的使用很多,但最容易掌握的还是直接去GitHub的官网寻求解决方法。
总结来说使用GitHub分为如下几步:
1. 注册GitHub账号
2. 下载并安装msgit,下载链接:http://git-scm.com/downloads
3. 本地设置Git,包括username, email, ssh key之类的。
4. 在GitHub上create一个repo,然后在本地机器上面对工程进行管理。
5. 根据个人需要可以fork别人的project进行本地开发
如果有什么不清楚,可以参考https://help.github.com/
Luke介绍
Luke是一个方便的索引查看和诊断工具,可以访问Lucene构建的索引文件,显示和修改某些索引内容。能提供:
- 通过document编号或term浏览索引
- 查看document内容,可复制到剪贴板
- 对频率最高的term的索引字段提供排名后的浏览
- 执行搜索语句并浏览搜索结果
- 分析搜索结果
- 从索引中选择性删除文件
- 重建原始文档字段,对其进行编辑,然后重新插入的索引
- 优化索引
- 可以打开hadoop文件系统内的索引文件
Luke使用
从google code里下载lukeall的jar包,直接java -jar lukeall-version.jar 即可启动。
启动后选择你的索引文件路径,选择read-only打开:
overview界面是用来进行索引的一般性查看和操作的,比如索引目录,域信息,版本,term信息,Rank排名等信息。注意,索引文件里Analyze却不Store的字段信息还是不可见的,也就是只能看STORE了的内容。
documents界面是用来进行文档的操作和查看的,能根据文档编号和词进行查找,其实这个就是搜索功能。
search界面是可以进行索引的搜索测试,可以编写lucene搜索语句,看到语句解析后的query树,还可以选择进行搜索的分词器、默认字段和重复搜索次数,然后下面的listview中就会列出一个搜索的的文档的所有保存的(store)字段的值,可以看到查询花费的时间
file界面,故名思义,这个就是用来查看每个索引相关文件的一些属性的界面,具体的话,可以通过这个界面分析下索引文件的多少,是否需要优化或者合并等等
最后一个plugins界面,就是可以看到luke提供的各种插件。比较有用的还是分词工具,提供一个分词的类,然后下面文本框输入一段文本,然后就可以让这个工具帮你分词,你可以看到详细的分词信息,对自定义分词器的调试或者测试。还有一个hadoop插件,支持从hadoop节点中获取节点中文件的相关信息,对分布式搜索引擎搭建有用,算是支持多平台的lucene索引文件块的查看。
个人理解
其实Lucene构建的索引,无论从结构上说还是功能上说,和一个DBMS数据库很相似,你可以认为Luke做的事情就是包装了Lucene的IndexReader和IndexSearcher之后,变成一个界面化的索引展示和管理工具。你完全可以自己写程序在cmd里查看,但是没有Luke提供的展示那么直观和多样。
Luke只提供带桌面界面的操作系统,就是说你的linux服务器,如果是命令行界面的话,是使用不了Luke来查看的,这是不是一个可以想办法改进的地方?
luke源码结构简单,通过使用luke并阅读源码,对这个工具一定可以有更全面的认识。