当前位置:  互联网>综合
本页文章导读:
    ▪Simplify Path      题目: Given an absolute path for a file (Unix-style), simplify it. For example, path = "/home/", => "/home" path = "/a/./b/../../c/", => "/c" 分析:此题主要需注意以下两点 1、结果起码.........
    ▪机器学习中贝叶斯判决、概率分布、样本等概念间的关系      以下是在看模型识别,机器学习及数理统计时,对贝叶斯决策、概率分布、样本关系的总结,每想到一点就写下来,比较乱,这块需要反复学习、慢慢理解。 1. 机器学习的一些概念: 什么.........
    ▪Eclipse Color Theme       介绍一个Eclipse颜色主题插件 Eclipse Color Themes 当然也可以自行编辑里面的配色方案等. 作者:lc19850921 发表于2013-5-22 15:34:05 原文链接 阅读:68 评论:0 查看评论 ......

[1]Simplify Path
    来源: 互联网  发布时间: 2013-10-24

题目:

Given an absolute path for a file (Unix-style), simplify it.

For example,
path = "/home/", => "/home"
path = "/a/./b/../../c/", => "/c"

分析:此题主要需注意以下两点

1、结果起码有一个"/"

2、当有一个这样的形式/../,就代表少一个路径

代码如下:

        string simplifyPath(string path) {

        int n=path.length();
        if(n<=1)return path;
        string result;
        int numdot=0,numdoubledot=0,g=0;//分别表示"."的个数,".."的个数,g其实是个标量
        bool flag=false;
        for(int i=n-1;i>=0;i--)
        {
            if(path[i]=='/')
            {
                if(flag)
                {
                    result=path[i]+result;
                    flag=false;
                }
                if(g)
                {
                    g=0;
                    numdoubledot--;
                }
                numdot=0;
            }
            else if(path[i]=='.')
            {
                if(flag)
                {
                    result=path[i]+result;
                }
                else
                {
                    numdot++;
                    if(numdot==2)
                    {
                        numdot=0;
                        numdoubledot++;
                    }
                }
            }
            else
            {
                if(numdoubledot)
                {
                    g++;
                }
                else
                {
                    result=path[i]+result;
                    flag=true;
                }
            }
        }
        if(result.length()==0)result+=path[0];
        return result;
    }
作者:chunxia75qin 发表于2013-5-22 17:07:44 原文链接
阅读:51 评论:0 查看评论

    
[2]机器学习中贝叶斯判决、概率分布、样本等概念间的关系
    来源: 互联网  发布时间: 2013-10-24

以下是在看模型识别,机器学习及数理统计时,对贝叶斯决策、概率分布、样本关系的总结,每想到一点就写下来,比较乱,这块需要反复学习、慢慢理解。


1. 机器学习的一些概念:

什么是机器学习?

机器学习包含哪些基本要素?


机器学习,就是由已知数据,训练出一个模型,形成一个假设的空间,在拿到新的数据后,能在假设空间搜索出一个合理的结果。

搜索出合理的结果,只是评价机器学习的效果,模型的好坏。


如何建立模型,才是机器学习算法的核心,包括假设,推理,验证。


如何保证目标概念在假设空间内?

是否有包含所有假设的空间?

如何保证收敛?

假设空间的大小与训练样例数量的关系?


概率、贝叶斯公式与机器学习的关系?

概率论,特别是贝叶斯公式,为机器学习提供了强有力的推导依据。


1. 统计与概率、机器学习是什么关系?

概率论及其分布函数、特性,是理论基础。而统计是应用,利用样本统计量来估计概率模型中的参数,而后更进一步获取更有用的统计数据。

统计是机器学习中统计判决部分的理论基础。或者是说统计分析在机器学习方面的应用。


2. 

贝叶斯学习

两个前提条件:

1)类别,一般是已知类别的个数,各个类别的需要概率的初始知识,即先验概率P(h)。

2)特征数据在各个类别中的概率分布,即先验条件分布P(x|h)。


待解决的问题:

已知采集的数据:

训练数据D:包含特征数据和类别

求:

假设的分类面,或者一个采集到数据的分类。


其中,问题又可分为 类别的先验概率P(h)已知,和未知两种情况。

1)P(h)已知的情况。求解,相对简单,普通的贝叶斯公式。


2)P(h)未知,但一种类别的错误率已知的情况,求另外一个类别的错误率。可以利用聂曼-皮尔逊决策(N-P判决)来计算决策面。


3. h为类别,D为特征数据,P(D|h)与P(h|D)的区别?

计算假设目标的概率P(D|h). 假设成立时,观测到D的概率。有多种假设 都能观测到数据D,每种假设所占的比率。先验概率

P(h|D),假设h的后验概率,其反应了训练数据后,假设h成立的概率。其反应了训练数据的影响。

但先验概率p(h)是与训练数据D相互独立的.


极大后验假设MAP, max a posteriori 最大可能假设。

MAP = max(P(h|D))


贝叶斯推理的概率,很大程度上依赖于 先验概率。 首先,需要知道 先验概率。


由贝叶斯推理,推导出最大似然估计,再推导出最小方差估计(平方误差最小估计)。

---------------------------------------

1. 

在模式分类中,贝叶斯决策,比较简单的场景是:先验概率已知,然后,某两种或多种条件下,某事件发生的概率已知。 求出后验概率,即贝叶斯公式,根据后验概率的大小,做出决策。


稍微复杂的场景:

先验概率已知,连续概率密度函数的类型已知,但是参数未知。 有大量的抽样数据,

则据抽样数据,估计概率密度函数的参数。


然后,据贝叶斯公式,计算出决策函数,决策面。


拿到决策面,就能对测试数据进行分类了。


在这里,有几个问题,如果弄清楚,对贝叶斯决策就会由比较清晰的掌握。

1)什么判决函数,什么是判决面?

对特征点进行分类的界面,就是判决面;而分类界面的函数就是判决函数。


2) 后验概率与贝叶斯公式的关系,使用后验概率、贝叶斯决策的先决条件?

类别的经验分布概率、特征在不同类别下的先验概率(即条件概率)已知,或者可计算


3)经典分布概率,包括

类别的先验概率

类别特征的条件经验分布概率,即特征在不同类别中的概率


4) max 与最小误差判决面的关系


5)高斯分布

如何求每个类别的高斯分布?

相邻判决面的求解?那非相邻类别那?


6)高斯分布的分类,哪些因素有关?

均值:决定中心位置

方差:决定了判决面到中的距离


7) 错误率有哪些?

P1(e): P(w2|x), 分类为w1时,错误率

P2(e): P(w1|x), 分类为w2时,错误率

如何计算总的错误率?

P(e) = 积分(max[P(w2|x)*P(x), P(w1|x)*P(x)])


如何应用最大似然估计推导错误率?

错误样本的个数t,总样本个数为N,假设错误率为e

则其联合分布密度为

二项分布

求极值

计算出,错误率的估计量 t/N


8)聂曼-皮尔逊决策 的使用场景:

P(wi)先验概率未知,在P2(e)已知的情况下,使P1(e)尽可能小的决策面。求判决阈值。


采用拉格朗日乘数法 进行推导计算。

因为P1(e)错误的后果比较严重,所以要严格限制其错误率。

两种类别的概率密度函数已知:p(x|w1), p(x|w2)

则判决函数为 p(x|w1) / p(x|w2)

判决面为 p(x|w1) / p(x|w2) = lamda, lamda为阈值。


阈值lamda如何求解?

已知错误率P1(e),p(x1 | w1), 查表,可以求出阈值



9) 均值向量,协方差矩阵未知情况下,如何利用样本进行估计

向量形式:均值


协方差矩阵:


bays的训练,就是利用各个类别的样本,估计各个类别的方差和均值。然后计算决策面。


判决函数,应该是一组空间的集合;而判决面就是两组空间的交集/交面。

---------------------------------------


归纳偏置

什么是无偏的学习器?

期望与样本均值相等。线性特征。

学习器必须对目标概念做预先的假设,否则无法对未来的实例进行分类。

由于归纳学习需要预先假设,这种形式,被称为归纳偏置。 用自己话说就是 归纳假设。


如何评估假设?

1. 估计的方差

均值的误差程度,也是概率分布的宽度或散度。随机变量与其均值的差有多大。即使均值无偏,方差可能比较大。

2. 估计的偏差

期望值,与真实值,差距


精度的分析

即或是分类的精度

样本错误率:统计样本被错误分类的比率

真实错误率:按真实概率分布抽取实例,然后统计器错误率


样本错误率与真实错误率的关系?

样本错误率是对真实错误率的估计。

如何评价这种估计?

统计理论:

100%:真实错误率,是样本错误率

95%:真实错误率,是一个区间,以样本错误率为中心的区间

百分比,又称为置信度,而真实错误率的区间,又称为,置信区间。对于二项分布,样本个数越大,置信度不变,置信区间就越小。


测试样本错误率多次

每次选用不同的样本,统计的错误率符合 二项分布。


独立且多次尝试的0-1实验,生成一个独立的、同分布的随机变量序列,这个序列

其分布为 二项分布



np(1-p) >= 5 或 n>=30时,二项分布可以用正态分布近似表示。

--------------------------------------------------

1. 朴素贝叶斯分类器

即MAP,最大后验概率分类器。如何训练分类器?

已知训练数据。

只需统计各个类别的频率p(h),及特征数据在各个类别中的频率(D|h)。

已知待分类数据D,可以求其max(P(h|D)),等同于max(p(hj) * p(D|hj))


2. 贝叶斯网络

是指一组条件概率,而朴素贝叶斯分类器假设所有特征变量是相互独立的。而贝叶斯网络将此条件放宽。

理解贝叶斯网络,就需要理解条件独立性。两个变量间无相互影响,及相互独立。条件独立,两个变量,在给定条件下,如第三个变量的指定值的条件下,相互独立。


条件概率,具有传播性,形成一个链式的规则。

x -> y -> z -> w

每两个相邻变量的条件概率都知道,如何求P(w|x)。这就是贝叶斯定理的概率传播。


联合概分布的求解。

p(xyzw) = p(x) * p(y|x) * p(z|x,y) * p(w|x, y, z)


贝叶斯网络的一个重要性质,一个节点独立于非前驱节点。即p(xi | x(i-1)...x1) = p(xi | x(i-1)) 类似马尔科夫过程。

贝叶斯网络,也可以看做马尔科夫链的非线性扩展。


结构形式:

有向无环图(DAG),即是一个前向多段图的结构


如何学习

    
[3]Eclipse Color Theme
    来源: 互联网  发布时间: 2013-10-24

每天和Eclipse相处, 是否希望牠变得可人一些?


介绍一个Eclipse颜色主题插件 Eclipse Color Themes

Eclipse直接安装, 地址 http://eclipse-color-theme.github.io/update/

安装成功后,打开首选项


会发现下方有一个"Import a theme"按钮, 可以去官网上去下载自己喜欢的主题.

比如我喜欢这个主题:


可以下载此主题的xml文件.

然后点那个"Import a theme"按钮, 就可以导入此主题.

当然也可以自行编辑里面的配色方案等.

作者:lc19850921 发表于2013-5-22 15:34:05 原文链接
阅读:68 评论:0 查看评论

    
最新技术文章:
▪用户及权限基础 2---- Linux权限    ▪用户及权限基础 3---- Linux扩展权限    ▪git 简明教程(1) --创建及提交
▪背包 代码    ▪json对象的封装与解析    ▪01背包,完全背包,多重背包 ,模板代码
▪apache安装详解    ▪HDU 4668 Finding string (解析字符串 + KMP)    ▪《TCP-IP详解 卷1:协议》学习笔记(二)
▪《TCP-IP详解 卷1:协议》学习笔记(持续更新...    ▪windows下使用swig    ▪gensim试用
▪Linux Shell脚本编程--nc命令使用详解    ▪solr对跨服务器表联合查询的配置    ▪递归和非递归实现链表反转
▪Linux磁盘及文件系统管理 1---- 磁盘基本概念    ▪Cholesky Decomposition    ▪HTTP协议学习
▪用C语言写CGI入门教程    ▪用hdfs存储海量的视频数据的设计思路    ▪java多线程下载的实现示例
▪【原创】eAccelerator 一个锁bug问题跟踪    ▪hadoop学习之ZooKeeper    ▪使用cuzysdk web API 实现购物导航类网站
▪二维数组中的最长递减子序列    ▪内嵌W5100的网络模块WIZ812MJ--数据手册    ▪xss 跨站脚本攻击
▪RobotFramework+Selenium2环境搭建与入门实例    ▪什么是API    ▪用PersonalRank实现基于图的推荐算法
论坛 iis7站长之家
▪CI8.7--硬币组合问题    ▪Ruby on Rails 学习(五)    ▪如何使用W5300实现ADSL连接(二)
▪不允许启动新事务,因为有其他线程正在该会...    ▪getting start with storm 翻译 第六章 part-3    ▪递归求排列和组合(无重复和有重复)
▪工具类之二:RegexpUtils    ▪Coding Interview 8.2    ▪Coding Interview 8.5
▪素因子分解 Prime factorization    ▪C# DllImport的用法    ▪图的相关算法
▪Softmax算法:逻辑回归的扩展    ▪最小生成树---Kruskal算法---挑战程序设计竞赛...    ▪J2EE struts2 登录验证
▪任意两点间的最短路径---floyd_warshall算法    ▪Sqoop实现关系型数据库到hive的数据传输    ▪FFMPEG采集摄像头数据并切片为iPhone的HTTP Stream...
▪Ubuntu 13.04 – Install Jetty 9    ▪TCP/IP笔记之多播与广播    ▪keytool+tomcat配置HTTPS双向证书认证
▪安装phantomjs    ▪Page Redirect Speed Test    ▪windows media player 中播放pls的方法
▪sre_constants.error: unbalanced parenthesis    ▪http headers    ▪Google MapReduce中文版
▪The TCP three-way handshake (connect)/four wave (closed)    ▪网站反爬虫    ▪Log4j实现对Java日志的配置全攻略
▪Bit Map解析    ▪Notepad 快捷键 大全    ▪Eclipse 快捷键技巧 + 重构
▪win7 打开防火墙端口    ▪Linux Shell脚本入门--awk命令详解    ▪Linux Shell脚本入门--Uniq命令
▪Linux(Android NDK)如何避免僵死进程    ▪http Content-Type一览表    ▪Redis实战之征服 Redis + Jedis + Spring (二)
▪Tomcat7.0.40 基于DataSourceRealm的和JDBCRealm的资源...    ▪利用SQOOP将ORACLE到HDFS    ▪django输出 hello world
▪python re    ▪unity3D与网页的交互    ▪内存共享基本演示
▪python join    ▪不再为无限级树结构烦恼,且看此篇    ▪python实现变参
▪打开文件数限制功能不断地制造问题    ▪Arduino Due, Maple and Teensy3.0 的 W5200性能测试    ▪Selenium实例----12306网站测试
▪基于协同过滤的推荐引擎    ▪C4.5决策树    ▪C#HTTP代理的实现之注册表实现
▪nosql和关系型数据库比较?    ▪如何快速比较这两个字符串是否相等?    ▪hdoj 1863 畅通工程 最小生成树---prime算法
 


站内导航:


特别声明:169IT网站部分信息来自互联网,如果侵犯您的权利,请及时告知,本站将立即删除!

©2012-2021,,E-mail:www_#163.com(请将#改为@)

浙ICP备11055608号-3