假设有这样的二维样本点(红色点),回顾我们前面探讨的是求一条直线,使得样本点投影到直线上的点的方差最大。本质是求直线,那么度量直线求的好不好,不仅仅只有方差最大化的方法。再回想我们最开始学习的线性回归等,目的也是求一个线性函数使得直线能够最佳拟合样本点,那么我们能不能认为最佳的直线就是回归后的直线呢?回归时我们的最小二乘法度量的是样本点到直线的坐标轴距离。比如这个问题中,特征是x,类标签是y。回归时最小二乘法度量的是距离d。如果使用回归方法来度量最佳直线,那么就是直接在原始样本上做回归了,跟特征选择就没什么关系了。
因此,我们打算选用另外一种评价直线好坏的方法,使用点到直线的距离d’来度量。
现在有n个样本点,每个样本点为m维(这节内容中使用的符号与上面的不太一致,需要重新理解符号的意义)。将样本点在直线上的投影记为,那么我们就是要最小化
这个公式称作最小平方误差(Least Squared Error)。
而确定一条直线,一般只需要确定一个点,并且确定方向即可。
第一步确定点:
假设要在空间中找一点来代表这n个样本点,“代表”这个词不是量化的,因此要量化的话,我们就是要找一个m维的点,使得
最小。其中是平方错误评价函数(squared-error criterion function),假设m为n个样本点的均值:
那么平方错误可以写作:
后项与
常用命令分为四类:
文件管理命令
文件操作
增——touch filename 创建新文件
删——rm 文件名
查——find 文件名 直接在硬盘里寻找
locate 文件名 文件名的部分匹配
whereis 文件名 从linux文件数据库(/var/lib/slocate/slocate.db)寻找
比较——diff file1 file2 比较两个文件的区别
移动——mv 相对路径文件 绝对路径文件
改名——mv 原文件名 新文件名
复制——cp /路径/文件 ./ 将绝对路径的文件复制到当前路径
文件目录
查看——pwd 查看当前路径
创建——mkdir 目录名
-p 如果给出的路径中父目录不存在,则同时创建父目录
删除——rm 目录名-r(rmdir:删除一个空目录(此命令个人认为没啥用,可以用rm -r替代))
-f -不提示不存在的文件,直接跳过
-i -每个删除动作都提示
-r和R -删除该目录下的所有
-v -显示每个文件的删除动作(建议用)
切换——cd 路径 -切换到所对应的路径
cd .. -返回上一级目录
cd ~ -切换到home目录
文件权限
查看权限——ls -l
如(-rwxr-xr--) r:读 w:写 x:执行
rwx:表示文件所有者的权限 二进制表示:111=7
r-x:表示同一群组中其他用户权限 二进制表示:101=5
r--:表示其他用户的权限 二进制表示:100=4
权限可以表示为:754
更改权限——chmod 权限 文件名
chmod 777 a.txt ===chmod a+rwx a.txt
chmod u-w file 给当前用户减去写权限
chmod g+r file 为file的属组加上读权限
chmod o+w file 为file的其它用户加上写权限
chmod a-x file 为file的所有用户减去执行权限
chown root /home 把/home的属主改成root用户
chgrp root /home 把/home的属组改成root组
文件显示
列表显示——ls
-lh 显示文件的详细信息
-s 显示文件大小
查看内容——cat 文件名 一屏显示文件所有内容
——more 文件名 分页查看文件内容
——less 文件名 可控分页查看文件内容
——head 文件名 显示文件的开始部分
——tail 文件名 显示文件的结尾部分
软件管理命令
软件安装
在线安装——sudo apt-get install packagename 安装packagename
sudo apt-get remove packagename 卸载packagename
sudo apt-get update 更新软件包
离线安装——下载软件包(解压)
tar [-cxtzjvfpPN] 文件与目录 ...
-c 创建包 -x释放包 -t查看包里面的文件
-v 显示命令过程 z-压缩包 f-使用档名
tar -zcvf abc.tar /mydoc/a.iso 将/mydoc/a.iso目录打包
tar -ztvf abc.tar 查看abc.tar中文件
tar -zxvf abc.tar 解压abc.tar包到当前目录
编译安装——./configure --prefix=/usr/local/ 编译前配置
make 编译
make install 安装编译好的源码包
查看安装
查询是否安装软件——dpkg -l|grep 软件名
软件被安装的位置——type 软件名
1.按照主键查询
2.按照条件查询,将结果,分两部分缓存,一是主键的集合,而是分主键,将每条数据都缓存掉
3.修改时候,按照主键改,去更新主键的缓存,这样,行和列的缓存都被更新
4.修改的时候,按照条件改,按照条件将查出主键id,更新缓存,然后按照主键id进行更新
5.删除,按照主键删的,将该主键缓存清空
6.删除,按照条件删的,同4
7.列取缓存的时候,从缓中,先取id列表,然后,用这些id去获取数据
8.要考虑的一些问题,数据插入如何解决
9.数据的limit 问题