身为一名中级PHPer菜鸟..无聊了就爱在各个PHP论坛瞎转.看到了好多PHP初学者都问到了很多相同的问题.而且我学PHP的时候也都遇到过.为了 让PHP初学者少走一些弯路.所以突然神经恍惚.决定写下此文章.仅供PHP初学者参考.如有错误.还望指出.不甚感激.
PHP其实是一种很简单易学的语言.如果要精通PHP多则三年.少则一年就足够了.但是为什么三年之后我们照样是菜鸟?
不知道从什么开始.学习PHP我们不得不学习数据库.学习架构.学习面向对象.学习前端.学习linux.学习协议甚至美工等直接导致了现在PHPer都是最累的一种程序员.
最累就不算什么了.往往PHP会被认为是下等的程序.拿着最低级的工资.却要掌握web方面几乎全部的知识.这实在是不公平.
可喜的是 我们逐渐在国内看到了转变.国内越来越多的公司从Java或者C#等转到了PHP.所以各位PHPer一定要有自己的梦想.你们都会很牛B的.请坚信.
扯远了.回到我要说的重点上.下面几个问题包含着我遇到的问题.也许我说的不一定对或者你不一定同意我的看法.十分愿意接受你的意见.总之我们只是想让PHPer都雄起:-)
1.编码的问题
这不光是PHP..只要是程序上.就会遇到.至少我和我身边的人都遇到了.而且在Web方面.往往编码问题更是非常难解决.非常难调试.有时候程序出了莫名其妙的问题,很难想到是编码出了问题等等.
这些问题总是困扰着我们.所以我建议PHP初学者.一定要编码统一.并且强烈建议统一为UTF-8.中文不建议使用GBK或者GB2312等.因为在AJAX中传输的时候是不认识这种编码的.
如果要统一编码,就要在编码可能出现的任何地方注意一下.
1) header头的编码
个人建议在你的PHP中都应该加上下面这句话(特殊header除外)
header("Content-type: text/html;charset=utf-8");
这样可以避免一些问题.比如我们可以看到有些网站submit后就是一个alert然后跳转.但是他们没有设置编码.如果他的编码跟浏览器的默认编码不一致.就会出现乱码了.
你是单纯的HTML.一定要记得把meta的编码标签放到title标签前面. 如果你不理解就记住把编码的信息放到head标签的第一行就可以了.最终的效果是这样的
<head>
<meta http-equiv="Content-Type" content="text/html; charset=utf-8" />
...
2) 文件的编码
我们保存文件的时候,选择编码一定要统一.如果按照上面的.我们就应该选择UTF-8.
一般的编辑器都有此文件的编码信息.如果你发现不是UTF-8.请马上更改.
比如我们在Dreamweaver中打开了一个模板文件.发现右下角显示 GB2312(简体中文).此时不要做任何更改.马上CTRL+J 然后选择编码更改成UTF-8模式并保存.
文件的编码不一定是PHP文件的.也得保证你的JavaScript文件与css文件都为UTF-8编码.
另外还有一个重要的一点.就是BOM..这个东东PHP是不太欢迎的.所以我们在保存的时候要选择UTF-8无BOM格式.如果你用的编辑器是UE.那么请你着重注意这一点.
3) 数据库的编码
这个我就不想多说了.网上有太多的文章.如果你是MySQL记得每次连接后进行SET NAMES = ‘utf8′就可以了.并且那个utf8中间是没有横线的.
2.MVC的问题
程序员理论上来说应该是个完美主义者.他们不光想着把程序写的运行就可以了.而且还要优雅.
但是话说回来.把程序按照MVC做了以后我们的代码就优雅了吗? 答案当然是否定的.
学习架构是一个理解的过程.当你真正体会到这个架构的好处的时候.才会理解其真正的含义.切勿盲目.
有时候我们会做这样的打算.用这个月的时间去学习MVC.好吧.我想你应该这样去做.你学会给自己定目标了.
但是一个月后我们也许并不能真正的理解MVC..但是至少我们会根据他的模式他的基本.换句话说也许我们没有学会葵花宝典.但是我们应该会用辟邪剑法了.
3.面向对象的问题
关于PHP面向对象的问题.一直都纠缠不清.有的人不觉得PHP面向对象是个好的东西.有的人甚至不认为面向对象是个好的玩意,比如Linus.
我们不必去纠缠这个东西到底好不好.至少我们应该知道从面向对象诞生到现在.经过了这么多年的演变.运用到各种项目甚至语言中.我们有理由相信存在即有其道理.
实践是检验真理的唯一标准.这么多年面向对象越发展形势越好.看来我们学习就变得是种必须了.
与一些架构的知识类似.面向对象也不是那么好学的.面向对象是种理念.但是具体到某种语言的时候.其意义也会发生一些微妙的变化.
PHP的面向对象很灵活.再加上其特有的魔术方法.会造就出一种特别形势的面向对象.也许这跟你平时看Java的面向对象不太一样.
不一定把你需要的方法放到一个类中就是面向对象.当你真正体会到面向对象给你的编码带来快捷.带来方便.你就对面向对象有更深的一层理解了.
正所谓欲速则不达.切勿心急.你想几天之内理解相对论那纯粹是扯淡.
4.算法的问题
似乎PHP与算法总是相距甚远的.PHP大多数算法都是基于数组实现的.而我们又知道PHP的数组的特性就注定当数组变得非常大的时候.效率会直线下降.
其实PHP就是个做网站的.大家不要也不必给她带什么高帽子.在Web方面尤其是在PHP所服务的前端的实际情况下会涉及到算法的地方会非常少.
PHP的算法面试题无非就是对数组或者对字符串的操作..动动脑子加上手册.那基本就没问题了.
那你也许会问.我想学习PHP.那我还学习算法吗?
我觉得你需要学.并且更需要学数据结构.这门功课就像是一门内功.会在潜移默化中影响你的编码.
这时候再配合上我们前面的辟邪剑法.恭喜你 你已经学会葵花宝典了!
5.框架的问题
PHP的框架是各种语言中最多的.用不用框架.选什么框架这又成为一个争议的话题..
我的建议是非常推荐学习至少一款框架.这可以加深你对PHP的认识.我们学习框架不是说要学这个框架怎么用.怎么做项目.
我们要去看它的源码.看看他是怎么实现的.这时候你就可以选择自己开发一个小型的框架.不求做的多好.不求别人多少项目去运用.
我们只是为了学习而已.
6.JavaScript的问题
可以说我看过这么多语言.最神奇就莫过于JavaScript了.平时Java一直宣称自己一切皆对象.其实我更觉得JavaScript才是一切皆对象.
JavaScript好学吗? 好学!其实在平时Web运用时候.一般的JavaScript操作就是DOM操作.
JavaScript难学吗? 难学!如果我们被其他语言的面向对象的思维束缚了.就很难理解JavaScript的面向对象.并且JavaScript里面概念也非常多.
prototype arguments call apply callee caller 闭包等概念就让我们不知所措.再加上诡异的JavaScript的代码风格与其难调试的特征直接导致我们这些菜鸟避而远之.
曾经我转发过一段实现document.ready的代码.其诡异程度不得不佩服.
个人觉得看一些JavaScript框架的源码就是最好的学习方法.曾经在写我的PHP框架的时候.由于使用了统一入口+自己定义的URL规则.所以再使用普通属性为get的form的时候就会获取不到参数.
这时候我就想到了jQuery.form中的formSerialize方法.摘选出来并做了一些修改.就可以拿来使用了.
7.CSS问题
我之所与把CSS跟JavaScript分开来说.我觉得CSS的学习更有特点.
其实要我说CSS是最简单的东西了.我们只是知道了一些基本的CSS属性.写页面绝对不成问题.
CSS的主要特征在于必须动手.你看N本CSS的书不如实际动手去写一个页面.
CSS另外一个特点就是得多试.也许这个属性不能达到你的效果.那你就换一个.这也是最笨最有效的办法:-)
当然 这只是初级CSS的要求. 会了这些之后 我们还得兼容浏览器. 其实这个也不难 无非就是几个浏览器同时开着一个属性一个属性的试.
也可以熟记一些hack 比如IE6认识_ IE都认识*等.如果你觉得这样写CSS不够标准.那么把hack放到不同的css文件中.比如ie6的就叫ie6.css
然后再页面上用下面的代码就可以了.
<!--[if lt IE 6]>
<link href="/blog_article/css/ie6.css" rel="stylesheet" type="text/css" />
<![endif]-->
更高级的当然是用户的体验与设计了.这个我也不懂就不说了@_@ 希望达人补充.
8.linux的问题
个人强烈建议每人的电脑上都安装一个linux系统.如果你觉得太折腾 可以选择wubi方式安装Ubuntu.对于懒人这个是最简单有效的方法了.
你无聊的时候可以下载一份PHP源码自己编译下试试.切忌apt-get.因为往往服务器版本不是rhel就是centos.那里是没有这个命令的.
而且apt-get到的往往不是最新的版本.并且又不能自己定制.
linux总会出现这样活着那样莫名其妙的问题.比如环境稍微不一样就编译不通过.服务起不来.
这时候不要着急.看错误提示 看日志.Google下自己尝试解决.
编译完不要觉得就完了 试试不同的配置.而且修改一下源码再编译试试.
比如我们下载了一份nginx的源码.然后修改下header头等一些地方. 就可以编译一份属于自己的HTTP Web Server了.
当然 你如果叫BWS或者GWS也行:-)
还有个问题 linux需要背命令吗? 这个是无可厚非的. 熟记一些常用的命令可以提高速度.这点我需要反思.经常一些常用的命令还需要看下参数..
另外一个就是Shell的问题. Shell其实不难.但是语法在我看来比较丑陋@_@. 看看wiki就可以学习大半了..主要还得是联系. 我们可以看到一个现象.一些公司在招聘高级PHPer的时候这条也列为必须条件了.
其实网上linux的资料非常多. 大多数你遇到的问题别人都会遇到.所以善于用Google. 并且熟读英语.
9.语言的问题
这个的问题就太多口水战了.最终谁也没有战胜谁.我们不必去参与这些无聊的事情.这些都是年轻粪青要做的.
你再牛B你有Linus牛B吗? 他喷C++的喷了这么多年.C++怎么样了?
所以我们不必纠缠这些.做好自己做的就OK了.
既然你选择了PHP.就不要犹豫.
也许我们在做项目的时候PHP显得不够用了.那我们可以用Java或者C来做个中间件.这又何尝不可.
一种语言发挥她的最大最用才是真理.
10.态度的问题
态度一定要谦虚谨慎. 这是作为一个程序员应该有的美德.切勿自我膨胀.
你学的越多 你就会发现自己不足就越多.
等你牛B了你可以说一些狂妄的话.但是现在我们都不牛B.至少如果你看到我写的这篇文章.你应该还不太牛B. 我说了这篇文章是面向初学者的:-)
11.女人的问题
呃..这个自己解决吧@_@
举个文中的例子
<?php
echo "Hello World";
$a = 1 + 1;
echo $a;
?>
PHP执行这段代码会经过如下4个步骤(确切的来说,应该是PHP的语言引擎Zend)
1.Scanning(Lexing) (扫描),将PHP代码转换为语言片段(Tokens)
2.Parsing(语法分析), 将Tokens转换成简单而有意义的表达式
3.Compilation(编译), 将表达式编译成Opocdes
4.Execution(执行编译后的结果), 顺次执行Opcodes,每次一条,从而实现PHP脚本的功能。
其中他还提到一句:“现在有的Cache比如APC,可以使得PHP缓存住Opcodes,这样,每次有请求来临的时候,就不需要重复执行前面3步,从而能大幅的提高PHP的执行速度。 ” 这可能是php执行速度比较快的原因之一吧~
那什么是Lexing? 学过编译原理的同学都应该对编译原理中的词法分析步骤有所了解,Lex就是一个词法分析的依据表。 Zend/zend_language_scanner.c会根据Zend/zend_language_scanner.l(Lex文件),来输入的 PHP代码进行词法分析,从而得到一个一个的“词”,PHP4.2开始提供了一个函数叫token_get_all,这个函数就可以讲一段PHP代码 Scanning成Tokens;
如果用这个函数处理我们开头提到的PHP代码,将会得到如下结果:
Array
(
[0] => Array
(
[0] => 367
[1] => Array
(
[0] => 316
[1] => echo
)
[2] => Array
(
[0] => 370
[1] =>
)
[3] => Array
(
[0] => 315
[1] => "Hello World"
)
[4] => ;
[5] => Array
(
[0] => 370
[1] =>
)
[6] => =
[7] => Array
(
[0] => 370
[1] =>
)
[8] => Array
(
[0] => 305
[1] => 1
)
[9] => Array
(
[0] => 370
[1] =>
)
[10] => +
[11] => Array
(
[0] => 370
[1] =>
)
[12] => Array
(
[0] => 305
[1] => 1
)
[13] => ;
[14] => Array
(
[0] => 370
[1] =>
)
[15] => Array
(
[0] => 316
[1] => echo
)
[16] => Array
(
[0] => 370
[1] =>
)
[17] => ;
)
分析这个返回结果我们可以发现,源码中的字符串,字符,空格,都会原样返回。每个源代码中的字符,都会出现在相应的顺序处。而,其他的比如标签,操作符, 语句,都会被转换成一个包含俩部分的Array: Token ID (也就是在Zend内部的改Token的对应码,比如,T_ECHO,T_STRING),和源码中的原来的内容。
接下来,就是Parsing阶段了,Parsing首先会丢弃Tokens Array中的多于的空格,然后将剩余的Tokens转换成一个一个的简单的表达式
1.echo a constant string
2.add two numbers together
3.store the result of the prior expression to a variable
4.echo a variable
然后就改Compilation阶段了,它会把Tokens编译成一个个op_array, 每个op_arrayd包含如下5个部分:
1.Opcode数字的标识,指明了每个op_array的操作类型,比如add , echo
2.结果 存放Opcode结果
3.操作数1 给Opcode的操作数
4.操作数2
5.扩展值 1个整形用来区别被重载的操作符
比如,我们的PHP代码会被Parsing成:
* ZEND_ECHO 'Hello World'
* ZEND_ADD ~0 1 1
* ZEND_ASSIGN !0 ~0
* ZEND_ECHO !0
呵呵,你可能会问了,我们的$a去那里了?
恩,这个要介绍操作数了,每个操作数都是由以下俩个部分组成:
a)op_type : 为IS_CONST, IS_TMP_VAR, IS_VAR, IS_UNUSED, or IS_CVb)u,一个联合体,根据op_type的不同,分别用不同的类型保存了这个操作数的值(const)或者左值(var)而对于var来说,每个var也不一样
IS_TMP_VAR, 顾名思义,这个是一个临时变量,保存一些op_array的结果,以便接下来的op_array使用,这种的操作数的u保存着一个指向变量表的一个句柄(整数),这种操作数一般用~开头,比如~0,表示变量表的0号未知的临时变量
IS_VAR 这种就是我们一般意义上的变量了,他们以$开头表示
IS_CV 表示ZE2.1/PHP5.1以后的编译器使用的一种cache机制,这种变量保存着被它引用的变量的地址,当一个变量第一次被引用的时候,就会被CV起来,以后对这个变量的引用就不需要再次去查找active符号表了,CV变量以!开头表示。
这么看来,我们的$a被优化成!0了。
总结:
1.php的执行顺序是: -> php程序
-> 被Scanning(扫描转换为Tokens(语言片段))
-> 被Parsing(语法分析,将Tokens转换成简单而有意义的表达式)
-> Compilation(编译,将表达式编译成Opocdes(操作码))
-> Execution(顺序执行编译后的结果)
2. APC(Alternative PHP Cache)的缓存机制可以缓存住Opcodes,这样,下次有请求来临的时候,就不需要重复执行前面3步,从而能大幅的提高PHP的执行速度。 这可能是php执行速度比较快的原因之一
补充:
apc,zend optimize是之所以能够加速php
就是因为他可以缓存opcode
并不是zend引擎本身自带的功能
zend引擎默认是一个轮回中任何一项都要走的
手机号码:
$mode = "/^1[358]\d{9}/";
邮箱地址:
$mode = "/^[a-z][-_\.]?[a-z\d]*@[a-z0-9]+[\.][a-z]{2,4}/i";
---------------------------------------------------------- 正则基础
$mode = "/^1[358]\d{9}/i";
匹配模块必须以 / / 开始和结束,第二个 / 后可以加模式修正符
原子
①a-z A-Z _ 0-9 //最常见的字符
②(abc) //用圆括号括起来起来的单元符号
③[abcs] [^abd] //用方括号括起来的原子表,
原子表中的^代表排除或相反内容
\d 包含所有数字[0-9]
\D 除所有数字外[^0-9]
\w 包含所有英文字符[a-zA-Z_0-9]
\W 除所有英文字符外[^a-zA-Z_0-9]
\s 包含空白区域如回车、换行、分页等 [\f\n\r]
元字符
* 匹配前一个内容的0次1次或多次
+ 1次或多次
? 0次或1次
. 代表任意一个字符(除了回车换行)
| 相当与php的 || (“或”的意思)
^ 强制匹配字符串首部内容
$ 强制匹配字符串尾部内容
[^abc] 匹配除了a或b或c之外的内容
\b 匹配单词边界,边界可以是空格或者特殊符号
\B 匹配除带单词边界以外的内容
{m} 匹配前一个内容的重复次数为M次
{m,} 匹配前一个内容的重复次数大于等于M次
{m,n} 匹配前一个内容的重复次数M次到N次
( ) 整体匹配,并放入内存,可使用\\1 或 \\2 …依次获取
优先级:依次降低
( ) 圆括号因为是内存处理所以最高
* ? + { } 重复匹配内容其次
^ $ \b 边界处理第三
| 条件处理第四
最后按照运算顺序计算匹配
常用修正符: $mode = "/正则/U";
i 正则内容在匹配时候不区分大小写(默认是区分的)
m 在匹配首内容或者尾内容时候采用多行识别匹配
S 将回车转化为空格
x 忽略正则中的空白
A 强制从头开始匹配
D 强制$匹配尾部无任何内容 \n
U 禁止贪婪匹配,只跟踪到最近的一个匹配符并结束,
常用在采集程序上的正则表达式
应用
preg_match_all ( string pattern, string subject, array matches [, int flags] )
截取比较详细的内容,采集网页,分析文本
preg_replace ( mixed pattern, mixed replacement, mixed subject [, int limit] )
preg_replace ( mixed pattern, mixed replacement, mixed subject [, int limit] )
提示 1、替换内容可以是一个正则也可以是数组正则
2、替换内容可以通过修正符e来解决替换执行内容
preg_split ( string pattern, string subject [, int limit [, int flags]] )
通过正则表达式来切割相关内容,类似之前学过的explode切割函数,但explode
只能按照一种方式切割有局限性。
------------------------------------------------- 调试代码
[code]
<?php
$mode = "/^[a-z][-_\.]?[a-z\d]*@[a-z0-9]+[\.][a-z]{2,4}/i";
$str = "a12345@";
echo $str.'<hr>';
if(preg_match($mode, $str, $arr)){
echo 'succeed -- <font color=red>'.$arr[0];
}else{
echo 'failed';
}
?>
[code]