一篇有意思的技术文章php介绍...-理解php原理的opcodes(操作码)-PHP下常用正则表达式整理

当前位置: 编程技术>php

本页文章导读:

▪一篇有意思的技术文章php介绍篇身为一名中级PHPer菜鸟..无聊了就爱在各个PHP论坛瞎转.看到了好多PHP初学者都问到了很多相同的问题.而且我学PHP的时候也都遇到过.为了让PHP初学者少走一些弯路.所以突然神经恍惚.决定写下.........

▪理解php原理的opcodes(操作码) Opcondes是一种php脚本编译后的中间语言，就像Java的Byte Code，或者.NET 的MSL 。(都没了解过~) 　　举个文中的例子代码如下: <?php 　　echo "Hello World"; 　　$a = 1 + 1; 　　 echo $a; 　　?> PHP执.........

▪PHP下常用正则表达式整理 --------------------------------------------------------- 正则收藏手机号码： $mode = "/^1[358]\d{9}/"; 邮箱地址： $mode = "/^[a-z][-_\.]?[a-z\d]*@[a-z0-9]+[\.][a-z]{2,4}/i"; ---------------------------------------------------------- .........

[1]一篇有意思的技术文章php介绍篇

来源: 互联网发布时间: 2013-11-30

身为一名中级PHPer菜鸟..无聊了就爱在各个PHP论坛瞎转.看到了好多PHP初学者都问到了很多相同的问题.而且我学PHP的时候也都遇到过.为了让PHP初学者少走一些弯路.所以突然神经恍惚.决定写下此文章.仅供PHP初学者参考.如有错误.还望指出.不甚感激.
PHP其实是一种很简单易学的语言.如果要精通PHP多则三年.少则一年就足够了.但是为什么三年之后我们照样是菜鸟?
不知道从什么开始.学习PHP我们不得不学习数据库.学习架构.学习面向对象.学习前端.学习linux.学习协议甚至美工等直接导致了现在PHPer都是最累的一种程序员.
最累就不算什么了.往往PHP会被认为是下等的程序.拿着最低级的工资.却要掌握web方面几乎全部的知识.这实在是不公平.
可喜的是我们逐渐在国内看到了转变.国内越来越多的公司从Java或者C#等转到了PHP.所以各位PHPer一定要有自己的梦想.你们都会很牛B的.请坚信.
扯远了.回到我要说的重点上.下面几个问题包含着我遇到的问题.也许我说的不一定对或者你不一定同意我的看法.十分愿意接受你的意见.总之我们只是想让PHPer都雄起:-)
1.编码的问题
这不光是PHP..只要是程序上.就会遇到.至少我和我身边的人都遇到了.而且在Web方面.往往编码问题更是非常难解决.非常难调试.有时候程序出了莫名其妙的问题,很难想到是编码出了问题等等.
这些问题总是困扰着我们.所以我建议PHP初学者.一定要编码统一.并且强烈建议统一为UTF-8.中文不建议使用GBK或者GB2312等.因为在AJAX中传输的时候是不认识这种编码的.
如果要统一编码,就要在编码可能出现的任何地方注意一下.

1) header头的编码
个人建议在你的PHP中都应该加上下面这句话(特殊header除外)

代码如下:

header("Content-type: text/html;charset=utf-8");

这样可以避免一些问题.比如我们可以看到有些网站submit后就是一个alert然后跳转.但是他们没有设置编码.如果他的编码跟浏览器的默认编码不一致.就会出现乱码了.
你是单纯的HTML.一定要记得把meta的编码标签放到title标签前面. 如果你不理解就记住把编码的信息放到head标签的第一行就可以了.最终的效果是这样的

代码如下:

<head>
<meta http-equiv="Content-Type" content="text/html; charset=utf-8" />
...

2) 文件的编码
我们保存文件的时候,选择编码一定要统一.如果按照上面的.我们就应该选择UTF-8.
一般的编辑器都有此文件的编码信息.如果你发现不是UTF-8.请马上更改.
比如我们在Dreamweaver中打开了一个模板文件.发现右下角显示 GB2312(简体中文).此时不要做任何更改.马上CTRL+J 然后选择编码更改成UTF-8模式并保存.
文件的编码不一定是PHP文件的.也得保证你的JavaScript文件与css文件都为UTF-8编码.
另外还有一个重要的一点.就是BOM..这个东东PHP是不太欢迎的.所以我们在保存的时候要选择UTF-8无BOM格式.如果你用的编辑器是UE.那么请你着重注意这一点.
3) 数据库的编码
这个我就不想多说了.网上有太多的文章.如果你是MySQL记得每次连接后进行SET NAMES = ‘utf8′就可以了.并且那个utf8中间是没有横线的.
2.MVC的问题
程序员理论上来说应该是个完美主义者.他们不光想着把程序写的运行就可以了.而且还要优雅.
但是话说回来.把程序按照MVC做了以后我们的代码就优雅了吗? 答案当然是否定的.
学习架构是一个理解的过程.当你真正体会到这个架构的好处的时候.才会理解其真正的含义.切勿盲目.
有时候我们会做这样的打算.用这个月的时间去学习MVC.好吧.我想你应该这样去做.你学会给自己定目标了.
但是一个月后我们也许并不能真正的理解MVC..但是至少我们会根据他的模式他的基本.换句话说也许我们没有学会葵花宝典.但是我们应该会用辟邪剑法了.
3.面向对象的问题
关于PHP面向对象的问题.一直都纠缠不清.有的人不觉得PHP面向对象是个好的东西.有的人甚至不认为面向对象是个好的玩意,比如Linus.
我们不必去纠缠这个东西到底好不好.至少我们应该知道从面向对象诞生到现在.经过了这么多年的演变.运用到各种项目甚至语言中.我们有理由相信存在即有其道理.
实践是检验真理的唯一标准.这么多年面向对象越发展形势越好.看来我们学习就变得是种必须了.
与一些架构的知识类似.面向对象也不是那么好学的.面向对象是种理念.但是具体到某种语言的时候.其意义也会发生一些微妙的变化.
PHP的面向对象很灵活.再加上其特有的魔术方法.会造就出一种特别形势的面向对象.也许这跟你平时看Java的面向对象不太一样.
不一定把你需要的方法放到一个类中就是面向对象.当你真正体会到面向对象给你的编码带来快捷.带来方便.你就对面向对象有更深的一层理解了.
正所谓欲速则不达.切勿心急.你想几天之内理解相对论那纯粹是扯淡.
4.算法的问题
似乎PHP与算法总是相距甚远的.PHP大多数算法都是基于数组实现的.而我们又知道PHP的数组的特性就注定当数组变得非常大的时候.效率会直线下降.
其实PHP就是个做网站的.大家不要也不必给她带什么高帽子.在Web方面尤其是在PHP所服务的前端的实际情况下会涉及到算法的地方会非常少.
PHP的算法面试题无非就是对数组或者对字符串的操作..动动脑子加上手册.那基本就没问题了.
那你也许会问.我想学习PHP.那我还学习算法吗?
我觉得你需要学.并且更需要学数据结构.这门功课就像是一门内功.会在潜移默化中影响你的编码.
这时候再配合上我们前面的辟邪剑法.恭喜你你已经学会葵花宝典了!
5.框架的问题
PHP的框架是各种语言中最多的.用不用框架.选什么框架这又成为一个争议的话题..
我的建议是非常推荐学习至少一款框架.这可以加深你对PHP的认识.我们学习框架不是说要学这个框架怎么用.怎么做项目.
我们要去看它的源码.看看他是怎么实现的.这时候你就可以选择自己开发一个小型的框架.不求做的多好.不求别人多少项目去运用.
我们只是为了学习而已.
6.JavaScript的问题
可以说我看过这么多语言.最神奇就莫过于JavaScript了.平时Java一直宣称自己一切皆对象.其实我更觉得JavaScript才是一切皆对象.
JavaScript好学吗? 好学!其实在平时Web运用时候.一般的JavaScript操作就是DOM操作.
JavaScript难学吗? 难学!如果我们被其他语言的面向对象的思维束缚了.就很难理解JavaScript的面向对象.并且JavaScript里面概念也非常多.
prototype arguments call apply callee caller 闭包等概念就让我们不知所措.再加上诡异的JavaScript的代码风格与其难调试的特征直接导致我们这些菜鸟避而远之.
曾经我转发过一段实现document.ready的代码.其诡异程度不得不佩服.
个人觉得看一些JavaScript框架的源码就是最好的学习方法.曾经在写我的PHP框架的时候.由于使用了统一入口+自己定义的URL规则.所以再使用普通属性为get的form的时候就会获取不到参数.
这时候我就想到了jQuery.form中的formSerialize方法.摘选出来并做了一些修改.就可以拿来使用了.
7.CSS问题
我之所与把CSS跟JavaScript分开来说.我觉得CSS的学习更有特点.
其实要我说CSS是最简单的东西了.我们只是知道了一些基本的CSS属性.写页面绝对不成问题.
CSS的主要特征在于必须动手.你看N本CSS的书不如实际动手去写一个页面.
CSS另外一个特点就是得多试.也许这个属性不能达到你的效果.那你就换一个.这也是最笨最有效的办法:-)
当然这只是初级CSS的要求. 会了这些之后我们还得兼容浏览器. 其实这个也不难无非就是几个浏览器同时开着一个属性一个属性的试.
也可以熟记一些hack 比如IE6认识_ IE都认识*等.如果你觉得这样写CSS不够标准.那么把hack放到不同的css文件中.比如ie6的就叫ie6.css
然后再页面上用下面的代码就可以了.

代码如下:

更高级的当然是用户的体验与设计了.这个我也不懂就不说了@_@ 希望达人补充.
8.linux的问题
个人强烈建议每人的电脑上都安装一个linux系统.如果你觉得太折腾可以选择wubi方式安装Ubuntu.对于懒人这个是最简单有效的方法了.
你无聊的时候可以下载一份PHP源码自己编译下试试.切忌apt-get.因为往往服务器版本不是rhel就是centos.那里是没有这个命令的.
而且apt-get到的往往不是最新的版本.并且又不能自己定制.
linux总会出现这样活着那样莫名其妙的问题.比如环境稍微不一样就编译不通过.服务起不来.
这时候不要着急.看错误提示看日志.Google下自己尝试解决.
编译完不要觉得就完了试试不同的配置.而且修改一下源码再编译试试.
比如我们下载了一份nginx的源码.然后修改下header头等一些地方. 就可以编译一份属于自己的HTTP Web Server了.
当然你如果叫BWS或者GWS也行:-)
还有个问题 linux需要背命令吗? 这个是无可厚非的. 熟记一些常用的命令可以提高速度.这点我需要反思.经常一些常用的命令还需要看下参数..
另外一个就是Shell的问题. Shell其实不难.但是语法在我看来比较丑陋@_@. 看看wiki就可以学习大半了..主要还得是联系. 我们可以看到一个现象.一些公司在招聘高级PHPer的时候这条也列为必须条件了.
其实网上linux的资料非常多. 大多数你遇到的问题别人都会遇到.所以善于用Google. 并且熟读英语.
9.语言的问题
这个的问题就太多口水战了.最终谁也没有战胜谁.我们不必去参与这些无聊的事情.这些都是年轻粪青要做的.
你再牛B你有Linus牛B吗? 他喷C++的喷了这么多年.C++怎么样了?
所以我们不必纠缠这些.做好自己做的就OK了.
既然你选择了PHP.就不要犹豫.
也许我们在做项目的时候PHP显得不够用了.那我们可以用Java或者C来做个中间件.这又何尝不可.
一种语言发挥她的最大最用才是真理.
10.态度的问题
态度一定要谦虚谨慎. 这是作为一个程序员应该有的美德.切勿自我膨胀.
你学的越多你就会发现自己不足就越多.
等你牛B了你可以说一些狂妄的话.但是现在我们都不牛B.至少如果你看到我写的这篇文章.你应该还不太牛B. 我说了这篇文章是面向初学者的:-)
11.女人的问题
呃..这个自己解决吧@_@

[2]理解php原理的opcodes(操作码)

来源: 互联网发布时间: 2013-11-30

Opcondes是一种php脚本编译后的中间语言，就像Java的Byte Code，或者.NET 的MSL 。(都没了解过~)

　　举个文中的例子

代码如下:

<?php
　　echo "Hello World";
　　$a = 1 + 1;
　　 echo $a;
　　?>

PHP执行这段代码会经过如下4个步骤(确切的来说，应该是PHP的语言引擎Zend)

代码如下:

　　1.Scanning(Lexing) （扫描）,将PHP代码转换为语言片段(Tokens)
　　2.Parsing（语法分析）, 将Tokens转换成简单而有意义的表达式
　　3.Compilation（编译）, 将表达式编译成Opocdes
　　4.Execution（执行编译后的结果）, 顺次执行Opcodes，每次一条，从而实现PHP脚本的功能。

　　其中他还提到一句：“现在有的Cache比如APC,可以使得PHP缓存住Opcodes，这样，每次有请求来临的时候，就不需要重复执行前面3步，从而能大幅的提高PHP的执行速度。 ” 这可能是php执行速度比较快的原因之一吧~

那什么是Lexing? 学过编译原理的同学都应该对编译原理中的词法分析步骤有所了解，Lex就是一个词法分析的依据表。 Zend/zend_language_scanner.c会根据Zend/zend_language_scanner.l(Lex文件),来输入的 PHP代码进行词法分析，从而得到一个一个的“词”，PHP4.2开始提供了一个函数叫token_get_all,这个函数就可以讲一段PHP代码 Scanning成Tokens；
如果用这个函数处理我们开头提到的PHP代码，将会得到如下结果:

代码如下:

Array
(
[0] => Array
(
[0] => 367
[1] => Array
(
[0] => 316
[1] => echo
)
[2] => Array
(
[0] => 370
[1] =>
)
[3] => Array
(
[0] => 315
[1] => "Hello World"
)
[4] => ;
[5] => Array
(
[0] => 370
[1] =>
)
[6] => =
[7] => Array
(
[0] => 370
[1] =>
)
[8] => Array
(
[0] => 305
[1] => 1
)
[9] => Array
(
[0] => 370
[1] =>
)
[10] => +
[11] => Array
(
[0] => 370
[1] =>
)
[12] => Array
(
[0] => 305
[1] => 1
)
[13] => ;
[14] => Array
(
[0] => 370
[1] =>
)
[15] => Array
(
[0] => 316
[1] => echo
)
[16] => Array
(
[0] => 370
[1] =>
)
[17] => ;
)

分析这个返回结果我们可以发现，源码中的字符串，字符，空格，都会原样返回。每个源代码中的字符，都会出现在相应的顺序处。而，其他的比如标签，操作符，语句，都会被转换成一个包含俩部分的Array: Token ID (也就是在Zend内部的改Token的对应码，比如,T_ECHO,T_STRING)，和源码中的原来的内容。
接下来，就是Parsing阶段了，Parsing首先会丢弃Tokens Array中的多于的空格，然后将剩余的Tokens转换成一个一个的简单的表达式

代码如下:

1.echo a constant string
2.add two numbers together
3.store the result of the prior expression to a variable
4.echo a variable

然后就改Compilation阶段了，它会把Tokens编译成一个个op_array, 每个op_arrayd包含如下5个部分：

代码如下:

1.Opcode数字的标识，指明了每个op_array的操作类型，比如add , echo
2.结果存放Opcode结果
3.操作数1 给Opcode的操作数
4.操作数2
5.扩展值 1个整形用来区别被重载的操作符

比如，我们的PHP代码会被Parsing成:

代码如下:

* ZEND_ECHO 'Hello World'
* ZEND_ADD ~0 1 1
* ZEND_ASSIGN !0 ~0
* ZEND_ECHO !0

呵呵，你可能会问了，我们的$a去那里了？

恩，这个要介绍操作数了，每个操作数都是由以下俩个部分组成：

a)op_type : 为IS_CONST, IS_TMP_VAR, IS_VAR, IS_UNUSED, or IS_CVb)u,一个联合体，根据op_type的不同，分别用不同的类型保存了这个操作数的值(const)或者左值(var)而对于var来说，每个var也不一样

IS_TMP_VAR, 顾名思义，这个是一个临时变量，保存一些op_array的结果，以便接下来的op_array使用，这种的操作数的u保存着一个指向变量表的一个句柄（整数），这种操作数一般用~开头，比如~0,表示变量表的0号未知的临时变量

IS_VAR 这种就是我们一般意义上的变量了,他们以$开头表示

IS_CV 表示ZE2.1/PHP5.1以后的编译器使用的一种cache机制，这种变量保存着被它引用的变量的地址，当一个变量第一次被引用的时候，就会被CV起来，以后对这个变量的引用就不需要再次去查找active符号表了，CV变量以！开头表示。

这么看来，我们的$a被优化成!0了。
总结：

1.php的执行顺序是: -> php程序
　　　　　　　　　　-> 被Scanning（扫描转换为Tokens（语言片段））
　　　　　　　　　　-> 被Parsing（语法分析，将Tokens转换成简单而有意义的表达式）
　　　　　　　　　　-> Compilation（编译,将表达式编译成Opocdes(操作码))
-> Execution（顺序执行编译后的结果）
2. APC(Alternative PHP Cache）的缓存机制可以缓存住Opcodes，这样,下次有请求来临的时候，就不需要重复执行前面3步，从而能大幅的提高PHP的执行速度。这可能是php执行速度比较快的原因之一

补充：
apc，zend optimize是之所以能够加速php
就是因为他可以缓存opcode
并不是zend引擎本身自带的功能
zend引擎默认是一个轮回中任何一项都要走的

[3]PHP下常用正则表达式整理

来源: 互联网发布时间: 2013-11-30

--------------------------------------------------------- 正则收藏

手机号码：
$mode = "/^1[358]\d{9}/";

邮箱地址：
$mode = "/^[a-z][-_\.]?[a-z\d]*@[a-z0-9]+[\.][a-z]{2,4}/i";

---------------------------------------------------------- 正则基础

$mode = "/^1[358]\d{9}/i";
匹配模块必须以 / / 开始和结束，第二个 / 后可以加模式修正符

原子
①a-z A-Z _ 0-9 //最常见的字符
②(abc) //用圆括号括起来起来的单元符号
③[abcs] [^abd] //用方括号括起来的原子表，
原子表中的^代表排除或相反内容

\d 包含所有数字[0-9]
\D 除所有数字外[^0-9]
\w 包含所有英文字符[a-zA-Z_0-9]
\W 除所有英文字符外[^a-zA-Z_0-9]
\s 包含空白区域如回车、换行、分页等 [\f\n\r]

元字符
* 匹配前一个内容的0次1次或多次
+ 1次或多次
？ 0次或1次
. 代表任意一个字符（除了回车换行）
| 相当与php的 || （“或”的意思）
^ 强制匹配字符串首部内容
$ 强制匹配字符串尾部内容
[^abc] 匹配除了a或b或c之外的内容
\b 匹配单词边界，边界可以是空格或者特殊符号
\B 匹配除带单词边界以外的内容
{m} 匹配前一个内容的重复次数为M次
{m,} 匹配前一个内容的重复次数大于等于M次
{m,n} 匹配前一个内容的重复次数M次到N次
( ) 整体匹配，并放入内存，可使用\\1 或 \\2 …依次获取

优先级：依次降低
( ) 圆括号因为是内存处理所以最高
* ？ + { } 重复匹配内容其次
^ $ \b 边界处理第三
| 条件处理第四
最后按照运算顺序计算匹配

常用修正符： $mode = "/正则/U";
i 正则内容在匹配时候不区分大小写（默认是区分的）
m 在匹配首内容或者尾内容时候采用多行识别匹配
S 将回车转化为空格
x 忽略正则中的空白
A 强制从头开始匹配
D 强制$匹配尾部无任何内容 \n
U 禁止贪婪匹配，只跟踪到最近的一个匹配符并结束，
常用在采集程序上的正则表达式

应用
preg_match_all ( string pattern, string subject, array matches [, int flags] )
截取比较详细的内容，采集网页，分析文本
preg_replace ( mixed pattern, mixed replacement, mixed subject [, int limit] )
preg_replace ( mixed pattern, mixed replacement, mixed subject [, int limit] )
提示 1、替换内容可以是一个正则也可以是数组正则
2、替换内容可以通过修正符e来解决替换执行内容
preg_split ( string pattern, string subject [, int limit [, int flags]] )
通过正则表达式来切割相关内容，类似之前学过的explode切割函数，但explode
只能按照一种方式切割有局限性。
------------------------------------------------- 调试代码
[code]
<?php
$mode = "/^[a-z][-_\.]?[a-z\d]*@[a-z0-9]+[\.][a-z]{2,4}/i";
$str = "a12345@";
echo $str.'<hr>';
if(preg_match($mode, $str, $arr)){
echo 'succeed -- <font color=red>'.$arr[0];
}else{
echo 'failed';
}
?>
[code]