当前位置: 编程技术>php
本页文章导读:
▪php正则匹配汉字的二个例子 php正则匹配汉字!
/^[\x{4e00}-\x{9fa5}]+$/u
用正则匹配,不同编码,不同程序语言,都会有不同,应该正确理解与应用,不然不仅得不到想要的结果,还会错误百出哦。
1、一个utf-8编码的例子:
.........
▪php操作ini配置文件的例子 代码如下:
<?php
//写ini文件
function write_ini_file($assoc_arr, $path, $has_sections=FALSE)
{
$content = "";
if ($has_sections)
{
foreach ($assoc_arr as $key=>$elem)
{
$content .= "[".$key."]\n";
foreach ($elem as $key2=>$.........
▪php导入海量txt数据入库的实现方法 Txt文件,10万条数据,如下所示
代码示例:
列1 列2 列3 列4 列5
a 00003131 0 0 adductive#1 adducting#1 adducent#1
a 00003356 0 0 nascent#1
a 00003553 0 0 emerging#2 emergent#2
a 00003700 0.25 0 dissilient#1
--数据总计10万条.........
[1]php正则匹配汉字的二个例子
来源: 互联网 发布时间: 2013-12-24
php正则匹配汉字!
/^[\x{4e00}-\x{9fa5}]+$/u
用正则匹配,不同编码,不同程序语言,都会有不同,应该正确理解与应用,不然不仅得不到想要的结果,还会错误百出哦。
1、一个utf-8编码的例子:
<?php $str = "汉字"; if (preg_match("/^[\x{4e00}-\x{9fa5}]+$/u",$str)) { print("该字符串全部是中文"); } else { print("该字符串不全部是中文"); } //by http://www. ?>
2、一个包含gbk,gb2312的例子:
<?php $action = trim($_GET['action']); if($action == "sub") { $str = $_POST['dir']; //if(!preg_match("/^[".chr(0xa1)."-".chr(0xff)."A-Za-z0-9_]+$/",$str)) //GB2312汉字字母数字下划线正则表达式 if(!preg_match("/^[\x{4e00}-\x{9fa5}A-Za-z0-9_]+$/u",$str)) //UTF-8汉字字母数字下划线正则表达式 { echo "<font color=red>您输入的[".$str."]含有违法字符</font>"; } else { echo "<font color=green>您输入的[".$str."]完全合法,通过!</font>"; } } ?> <form method="POST" action="/blog_article/action/sub.html"> 输入字符(数字,字母,汉字,下划线): <input type="text" name="dir" value=""> <input type="submit" value="提交"> </form>
建议大家亲自动手测试下,看看效果是怎么样的?php正则匹配英文比较简单,匹配汉字时请多加留心哦。
[2]php操作ini配置文件的例子
来源: 互联网 发布时间: 2013-12-24
代码如下:
<?php //写ini文件 function write_ini_file($assoc_arr, $path, $has_sections=FALSE) { $content = ""; if ($has_sections) { foreach ($assoc_arr as $key=>$elem) { $content .= "[".$key."]\n"; foreach ($elem as $key2=>$elem2) { if(is_array($elem2)) { for($i=0;$i<count($elem2);$i++) { $content .= $key2."[] = \"".$elem2[$i]."\"\n"; } } else if($elem2=="") $content .= $key2." = \n"; else $content .= $key2." = \"".$elem2."\"\n"; } } } else { foreach ($assoc_arr as $key=>$elem) { if(is_array($elem)) { for($i=0;$i<count($elem);$i++) { $content .= $key2."[] = \"".$elem[$i]."\"\n"; } } else if($elem=="") $content .= $key2." = \n"; else $content .= $key2." = \"".$elem."\"\n"; } } if (!$handle = fopen($path, 'w')) { return false; } if (!fwrite($handle, $content)) { return false; } fclose($handle); return true; } //用法 //by www. $sampleData = array( 'first' => array( 'first-1' => 1, 'first-2' => 2, 'first-3' => 3, 'first-4' => 4, 'first-5' => 5, ), 'second' => array( 'second-1' => 1, 'second-2' => 2, 'second-3' => 3, 'second-4' => 4, 'second-5' => 5, )); write_ini_file($sampleData, './data.ini', true); //读ini文件 public function readini($name) { if (file_exists(SEM_PATH.'init/'.$name)) { $data = parse_ini_file(SEM_PATH.'init/'.$name,true); if ($data) { return $data; } } else { return false; } } ?>
说明:
以上代码如果在python中处理,需要将PHP生成的配置文件值两边的双引号去掉。
即把上面生成ini配置文件函数的\"去掉就可以了。
[3]php导入海量txt数据入库的实现方法
来源: 互联网 发布时间: 2013-12-24
Txt文件,10万条数据,如下所示
代码示例:
列1 列2 列3 列4 列5
a 00003131 0 0 adductive#1 adducting#1 adducent#1
a 00003356 0 0 nascent#1
a 00003553 0 0 emerging#2 emergent#2
a 00003700 0.25 0 dissilient#1
--数据总计10万条--
a 00003131 0 0 adductive#1 adducting#1 adducent#1
a 00003356 0 0 nascent#1
a 00003553 0 0 emerging#2 emergent#2
a 00003700 0.25 0 dissilient#1
--数据总计10万条--
要求导入到数据库中。
数据表结构为:
代码示例:
word_id 自动增量
word 【adductive#1 adducting#1 adducent#1】这一个TXT记录要转换为3个SQL记录
value =第三列-第四列;如果=0,则此条记录略过不插入数据表
word 【adductive#1 adducting#1 adducent#1】这一个TXT记录要转换为3个SQL记录
value =第三列-第四列;如果=0,则此条记录略过不插入数据表
代码如下:
<?php /** * txt海量数据入库 * http://www. */ $file = 'words.txt';//10W条记录的TXT源文件 $lines = file_get_contents($file); ini_set('memory_limit', '-1');//不要限制Mem大小,否则会报错 $line=explode()("\n",$lines); $i=0; $sql="INSERT INTO words_sentiment (word,senti_type,senti_value,word_type) VALUES "; foreach($line as $key =>$li) { $arr=explode(" ",$li); $senti_value=$arr[2]-$arr[3]; if($senti_value!=0) { if($i>=20000&&$i<25000)//分批次导入,避免失败 { $mm=explode(" ",$arr[4]); foreach($mm as $m) //【adductive#1 adducting#1 adducent#1】这一个TXT记录要转换为3个SQL记录 { $nn=explode("#",$m); $word=$nn[0]; $sql.="(\"$word\",1,$senti_value,2),";//这个地方要注意到是 word有可能包含单引号(如jack's),因此我们要用双引号来包含word(注意转义) } } $i++; } } //echo $i; $sql=substr($sql,0,-1);//去掉最后一个逗号 //echo $sql; file_put_contents('20000-25000.txt', $sql); //批量导入数据库,5000条一次,大概需要40秒的样子;一次导入太多max_execution_time会不够,导致失败 ?>
说明:
1,海量数据导入时,要注意PHP的一些限制,可以临时调整一下,否则会报错。
Allowed memory size of 33554432 bytes exhausted (tried to allocate 16 bytes)
2,PHP操作TXT文件
file_get_contents()
file_put_contents()
3,海量导入时,最好分批次导入,失败的几率小一些
4,海量导入之前,脚本一定要多次测试无误再使用,比如用100条数据来测试
5,导入之后,如果PHP的mem_limit还是不够的话,程序仍然跑不起来
(建议用修改php.ini的方式来提高mem_limit,而不是用临时的语句)
就是这些了,哪位有胆量,也可以自己找个大数据量的txt测试下,呵呵。
最新技术文章: