国产av日韩一区二区三区精品,成人性爱视频在线观看,国产,欧美,日韩,一区,www.成色av久久成人,2222eeee成人天堂

首頁 php教程 php手冊 比較discuz和ecshop的截取字符串函數php版

比較discuz和ecshop的截取字符串函數php版

Jun 13, 2016 am 11:58 AM
discuz ecshop php 下面 函數 字串 截取 比較 原始碼 版本

下面先給出兩個版本函數的源代碼以及簡單測試,最后我會給出一個實用性更強的字符串截取函數。需要注意的是:這里討論的字符串截取問題都是針對UTF-8編碼的中文字符串。
discuz版本

復制代碼 代碼如下:


/**
* [discuz] 基于PHP沒有安裝 mb_substr 等擴展截取字符串,如果截取中文字則按2個字符計算
* @param $string 要截取的字符串
* @param $length 要截取的字符數
* @param $dot 替換截掉部分的結尾字符串
* @return 返回截取后的字符串
*/
function cutstr($string, $length, $dot = '...') {
// 如果字符串小于要截取的長度則直接返回
// 此處使用strlen獲取字符串長度有很大的弊病,比如對字符串“新年快樂”要截取4個中文字符,
// 那么必須知道這4個中文字符的字節(jié)數,否則返回的字符串可能會是“新年快樂...”
if (strlen($string) return $string;
}
// 轉換原字符串中htmlspecialchars
$pre = chr(1);
$end = chr(1);
$string = str_replace ( array ('&', '"', '' ), array ($pre . '&' . $end, $pre . '"' . $end, $pre . '' . $end ), $string );
$strcut = ''; // 初始化返回值
// 如果是utf-8編碼(這個判斷有點不全,有可能是utf8)
if (strtolower ( CHARSET ) == 'utf-8') {
// 初始連續(xù)循環(huán)指針$n,最后一個字位數$tn,截取的字符數$noc
$n = $tn = $noc = 0;
while ( $n $t = ord ( $string [$n] );
if ($t == 9 || $t == 10 || (32 // 如果是英語半角符號等,$n指針后移1位,$tn最后字是1位
$tn = 1;
$n++;
$noc++;
} elseif (194 // 如果是二字節(jié)字符$n指針后移2位,$tn最后字是2位
$tn = 2;
$n += 2;
$noc += 2;
} elseif (224 // 如果是三字節(jié)(可以理解為中字詞),$n后移3位,$tn最后字是3位
$tn = 3;
$n += 3;
$noc += 2;
} elseif (240 $tn = 4;
$n += 4;
$noc += 2;
} elseif (248 $tn = 5;
$n += 5;
$noc += 2;
} elseif ($t == 252 || $t == 253) {
$tn = 6;
$n += 6;
$noc += 2;
} else {
$n++;
}
// 超過了要取的數就跳出連續(xù)循環(huán)
if ($noc >= $length) {
break;
}
}
// 這個地方是把最后一個字去掉,以備加$dot
if ($noc > $length) {
$n -= $tn;
}
$strcut = substr ( $string, 0, $n );
} else {
// 并非utf-8編碼的全角就后移2位
for ($i = 0; $i $strcut .= ord ( $string [$i] ) > 127 ? $string [$i] . $string [++ $i] : $string [$i];
}
}
// 再還原最初的htmlspecialchars
$strcut = str_replace( array ($pre . '&' . $end, $pre . '"' . $end, $pre . '' . $end ), array ('&', '"', '' ), $strcut );
$pos = strrpos ( $strcut, chr ( 1 ) );
if ($pos !== false) {
$strcut = substr ( $strcut, 0, $pos );
}
return $strcut . $dot; // 最后把截取加上$dot輸出
}


discuz版本的最大缺陷在于使用 strlen 獲取原始字符串的長度,并用來和傳入的要截取長度參數(字節(jié)數)進行比較,由于UTF-8的中文字符的字節(jié)數是不固定的,所以就會面臨這樣的窘境:如果要截取4個中文字符應該指定多大的截取長度呢?8字節(jié)還是12字節(jié)呢?。。。這是無法預計的,也正是因為這個問題discuz的cutstr實際是有bug的,通過下面的測試結果能看出:

復制代碼 代碼如下:


$str1 = "欲窮千里目";
echo my_cutstr($str1, 10, "...")."\n"; // 輸出:欲窮千里目... [這是一個bug,想想是什么原因導致?]
echo my_cutstr($str1, 15, "...")."\n"; // 輸出:欲窮千里目


導致上述bug的原因在與cutstr函數在截取字符的時候是將一個中文字按2個字符算,那么5個中文字就是10字符,而原始字符串的長度是15字節(jié),所以cutstr認為“成功地”從15字符的串上截取了10個字符,然后加上了“尾巴”。要解決這個bug只要在判斷一下返回的子串是否和原始串相同,如果相同就不加“尾巴”。
ecshop版

復制代碼 代碼如下:


/**
* [ecshop] 基于PHP的 mb_substr,iconv_substr 這兩個擴展來截取字符串,中文字符都是按1個字符長度計算;
* 該函數僅適用于utf-8編碼的中文字符串。
*
* @param $str 原始字符串
* @param $length 截取的字符數
* @param $append 替換截掉部分的結尾字符串
* @return 返回截取后的字符串
*/
function sub_str($str, $length = 0, $append = '...') {
$str = trim($str);
$strlength = strlen($str);
if ($length == 0 || $length >= $strlength) {
return $str;
} elseif ($length $length = $strlength + $length;
if ($length $length = $strlength;
}
}
if ( function_exists('mb_substr') ) {
$newstr = mb_substr($str, 0, $length, 'utf-8');
} elseif ( function_exists('iconv_substr') ) {
$newstr = iconv_substr($str, 0, $length, 'utf-8');
} else {
//$newstr = trim_right(substr($str, 0, $length));
$newstr = substr($str, 0, $length);
}
if ($append && $str != $newstr) {
$newstr .= $append;
}
return $newstr;
}


ecshop版的特點和缺點都在于將中文字符算作一個字符,如果原始字符串中不含中文,比如:abcd1234,如果本意是要截取4個中文字符或者8個英文字符,那么使用ecshop的版本就得不到期望的結果,返回值的是:abcd。下面是簡單的測試結果:

復制代碼 代碼如下:


$str1 = "白日依山盡,黃河入海流";
echo $str1."\n";
echo my_sub_str($str1, 4, "...")."\n"; // 輸出:白日依山...
$str2 = "白1日2依3山4";
echo $str2."\n";
echo my_sub_str($str2, 4, "...")."\n"; // 輸出:白1日2...


優(yōu)化版
截取中文字符串的大部分應用場景是“原始字符串可以是中文、英文、數字混雜的,中文字按2個字符算,英文數字按1個字符算”,針對這個需求下面給出一個實現版本:

復制代碼 代碼如下:


/**
* 字符串截取,中文字符按2個字符計算,同時支持GBK和UTF-8編碼
* @param $string 要截取的字符串
* @param $length 要截取的字符數
* @param $append 添加到子串后的尾巴
* @return 返回截取后的字符串
*/
function substring($string, $length, $append = false) {
if ( $length return '';
}
// 檢測原始字符串是否為UTF-8編碼
$is_utf8 = false;
$str1 = @iconv("UTF-8", "GBK", $string);
$str2 = @iconv("GBK", "UTF-8", $str1);
if ( $string == $str2 ) {
$is_utf8 = true;
// 如果是UTF-8編碼,則使用GBK編碼的
$string = $str1;
}
$newstr = '';
for ($i = 0; $i $newstr .= ord ($string[$i]) > 127 ? $string[$i] . $string[++$i] : $string[$i];
}
if ( $is_utf8 ) {
$newstr = @iconv("GBK", "UTF-8", $newstr);
}
if ($append && $newstr != $string) {
$newstr .= $append;
}
return $newstr;
}


測試結果見下(GBK和UTF-8的結果一致):

復制代碼 代碼如下:


$str1 = "白日依山盡,黃河入海流";
echo substring($str1, 4, "...")."\n"; // 輸出:白日...
echo substring($str1, 5, "...")."\n"; // 輸出:白日依...
$str2 = "12白34日56依78山";
echo substring($str2, 4, "...")."\n"; // 輸出:12白...
echo substring($str2, 5, "...")."\n"; // 輸出:12白3...


作者:edwardlost' blog
本網站聲明
本文內容由網友自願投稿,版權歸原作者所有。本站不承擔相應的法律責任。如發(fā)現涉嫌抄襲或侵權的內容,請聯(lián)絡admin@php.cn

熱AI工具

Undress AI Tool

Undress AI Tool

免費脫衣圖片

Undresser.AI Undress

Undresser.AI Undress

人工智慧驅動的應用程序,用於創(chuàng)建逼真的裸體照片

AI Clothes Remover

AI Clothes Remover

用於從照片中去除衣服的線上人工智慧工具。

Clothoff.io

Clothoff.io

AI脫衣器

Video Face Swap

Video Face Swap

使用我們完全免費的人工智慧換臉工具,輕鬆在任何影片中換臉!

熱工具

記事本++7.3.1

記事本++7.3.1

好用且免費的程式碼編輯器

SublimeText3漢化版

SublimeText3漢化版

中文版,非常好用

禪工作室 13.0.1

禪工作室 13.0.1

強大的PHP整合開發(fā)環(huán)境

Dreamweaver CS6

Dreamweaver CS6

視覺化網頁開發(fā)工具

SublimeText3 Mac版

SublimeText3 Mac版

神級程式碼編輯軟體(SublimeText3)

在C中使用std :: Chrono 在C中使用std :: Chrono Jul 15, 2025 am 01:30 AM

std::chrono在C 中用於處理時間,包括獲取當前時間、測量執(zhí)行時間、操作時間點與持續(xù)時間及格式化解析時間。 1.獲取當前時間使用std::chrono::system_clock::now(),可轉換為可讀字符串但係統(tǒng)時鐘可能不單調;2.測量執(zhí)行時間應使用std::chrono::steady_clock以確保單調性,並通過duration_cast轉換為毫秒、秒等單位;3.時間點(time_point)和持續(xù)時間(duration)可相互操作,但需注意單位兼容性和時鐘紀元(epoch)

PHP如何處理環(huán)境變量? PHP如何處理環(huán)境變量? Jul 14, 2025 am 03:01 AM

toAccessenvironmentVariablesInphp,useGetenv()或$ _envsuperglobal.1.getEnv('var_name')retievesSpecificvariable.2。 $ _ en v ['var_name'] accessesvariablesifvariables_orderInphp.iniincludes“ e” .setVariablesViaCliWithvar = vualitephpscript.php,inapach

為什麼我們評論:PHP指南 為什麼我們評論:PHP指南 Jul 15, 2025 am 02:48 AM

PHPhasthreecommentstyles://,#forsingle-lineand/.../formulti-line.Usecommentstoexplainwhycodeexists,notwhatitdoes.MarkTODO/FIXMEitemsanddisablecodetemporarilyduringdebugging.Avoidover-commentingsimplelogic.Writeconcise,grammaticallycorrectcommentsandu

PHP標頭重定向不起作用 PHP標頭重定向不起作用 Jul 14, 2025 am 01:59 AM

header函數跳轉失敗原因及解決方法:1.header前已有輸出,需檢查並移除所有前置輸出或使用ob_start()緩衝;2.未加exit導致後續(xù)代碼干擾,應在跳轉後立即添加exit或die;3.路徑錯誤應使用絕對路徑或動態(tài)拼接確保正確;4.服務器配置或緩存干擾可嘗試清除緩存或更換環(huán)境測試。

PHP準備的聲明獲得結果 PHP準備的聲明獲得結果 Jul 14, 2025 am 02:12 AM

在PHP中使用預處理語句獲取數據庫查詢結果的方法因擴展而異,1.使用mysqli時可通過get_result()配合fetch_assoc()獲取關聯(lián)數組,適用於現代環(huán)境;2.也可使用bind_result()綁定變量,適合字段少、結構固定的情況,兼容性好但字段多時較繁瑣;3.使用PDO時通過fetch(PDO::FETCH_ASSOC)獲取關聯(lián)數組,或用fetchAll()一次性獲取所有數據,接口統(tǒng)一且錯誤處理更清晰;此外需注意參數類型匹配、執(zhí)行execute()、及時釋放資源及開啟錯誤報告以

PHP檢查字符串是否以特定的字符串開頭 PHP檢查字符串是否以特定的字符串開頭 Jul 14, 2025 am 02:44 AM

在PHP中判斷字符串是否以特定字符串開頭可通過多種方法實現:1.使用strncmp()比較前n個字符,若返回0則開頭匹配,不區(qū)分大小寫;2.使用strpos()檢查子字符串位置是否為0,區(qū)分大小寫,可用stripos()替代實現不區(qū)分大小寫;3.可封裝startsWith()或str_starts_with()函數提高複用性;此外需注意空字符串默認返回true、編碼兼容性及性能差異,strncmp()通常效率更高。

如何避免PHP中未定義的索引錯誤 如何避免PHP中未定義的索引錯誤 Jul 14, 2025 am 02:51 AM

避免“undefinedindex”錯誤的關鍵方法有三:首先,使用isset()檢查數組鍵是否存在並確保值不為null,適用於大多數常規(guī)場景;其次,使用array_key_exists()僅判斷鍵是否存在,適用於需要區(qū)分鍵不存在和值為null的情況;最後,使用空合併運算符??(PHP7 )簡潔地設置默認值,推薦用於現代PHP項目,同時注意表單字段名拼寫、謹慎使用extract()及遍歷前檢查數組非空以進一步規(guī)避風險。

php準備的語句與條款 php準備的語句與條款 Jul 14, 2025 am 02:56 AM

使用PHP預處理語句執(zhí)行帶有IN子句的查詢時,1.需根據數組長度動態(tài)生成佔位符;2.使用PDO時可直接傳入數組,用array_values確保索引連續(xù);3.使用mysqli時需構造類型字符串並綁定參數,注意展開數組的方式及版本兼容性;4.避免拼接SQL、處理空數組和確保數據類型匹配。具體做法是:先用implode與array_fill生成佔位符,再依擴展特性綁定參數,從而安全執(zhí)行IN查詢。

See all articles