国产av日韩一区二区三区精品,成人性爱视频在线观看,国产,欧美,日韩,一区,www.成色av久久成人,2222eeee成人天堂

Rumah php教程 php手冊(cè) 比較discuz和ecshop的截取字符串函數(shù)php版

比較discuz和ecshop的截取字符串函數(shù)php版

Jun 13, 2016 am 11:58 AM
discuz ecshop php bawah fungsi dan rentetan memintas Bandingkan kod sumber versi Versi daripada

下面先給出兩個(gè)版本函數(shù)的源代碼以及簡(jiǎn)單測(cè)試,最后我會(huì)給出一個(gè)實(shí)用性更強(qiáng)的字符串截取函數(shù)。需要注意的是:這里討論的字符串截取問題都是針對(duì)UTF-8編碼的中文字符串。
discuz版本

復(fù)制代碼 代碼如下:


/**
* [discuz] 基于PHP沒有安裝 mb_substr 等擴(kuò)展截取字符串,如果截取中文字則按2個(gè)字符計(jì)算
* @param $string 要截取的字符串
* @param $length 要截取的字符數(shù)
* @param $dot 替換截掉部分的結(jié)尾字符串
* @return 返回截取后的字符串
*/
function cutstr($string, $length, $dot = '...') {
// 如果字符串小于要截取的長(zhǎng)度則直接返回
// 此處使用strlen獲取字符串長(zhǎng)度有很大的弊病,比如對(duì)字符串“新年快樂”要截取4個(gè)中文字符,
// 那么必須知道這4個(gè)中文字符的字節(jié)數(shù),否則返回的字符串可能會(huì)是“新年快樂...”
if (strlen($string) return $string;
}
// 轉(zhuǎn)換原字符串中htmlspecialchars
$pre = chr(1);
$end = chr(1);
$string = str_replace ( array ('&', '"', '' ), array ($pre . '&' . $end, $pre . '"' . $end, $pre . '' . $end ), $string );
$strcut = ''; // 初始化返回值
// 如果是utf-8編碼(這個(gè)判斷有點(diǎn)不全,有可能是utf8)
if (strtolower ( CHARSET ) == 'utf-8') {
// 初始連續(xù)循環(huán)指針$n,最后一個(gè)字位數(shù)$tn,截取的字符數(shù)$noc
$n = $tn = $noc = 0;
while ( $n $t = ord ( $string [$n] );
if ($t == 9 || $t == 10 || (32 // 如果是英語半角符號(hào)等,$n指針后移1位,$tn最后字是1位
$tn = 1;
$n++;
$noc++;
} elseif (194 // 如果是二字節(jié)字符$n指針后移2位,$tn最后字是2位
$tn = 2;
$n += 2;
$noc += 2;
} elseif (224 // 如果是三字節(jié)(可以理解為中字詞),$n后移3位,$tn最后字是3位
$tn = 3;
$n += 3;
$noc += 2;
} elseif (240 $tn = 4;
$n += 4;
$noc += 2;
} elseif (248 $tn = 5;
$n += 5;
$noc += 2;
} elseif ($t == 252 || $t == 253) {
$tn = 6;
$n += 6;
$noc += 2;
} else {
$n++;
}
// 超過了要取的數(shù)就跳出連續(xù)循環(huán)
if ($noc >= $length) {
break;
}
}
// 這個(gè)地方是把最后一個(gè)字去掉,以備加$dot
if ($noc > $length) {
$n -= $tn;
}
$strcut = substr ( $string, 0, $n );
} else {
// 并非utf-8編碼的全角就后移2位
for ($i = 0; $i $strcut .= ord ( $string [$i] ) > 127 ? $string [$i] . $string [++ $i] : $string [$i];
}
}
// 再還原最初的htmlspecialchars
$strcut = str_replace( array ($pre . '&' . $end, $pre . '"' . $end, $pre . '' . $end ), array ('&', '"', '' ), $strcut );
$pos = strrpos ( $strcut, chr ( 1 ) );
if ($pos !== false) {
$strcut = substr ( $strcut, 0, $pos );
}
return $strcut . $dot; // 最后把截取加上$dot輸出
}


discuz版本的最大缺陷在于使用 strlen 獲取原始字符串的長(zhǎng)度,并用來和傳入的要截取長(zhǎng)度參數(shù)(字節(jié)數(shù))進(jìn)行比較,由于UTF-8的中文字符的字節(jié)數(shù)是不固定的,所以就會(huì)面臨這樣的窘境:如果要截取4個(gè)中文字符應(yīng)該指定多大的截取長(zhǎng)度呢?8字節(jié)還是12字節(jié)呢?。。。這是無法預(yù)計(jì)的,也正是因?yàn)檫@個(gè)問題discuz的cutstr實(shí)際是有bug的,通過下面的測(cè)試結(jié)果能看出:

復(fù)制代碼 代碼如下:


$str1 = "欲窮千里目";
echo my_cutstr($str1, 10, "...")."\n"; // 輸出:欲窮千里目... [這是一個(gè)bug,想想是什么原因?qū)е??]
echo my_cutstr($str1, 15, "...")."\n"; // 輸出:欲窮千里目


導(dǎo)致上述bug的原因在與cutstr函數(shù)在截取字符的時(shí)候是將一個(gè)中文字按2個(gè)字符算,那么5個(gè)中文字就是10字符,而原始字符串的長(zhǎng)度是15字節(jié),所以cutstr認(rèn)為“成功地”從15字符的串上截取了10個(gè)字符,然后加上了“尾巴”。要解決這個(gè)bug只要在判斷一下返回的子串是否和原始串相同,如果相同就不加“尾巴”。
ecshop版

復(fù)制代碼 代碼如下:


/**
* [ecshop] 基于PHP的 mb_substr,iconv_substr 這兩個(gè)擴(kuò)展來截取字符串,中文字符都是按1個(gè)字符長(zhǎng)度計(jì)算;
* 該函數(shù)僅適用于utf-8編碼的中文字符串。
*
* @param $str 原始字符串
* @param $length 截取的字符數(shù)
* @param $append 替換截掉部分的結(jié)尾字符串
* @return 返回截取后的字符串
*/
function sub_str($str, $length = 0, $append = '...') {
$str = trim($str);
$strlength = strlen($str);
if ($length == 0 || $length >= $strlength) {
return $str;
} elseif ($length $length = $strlength + $length;
if ($length $length = $strlength;
}
}
if ( function_exists('mb_substr') ) {
$newstr = mb_substr($str, 0, $length, 'utf-8');
} elseif ( function_exists('iconv_substr') ) {
$newstr = iconv_substr($str, 0, $length, 'utf-8');
} else {
//$newstr = trim_right(substr($str, 0, $length));
$newstr = substr($str, 0, $length);
}
if ($append && $str != $newstr) {
$newstr .= $append;
}
return $newstr;
}


ecshop版的特點(diǎn)和缺點(diǎn)都在于將中文字符算作一個(gè)字符,如果原始字符串中不含中文,比如:abcd1234,如果本意是要截取4個(gè)中文字符或者8個(gè)英文字符,那么使用ecshop的版本就得不到期望的結(jié)果,返回值的是:abcd。下面是簡(jiǎn)單的測(cè)試結(jié)果:

復(fù)制代碼 代碼如下:


$str1 = "白日依山盡,黃河入海流";
echo $str1."\n";
echo my_sub_str($str1, 4, "...")."\n"; // 輸出:白日依山...
$str2 = "白1日2依3山4";
echo $str2."\n";
echo my_sub_str($str2, 4, "...")."\n"; // 輸出:白1日2...


優(yōu)化版
截取中文字符串的大部分應(yīng)用場(chǎng)景是“原始字符串可以是中文、英文、數(shù)字混雜的,中文字按2個(gè)字符算,英文數(shù)字按1個(gè)字符算”,針對(duì)這個(gè)需求下面給出一個(gè)實(shí)現(xiàn)版本:

復(fù)制代碼 代碼如下:


/**
* 字符串截取,中文字符按2個(gè)字符計(jì)算,同時(shí)支持GBK和UTF-8編碼
* @param $string 要截取的字符串
* @param $length 要截取的字符數(shù)
* @param $append 添加到子串后的尾巴
* @return 返回截取后的字符串
*/
function substring($string, $length, $append = false) {
if ( $length return '';
}
// 檢測(cè)原始字符串是否為UTF-8編碼
$is_utf8 = false;
$str1 = @iconv("UTF-8", "GBK", $string);
$str2 = @iconv("GBK", "UTF-8", $str1);
if ( $string == $str2 ) {
$is_utf8 = true;
// 如果是UTF-8編碼,則使用GBK編碼的
$string = $str1;
}
$newstr = '';
for ($i = 0; $i $newstr .= ord ($string[$i]) > 127 ? $string[$i] . $string[++$i] : $string[$i];
}
if ( $is_utf8 ) {
$newstr = @iconv("GBK", "UTF-8", $newstr);
}
if ($append && $newstr != $string) {
$newstr .= $append;
}
return $newstr;
}


測(cè)試結(jié)果見下(GBK和UTF-8的結(jié)果一致):

復(fù)制代碼 代碼如下:


$str1 = "白日依山盡,黃河入海流";
echo substring($str1, 4, "...")."\n"; // 輸出:白日...
echo substring($str1, 5, "...")."\n"; // 輸出:白日依...
$str2 = "12白34日56依78山";
echo substring($str2, 4, "...")."\n"; // 輸出:12白...
echo substring($str2, 5, "...")."\n"; // 輸出:12白3...


作者:edwardlost' blog
Kenyataan Laman Web ini
Kandungan artikel ini disumbangkan secara sukarela oleh netizen, dan hak cipta adalah milik pengarang asal. Laman web ini tidak memikul tanggungjawab undang-undang yang sepadan. Jika anda menemui sebarang kandungan yang disyaki plagiarisme atau pelanggaran, sila hubungi admin@php.cn

Alat AI Hot

Undress AI Tool

Undress AI Tool

Gambar buka pakaian secara percuma

Undresser.AI Undress

Undresser.AI Undress

Apl berkuasa AI untuk mencipta foto bogel yang realistik

AI Clothes Remover

AI Clothes Remover

Alat AI dalam talian untuk mengeluarkan pakaian daripada foto.

Clothoff.io

Clothoff.io

Penyingkiran pakaian AI

Video Face Swap

Video Face Swap

Tukar muka dalam mana-mana video dengan mudah menggunakan alat tukar muka AI percuma kami!

Alat panas

Notepad++7.3.1

Notepad++7.3.1

Editor kod yang mudah digunakan dan percuma

SublimeText3 versi Cina

SublimeText3 versi Cina

Versi Cina, sangat mudah digunakan

Hantar Studio 13.0.1

Hantar Studio 13.0.1

Persekitaran pembangunan bersepadu PHP yang berkuasa

Dreamweaver CS6

Dreamweaver CS6

Alat pembangunan web visual

SublimeText3 versi Mac

SublimeText3 versi Mac

Perisian penyuntingan kod peringkat Tuhan (SublimeText3)

Bagaimana untuk mendapatkan ID sesi semasa dalam PHP? Bagaimana untuk mendapatkan ID sesi semasa dalam PHP? Jul 13, 2025 am 03:02 AM

Kaedah untuk mendapatkan ID sesi semasa dalam PHP adalah menggunakan fungsi session_id (), tetapi anda mesti menghubungi session_start () untuk berjaya mendapatkannya. 1. Panggil session_start () untuk memulakan sesi; 2. Gunakan session_id () untuk membaca ID Sesi dan mengeluarkan rentetan yang serupa dengan ABC123DEF456GHI789; 3 Jika pulangan kosong, periksa sama ada session_start () hilang, sama ada pengguna mengakses untuk kali pertama, atau sama ada sesi dimusnahkan; 4. ID Sesi boleh digunakan untuk pembalakan, pengesahan keselamatan dan komunikasi silang, tetapi keselamatan perlu diberi perhatian. Pastikan sesi itu diaktifkan dengan betul dan ID boleh diperolehi dengan jayanya.

Php mendapatkan substring dari rentetan Php mendapatkan substring dari rentetan Jul 13, 2025 am 02:59 AM

Untuk mengekstrak substrings dari rentetan php, anda boleh menggunakan fungsi substr (), iaitu substra sintaks (string $ string, int $ start ,? int $ panjang = null), dan jika panjang tidak ditentukan, ia akan dipintas hingga akhir; Apabila memproses aksara berbilang bit seperti Cina, anda harus menggunakan fungsi MB_SUBSTR () untuk mengelakkan kod yang dihiasi; Jika anda perlu memintas rentetan mengikut pemisah tertentu, anda boleh menggunakan Eksploitasi () atau menggabungkan StrPOS () dan Substr () untuk melaksanakannya, seperti mengekstrak sambungan nama fail atau nama domain.

Bagaimana anda melakukan ujian unit untuk kod PHP? Bagaimana anda melakukan ujian unit untuk kod PHP? Jul 13, 2025 am 02:54 AM

UnittestinginphpinvolvesveryingindividualcodeUnitsLikeFunctionsormethodstocatchbugsearlyandensurerurereliableFactoring.1) setupphpunitviacomposer, createatestdirectory, danconfigureautoloadandphpunit.xml.2soSteSteSteShpunit.xml.2)

Cara memisahkan rentetan ke dalam array dalam php Cara memisahkan rentetan ke dalam array dalam php Jul 13, 2025 am 02:59 AM

Dalam PHP, kaedah yang paling biasa adalah untuk memecah rentetan ke dalam array menggunakan fungsi eksploit (). Fungsi ini membahagikan rentetan ke dalam pelbagai bahagian melalui pembatas yang ditentukan dan mengembalikan array. Sintaks adalah eksploit (pemisah, rentetan, had), di mana pemisah adalah pemisah, rentetan adalah rentetan asal, dan had adalah parameter pilihan untuk mengawal bilangan maksimum segmen. Contohnya $ str = "epal, pisang, oren"; $ arr = meletup (",", $ str); Hasilnya ialah ["Apple", "Bana

Jenis Data JavaScript: Rujukan primitif vs Jenis Data JavaScript: Rujukan primitif vs Jul 13, 2025 am 02:43 AM

Jenis data JavaScript dibahagikan kepada jenis primitif dan jenis rujukan. Jenis primitif termasuk rentetan, nombor, boolean, null, undefined, dan simbol. Nilai -nilai tidak berubah dan salinan disalin apabila memberikan nilai, jadi mereka tidak mempengaruhi satu sama lain; Jenis rujukan seperti objek, tatasusunan dan fungsi menyimpan alamat memori, dan pembolehubah menunjuk objek yang sama akan mempengaruhi satu sama lain. Typeof dan Instanceof boleh digunakan untuk menentukan jenis, tetapi memberi perhatian kepada isu -isu sejarah TypeOfNull. Memahami kedua -dua jenis perbezaan ini dapat membantu menulis kod yang lebih stabil dan boleh dipercayai.

Menggunakan std :: chrono di c Menggunakan std :: chrono di c Jul 15, 2025 am 01:30 AM

STD :: Chrono digunakan dalam C untuk memproses masa, termasuk mendapatkan masa semasa, mengukur masa pelaksanaan, titik masa operasi dan tempoh, dan masa analisis pemformatan. 1. Gunakan std :: chrono :: system_clock :: sekarang () untuk mendapatkan masa semasa, yang boleh ditukar menjadi rentetan yang boleh dibaca, tetapi jam sistem mungkin tidak membosankan; 2. Gunakan std :: chrono :: steady_clock untuk mengukur masa pelaksanaan untuk memastikan monoton, dan mengubahnya menjadi milisaat, saat dan unit lain melalui duration_cast; 3. Titik masa (time_point) dan tempoh (tempoh) boleh saling beroperasi, tetapi perhatian harus dibayar kepada keserasian unit dan zaman jam (Epoch)

Bagaimana untuk lulus pemboleh ubah sesi ke halaman lain di PHP? Bagaimana untuk lulus pemboleh ubah sesi ke halaman lain di PHP? Jul 13, 2025 am 02:39 AM

Dalam PHP, untuk lulus pemboleh ubah sesi ke halaman lain, kunci adalah untuk memulakan sesi dengan betul dan menggunakan nama kunci $ _Session yang sama. 1. Sebelum menggunakan pembolehubah sesi untuk setiap halaman, ia mesti dipanggil session_start () dan diletakkan di hadapan skrip; 2. Set pembolehubah sesi seperti $ _Session ['username'] = 'Johndoe' pada halaman pertama; 3. Selepas memanggil session_start () pada halaman lain, akses pembolehubah melalui nama kunci yang sama; 4. Pastikan bahawa session_start () dipanggil pada setiap halaman, elakkan mengeluarkan kandungan terlebih dahulu, dan periksa bahawa laluan penyimpanan sesi pada pelayan boleh ditulis; 5. Gunakan SES

Bagaimanakah PHP mengendalikan pembolehubah persekitaran? Bagaimanakah PHP mengendalikan pembolehubah persekitaran? Jul 14, 2025 am 03:01 AM

ToAccessenVironmentVariablesInphp, useGetenv () orthe $ _envsuperglobal.1.getenv ('var_name') retrievesaspecificvariable.2. $ _ En V ['var_name'] AccessSvariablesifvariables_orderinphp.iniincludes "e" .setVariablesviacliwithvar = valuePhpscript.php, inapach

See all articles