Zahlensprache, ob in Englisch, Japanisch oder einer anderen Sprache, besteht aus vielen Charakteren. Wenn Sie sich mit einer numerischen Sprache befassen, ist eine grundlegende Frage, wie jeder Zeichen numerisch dargestellt wird. In der Vergangenheit mussten wir nur englische Charaktere darstellen, aber jetzt sind die Dinge sehr unterschiedlich, und das Ergebnis ist ein schillerndes Charakter -Codierungsschema, um Charaktere in mehreren verschiedenen Sprachen darzustellen. Wie verbindet und verarbeitet PHP diese verschiedenen Schemata?
Schlüsselpunkte
- Multi-Byte-Zeichen verwenden ein bis vier Bytes, um Zeichen zu definieren, was für numerische Darstellungen von Sprachen mit mehr als 256 einzigartigen Zeichen von entscheidender Bedeutung ist. Unicode, insbesondere UTF-8, ist das am h?ufigsten verwendete Codierungsschema für diese Zeichen.
- PHP selbst ist nicht für Multibyte -Zeichen ausgelegt. Um diese Zeichen zu verarbeiten, sollte ein spezieller Satz von Funktionen, die Mbstring -Funktion, verwendet werden. Der HTTP -Header von PHP enth?lt jedoch auch Zeichensatzkennungen, mit denen die Meta -Tags der Seite überschreiben k?nnen.
- Multi-Byte-Unterstützung ist nicht die Standardfunktion von PHP und erfordert eine Neukonfiguration. Um die MB-Funktion zu aktivieren, verwenden Sie die Option-Enable-Mbstring Compile-Time-Option und setzen Sie die Option für die Laufzeitkonfiguration mbstring-coding_translation fest.
- mehrere Multibyte -String -Befehle sind in PHP verfügbar, wie z. Multibyte -Version.
Grundlagen
Wir alle wissen, dass "Bits" 0 oder 1 sein k?nnen, w?hrend "Bytes" eine Kombination aus acht aufeinanderfolgenden Bits sind. Da es in einem Byte acht solcher doppelt bewerteten Bits gibt, kann ein Byte in insgesamt 256 verschiedenen Modi konfiguriert werden (bis zur 8. Leistung von 2). Mit jedem m?glichen 8-Bit-Modus k?nnen verschiedene Zeichen zugeordnet werden. Stellen Sie diese Bytes in unterschiedlichen Bestellungen zusammen und Sie haben Ihre eigene Art der Kommunikation. Es ist nicht unbedingt klug, es h?ngt davon ab, wer an beiden Enden ist, aber es ist Kommunikation. Solange wir Charaktere in einer Sprache mit 256 einzigartigen Charakteren oder weniger ausdrücken k?nnen, sind wir erfolgreich. Aber was ist, wenn wir eine Sprache mit nur 256 Zeichen nicht ausdrücken k?nnen? Oder was ist, wenn wir mehrere Sprachen im selben Dokument ausdrücken müssen? Heute, da wir alles digitalisieren, was wir finden k?nnen, sind 256 Zeichen weit entfernt. Glücklicherweise wurden Charakterprogramme, die diese Herausforderung besser begegnen, entworfen. Diese neuen Supercharacter -Sets verwenden ein bis vier Bytes, um Zeichen zu definieren. Heute ist der gro?e Typ im Bereich Charakter -Codierung Unicode, eine L?sung, die mehrere Bytes verwendet, um Zeichen darzustellen. Es wurde vom Unicode-Konsortium entwickelt und erh?lt in mehreren Versionen: UTF-32 (für Dreadnaught Class Starship), UTF-16 (für Enterprise in Star Trek: Dark Ungebunden) und UTF-8 (die meisten von uns sollten es im Realen verwenden Welt für unsere Webanwendungen). Wie ich bereits sagte, verwendet Unicode (einschlie?lich UTF-8) mehrere Byte-Konfigurationen, um Zeichen darzustellen. UTF-8 verwendet ein bis vier Bytes, um 1.112.064 Muster zu generieren, um verschiedene Zeichen darzustellen. Diese "breiten Charaktere" nehmen mehr Platz in Anspruch, aber UTF-8 verarbeitet tendenziell schneller als einige andere Codierungsschemata. Warum loben alle UTF-8? Ein Teil davon sind die beliebten Modelle, die in UTF-8-f?higen Anzeigen hervorgehoben werden, die auf ESPN und TCM zu sehen sind, aber vor allem, weil UTF-8 ASCII nachahmt, was ASCII genau verfolgt, wenn Sie keine Sonderzeichen betreffen.
Wie wirkt sich dies auf PHP aus?
Ich wei?, was Sie denken. Ich muss nur das Zeichen auf "UTF-8" in meinem Meta-Tag einstellen und alles wird in Ordnung. Aber das ist nicht wahr. Erstens ist die einfache Tatsache, dass PHP nicht wirklich für Multibyte -Zeichen konzipiert ist. Die Verwendung von Standard -String -Funktionen zum Betrieb dieser Zeichen kann daher ungew?hnliche Ergebnisse erzielen. Wenn wir diese Multibyte -Zeichen verarbeiten müssen, müssen wir einen speziellen Satz von Funktionen verwenden: die Mbstring -Funktion. Zweitens, selbst wenn Sie PHP kontrollieren, gibt es m?glicherweise immer noch Probleme. Der HTTP -Header, der Ihre Kommunikation überschreibt, enth?lt auch eine Zeichensatzidentit?t, die den Inhalt im Seite Meta -Tag überschreibt. Wie geht PHP mit Multibyte -Zeichen um? Es gibt zwei Funktionen von Funktionen, die sich auf Multibyte -Saiten auswirken. Der erste ist iConv. Beginnend mit Version 5.0 ist dies zum Standardteil der Sprache geworden, eine M?glichkeit, einen Zeichen in eine andere Zeichensatzdarstellung zu konvertieren. Dies ist nicht das, was wir in diesem Artikel diskutieren werden. Der zweite ist Multibyte Support, eine Reihe von Befehlen, die mit "MB_" vorangestellt sind. Es gibt viele dieser Befehle, und eine kurze überprüfung zeigt, dass einige von ihnen mit der Bestimmung in Verbindung stehen, ob Zeichen basierend auf einem bestimmten Codierungsschema angemessen sind, w?hrend andere suchorientierte Funktionen sind, die einem Teil der regul?ren PHP-Ausdrücke ?hnlich sind, jedoch Multibyte-Funktionen sind.
Aktivieren Sie die Multibyte -Unterstützung für PHP
Multi-byte-Unterstützung ist nicht die Standardfunktion von PHP, aber wir müssen auch keine zus?tzlichen Bibliotheken oder Erweiterungen herunterladen. Wenn Sie eine verwaltete Version von PHP verwenden, k?nnen Sie leider nicht etwas tun, was Sie tun k?nnen. Verwenden Sie die Funktion phpinfo (), um Ihre Konfiguration anzuzeigen. Scrollen Sie ungef?hr auf halber Strecke nach unten, und es wird einen Abschnitt namens "Mbstring" geben. Dies zeigt Ihnen, ob die grundlegenden Funktionen aktiviert sind. Informationen zum Aktivieren dieser Funktion finden Sie im Handbuch. Kurz gesagt, Sie k?nnen die MB-Funktion mit der Option-Enable-Mbstring Compile-Time verwenden und die Option zur Laufzeitkonfiguration MBString-Coding_Translation einstellen. Natürlich ist die endgültige L?sung PHP 6, da die IBM -Bibliothek (bitte Ihre Hut abnehmen), um die native Unterstützung für Multibyte -Zeichensets zu gew?hrleisten. Wir müssen uns nur hinsetzen und warten, oder? Schauen Sie sich jedoch bis dahin den Multibyte -Support ab, der ab sofort verfügbar ist.
Befehl multi-byte String
Es kann 53 verschiedene Multibyte -String -Befehle geben. Es kann 54 geben. Ich war irgendwann ein wenig aus dem Weg, aber du bekommst was ich meine. Unn?tig zu erw?hnen, dass wir es nacheinander nicht erkl?ren werden, aber zum Spa? schauen wir uns einen kurzen Blick auf einige.
- mb_check_encoding
mb_check_encoding () prüft, ob eine bestimmte Codierungssequenz für das Codierungsschema gültig ist. Die Funktion wird Ihnen nicht sagen, wie die Zeichenfolge codiert ist (oder für welche Schemata sie funktionieren wird), aber sie wird Ihnen sagen, ob sie für das angegebene Schema funktioniert.
<?php $string = 'u4F60u597Du4E16u754C'; $string = json_decode('"' . $string . '"'); $valid = mb_check_encoding($string, 'UTF-8'); echo ($valid) ? 'valid' : 'invalid'; ?>
Sie finden im PHP -Handbuch eine Liste unterstützter Codierungen.
- mb_strlen
strlen () gibt die Anzahl der Bytes in der Zeichenfolge zurück. Für ASCII, das ein einzelnes Byte ist, ist es sch?n, die Anzahl der Zeichen zu finden. Für Multibyte -Zeichenfolgen müssen Sie die Funktion mb_strlen () verwenden.
<?php $string = 'u4F60u597Du4E16u754C'; $string = json_decode('"' . $string . '"'); $valid = mb_check_encoding($string, 'UTF-8'); echo ($valid) ? 'valid' : 'invalid'; ?>
- mb_ereg_search
mb_ereg_search () führt eine Multibyte -Version der traditionellen Zeichensuche aus. Es gibt jedoch einige Vorbehalte - Sie müssen das Codierungsschema unter Verwendung der Funktion mb_regex_encoding () angeben, der regul?re Ausdruck hat keinen Separator (es ist nur ein Musterteil), und sowohl der regul?re Ausdruck als auch die Zeichenfolge werden unter Verwendung von mb_ereg_search_init () angegeben.
<?php $string = 'u4F60u597Du4E16u754C'; $string = json_decode('"' . $string . '"'); echo strlen($string); // 輸出 12 – 錯(cuò)誤! echo mb_strlen($string, 'UTF-8'); // 輸出 4 ?>
Ist es genug?
Ich wei? nicht, wie es dir geht, aber ich denke, die Welt braucht wirklich einfachere Dinge. Leider entspricht die Multibyte -Verarbeitung diese Anforderung nicht. Aber vorerst ist das etwas, das Sie nicht ignorieren k?nnen. Manchmal k?nnen Sie keine normale PHP -String -Verarbeitung durchführen (da Sie versuchen, Zeichen zu verarbeiten, die den normalen ASCII -Bereich (U 0000 - U 00ff) überschreiten. Dies bedeutet, dass Sie MB_ -orientierte Funktionen verwenden müssen. Willst du mehr wissen? Im Ernst, willst du? Ich dachte wirklich, das würde dich abschrecken. Ich war dafür unvorbereitet. Meine Zeit ist gekommen. Was ist Ihre beste Wahl? Schauen Sie sich das PHP -Handbuch an. Oh, und probiere etwas aus. Es gibt nichts, was die Erfahrung ersetzt, etwas tats?chlich zu verwenden.
(Der ursprüngliche FAQ -Teil sollte hier beibehalten werden, da sein Inhalt in hohem Ma?e mit dem Thema des Artikels zusammenh?ngt und die Lesbarkeit nach dem Umschreiben verringert.)
Das obige ist der detaillierte Inhalt vonPHP Master | Arbeiten mit Multibyte -Saiten. Für weitere Informationen folgen Sie bitte anderen verwandten Artikeln auf der PHP chinesischen Website!

Hei?e KI -Werkzeuge

Undress AI Tool
Ausziehbilder kostenlos

Undresser.AI Undress
KI-gestützte App zum Erstellen realistischer Aktfotos

AI Clothes Remover
Online-KI-Tool zum Entfernen von Kleidung aus Fotos.

Clothoff.io
KI-Kleiderentferner

Video Face Swap
Tauschen Sie Gesichter in jedem Video mühelos mit unserem v?llig kostenlosen KI-Gesichtstausch-Tool aus!

Hei?er Artikel

Hei?e Werkzeuge

Notepad++7.3.1
Einfach zu bedienender und kostenloser Code-Editor

SublimeText3 chinesische Version
Chinesische Version, sehr einfach zu bedienen

Senden Sie Studio 13.0.1
Leistungsstarke integrierte PHP-Entwicklungsumgebung

Dreamweaver CS6
Visuelle Webentwicklungstools

SublimeText3 Mac-Version
Codebearbeitungssoftware auf Gottesniveau (SublimeText3)

Hei?e Themen

TosecurelyHandleAuthenticationAuthorizationInphp, folge theSteps: 1.Alwayshashpasswordswithpassword_hash () und password_verify (), usePreeParedStatementStopreventsQlinjapitca und StoreuserDatain $ _SessionArtelogin.2.ImplementscaChescescesc

Um Datei -Uploads in PHP sicher zu verarbeiten, besteht der Kern darin, Dateitypen zu überprüfen, Dateien umzubenennen und die Berechtigungen zu beschr?nken. 1. Verwenden Sie Finfo_File (), um den realen MIME -Typ zu überprüfen, und nur bestimmte Typen wie Bild/JPEG sind zul?ssig. 2. Verwenden Sie Uniqid (), um zuf?llige Dateinamen zu generieren und sie im Root-Verzeichnis ohne Web zu speichern. 3.. Begrenzen Sie die Dateigr??e durch Php.ini- und HTML -Formulare und setzen Sie die Verzeichnisberechtigungen auf 0755; 4. Verwenden Sie Clamav, um Malware zu scannen, um die Sicherheit zu verbessern. Diese Schritte verhindern effektiv Sicherheitslücken und stellen sicher, dass der Upload -Prozess des Datei -Uploads sicher und zuverl?ssig ist.

In PHP ist der Hauptunterschied zwischen == und == die Strenge der Typprüfung. == Die Konvertierung des Typs wird vor dem Vergleich durchgeführt, beispielsweise 5 == "5" gibt true zurück und === fordert an, dass der Wert und der Typ gleich sind, bevor True zurückgegeben wird, z. B. 5 === "5" gibt false zurück. In den Nutzungsszenarien ist === sicherer und sollte zuerst verwendet werden, und == wird nur verwendet, wenn die Typumwandlung erforderlich ist.

Die Methoden zur Verwendung grundlegender mathematischer Operationen in PHP sind wie folgt: 1. Additionszeichen unterstützen Ganzfaktoren und Floating-Punkt-Zahlen und k?nnen auch für Variablen verwendet werden. String -Nummern werden automatisch konvertiert, aber nicht für Abh?ngigkeiten empfohlen. 2. Subtraktionszeichen verwenden - Zeichen, Variablen sind gleich, und die Typumwandlung ist ebenfalls anwendbar. 3. Multiplikationszeichen verwenden * Zeichen, die für Zahlen und ?hnliche Zeichenfolgen geeignet sind; 4. Division verwendet / Zeichen, die vermeiden müssen, durch Null zu dividieren, und beachten Sie, dass das Ergebnis m?glicherweise schwimmende Punktzahlen sein kann. 5. Die Modulzeichen k?nnen verwendet werden, um ungerade und sogar Zahlen zu beurteilen, und wenn negative Zahlen verarbeitet werden, stimmen die Restzeichen mit der Dividende überein. Der Schlüssel zur korrekten Verwendung dieser Operatoren liegt darin, sicherzustellen, dass die Datentypen klar sind und die Grenzsituation gut behandelt wird.

Ja, PHP kann mit NoSQL -Datenbanken wie MongoDB und Redis durch bestimmte Erweiterungen oder Bibliotheken interagieren. Verwenden Sie zun?chst den MongoDBPHP -Treiber (installiert über PECL oder Composer), um Client -Instanzen zu erstellen und Datenbanken und Sammlungen zu betreiben, wobei Sie Insertion, Abfrage, Aggregation und andere Vorg?nge unterstützen. Zweitens verwenden Sie die Predis Library oder PHPREDIS-Erweiterung, um eine Verbindung zu Redis herzustellen, Schlüsselwerteinstellungen und -akquisitionen durchzuführen und PHPREDIS für Hochleistungsszenarien zu empfehlen, w?hrend Predis für die schnelle Bereitstellung bequem ist. Beide sind für Produktionsumgebungen geeignet und gut dokumentiert.

TostaycurrentwithPHPdevelopmentsandbestpractices,followkeynewssourceslikePHP.netandPHPWeekly,engagewithcommunitiesonforumsandconferences,keeptoolingupdatedandgraduallyadoptnewfeatures,andreadorcontributetoopensourceprojects.First,followreliablesource

PHPBECAMEPOPULARFORWebDevelopmentDuetoitSeaseoflearning, Seamlessintegrationwithhtml, weit verbreitete Hostingsupport, andalargeecosystemincludingFrameWorkelaravelandcmsplatformen -?hnliche WordPress.itexcelsinformlingsformen, Managingusesersions, Interacti

Tosettherighttimezoneinphp, usedate_default_timezone_set () functionAtthestartofyourScriptWithAvalididentifiersuchas'america/new_york'.1.usedate_default_timezone_set () beeanydate/timeFununtions.2.Alternativ, konfigurieren
