PHP開發(fā)基礎教程之類型、字符集、引擎和索引
數(shù)據(jù)類型
MySQL中存的是數(shù)據(jù)。只要是數(shù)據(jù),我們就會規(guī)定數(shù)據(jù)的類型。在表的字段中規(guī)定了使用的是某個數(shù)據(jù)類型。那么,在插入的數(shù)據(jù)中就要使用對應的數(shù)據(jù)類型。并且,遵守數(shù)據(jù)類型的長度要求。
在MySQL里面我們將數(shù)據(jù)類型分為了以下一些類型:
數(shù)值類型(整型、浮點)
字符串類型
日期時間類型
復合類型
整型
整型的長度不同,在實際使用過程也就PHP學院。
MySQL 以一個可選的顯示寬度指示器的形式對 SQL 標準進行擴展,這樣當從數(shù)據(jù)庫檢索一個值時,可以把這個值加長到指定的長度。例如,指定一個字段的類型為 INT(6),
就可以保證所包含數(shù)字少于 6 個的值從數(shù)據(jù)庫中檢索出來時能夠自動地用空格填充。需要注意的是,使用一個寬度指示器不會影響字段的大小和它可以存儲的值的范圍。
注意:
在創(chuàng)建表字段時,性別我們可以使用無符號的微小整型(tinyint)來表示。用0表示女、用1表示男。用2表示未知。
同樣人類年齡也是,在創(chuàng)建表字段時可用用無符號的整型。因為人類的年齡還沒有負數(shù)
在實際使用過程中。我們業(yè)務中最大需要存儲多大的數(shù)值。我們創(chuàng)建表時,就選擇什么樣的類型來存儲這樣的值。
浮點類型
注意:
浮點是非精確值,會存在不太準確的情況
而decimal叫做定點數(shù)。在MySQL內(nèi)部,本質(zhì)上是用字符串存儲的。實際使用過程中如果存在金額、錢精度要求比較高的浮點數(shù)存儲,建議使用decimal(定點數(shù))這個類型。
字符類型
*CHAR *?類型用于定長字符串,并且必須在圓括號內(nèi)用一個大小修飾符來定義。這個大小修飾符的范圍從 0-255。比指定長度大的值將被截短,而比指定長度小的值將會用空格作填補。
*VARCHAR *?把這個大小視為值的大小,不長度不足的情況下就用空格補足。而 VARCHAR 類型把它視為最大值并且只使用存儲字符串實際需要的長度
類型不會被空格填補,但長于指示器的值仍然會被截短。
因為 VARCHAR 類型可以根據(jù)實際內(nèi)容動態(tài)改變存儲值的長度,所以在不能確定字段需要多少字符時使用 VARCHAR 類型可以大大地節(jié)約磁盤空間、提高存儲效率。
text類型與blob類型?對于字段長度要求超過 255 個的情況下,MySQL 提供了 TEXT 和 BLOB 兩種類型。根據(jù)存儲數(shù)據(jù)的大小,它們都有不同的子類型。這些大型的數(shù)據(jù)用于存儲文本塊或圖像、
聲音文件等二進制數(shù)據(jù)類型。
TEXT 和 BLOB 類型在分類和比較上存在區(qū)別。BLOB 類型區(qū)分大小寫,而 TEXT 不區(qū)分大小寫。大小修飾符不用于各種 BLOB 和 TEXT 子類型。
時間類型
注意:
時間類型在web系統(tǒng)中用的比較少,很多時候很多人喜歡使用int來存儲時間。插入時插入的是unix時間戳,因為這種方式更方便計算。在前端業(yè)務中用date類型的函數(shù),再將unix時間戳轉(zhuǎn)成人們可識別的時間。
上面的類型你可以根據(jù)實際情況實際進行選擇
有些人為了在數(shù)據(jù)庫管理中方便查看,也有人使用datetime類型來存儲時間。
復合類型
一個 ENUM 類型只允許從一個集合中取得一個值;而 SET 類型允許從一個集合中取得任意多個值。
1.ENUM 類型
ENUM 類型因為只允許在集合中取得一個值,有點類似于單選項。在處理相互排拆的數(shù)據(jù)時容易讓人理解,比如人類的性別。ENUM 類型字段可以從集合中取得一個值或使用null值,除此之外的輸入將會使 MySQL 在這個字段中插入一個空字符串。另外如果插入值的大小寫與集合中值的大小寫不匹配,MySQL會自動使用插入值的大小寫轉(zhuǎn)換成與集合中大小寫一致的值。
ENUM 類型在系統(tǒng)內(nèi)部可以存儲為數(shù)字,并且從1開始用數(shù)字做索引。一個 ENUM 類型最多可以包含 65536 個元素,其中一個元素被 MySQL 保留,用來存儲錯誤信息,這個錯誤值用索引 0 或者一個空字符串表示。
MySQL 認為 ENUM 類型集合中出現(xiàn)的值是合法輸入,除此之外其它任何輸入都將失敗。這說明通過搜索包含空字符串或?qū)獢?shù)字索引為 0 的行就可以很容易地找到錯誤記錄的位置。
2.SET 類型?SET 類型與 ENUM 類型相似但不相同。SET類型可以從預定義的集合中取得任意數(shù)量的值。并且與 ENUM 類型相同的是任何試圖在 SET 類型字段中插入非預定義的值都會使MySQL插入一個空字符串。如果插入一個即有合法的元素又有非法的元素的記錄,MySQL 將會保留合法的元素,除去非法的元素。
一個 SET 類型最多可以包含 64 項元素。在 SET 元素中值被存儲為一個分離的“位”序列,這些“位”表示與它相對應的元素?!拔弧笔莿?chuàng)建有序元素集合的一種簡單而有效的方式。
并且它還去除了重復的元素,所以SET類型中不可能包含兩個相同的元素。
希望從 SET 類型字段中找出非法的記錄只需查找包含空字符串或二進制值為 0 的行。
類型使用
我們學習了這么多類型,在創(chuàng)建表的語句的時候使用對應的類型即可。
舉例如下:
CREATE TABLE IF NOT EXISTS?demo?(
id?int(11) NOT NULL,
username?varchar(50) NOT NULL,
password?char(32) NOT NULL,
content?longtext NOT NULL,
createtime?datetime NOT NULL,
sex?tinyint(4) NOT NULL
) ENGINE=InnoDB DEFAULT CHARSET=utf8;
字段其他屬性設置
UNSIGNED(無符號)?主要用于整型和浮點類型,使用無符號。即,沒有前面面的-(負號)。
存儲位數(shù)更長。tinyint整型的取值區(qū)間為,-128~127。而使用無符號后可存儲0-255個長度。
創(chuàng)建時在整型或浮點字段語句后接上:
unsigned
ZEROFILL(0填充)?0(不是空格)可以用來真補輸出的值。使用這個修飾符可以阻止 MySQL 數(shù)據(jù)庫存儲負值。
創(chuàng)建時在整型或浮點字段語句后接上:
zerofill
default?default屬性確保在沒有任何值可用的情況下,賦予某個常量值,這個值必須是常量,因為MySQL不允許插入函數(shù)或表達式值。此外,此屬性無法用于BLOB或TEXT列。如果已經(jīng)為此列指定了NULL屬性,沒有指定默認值時默認值將為NULL,否則默認值將依賴于字段的數(shù)據(jù)類型。
創(chuàng)建時在整型或浮點字段語句后接上:
default '值'
not null?如果將一個列定義為not null,將不允許向該列插入null值。建議在重要情況下始終使用not null屬性,因為它提供了一個基本驗證,確保已經(jīng)向查詢傳遞了所有必要的值。
創(chuàng)建時在整型或浮點字段語句后接上:
not null
null?為列指定null屬性時,該列可以保持為空,而不論行中其它列是否已經(jīng)被填充。記住,null精確的說法是“無”,而不是空字符串或0。
創(chuàng)建時在整型或浮點字段語句后不要聲明not null即可。
字符集
字符集是什么
為了更好的識別中文、日文、英文、希臘語。對于常用的符號進行了編碼,這個編碼就是字符集。
字符集確定了文字的存儲方式。
字符集相當于是計算機中人類的語言。
舉個例子:
我說的是英文,所以我存儲的時候要用英文文字來存儲。
如果我說的是中文,用英文字符來存儲的話。那么人們就看不懂也看不明白,就是我們所說的亂碼。
因為字符集太多了,足夠有幾十種上百種之多。所以我們不需要了解太多的字符集的知識,甚至不需要了解字符集到底是如何編成人類可見字符的。
字符集的重點知識
我們只需要了解:
常用字符集
數(shù)據(jù)庫中我們用什么字符集
英文字符集:
ASCII
ASCII 碼使用指定的7 位或8 位二進制數(shù)組合來表示128 或256 種可能的字符。標準ASCII 碼也叫基礎ASCII碼,使用7 位二進制數(shù)來表示所有的大寫和小寫字母,數(shù)字0 到9、標點符號, 以及在美式英語中使用的特殊控制字符。
其中:
0~31及127(共33個)是控制字符或通信專用字符(其余為可顯示字符),如控制符:LF(換行)、CR(回車)、FF(換頁)、DEL(刪除)、BS(退格)、BEL(響鈴)等;通信專用字符:SOH(文頭)、EOT(文尾)、ACK(確認)等;ASCII值為8、9、10 和13 分別轉(zhuǎn)換為退格、制表、換行和回車字符。它們并沒有特定的圖形顯示,但會依不同的應用程序,而對文本顯示有不同的影響。
32~126(共95個)是字符(32是空格),其中48~57為0到9十個阿拉伯數(shù)字。
65~90為26個大寫英文字母,97~122號為26個小寫英文字母,其余為一些標點符號、運算符號等。
GBK
GBK 向下與 GB 2312 編碼兼容。是中華人民共和國定義的漢字計算機編碼規(guī)范。早期版本為GB2312。
Unicode
Unicode(統(tǒng)一碼、萬國碼、單一碼)Unicode是國際組織制定的可以容納世界上所有文字和符號的字符編碼方案。以滿足跨語言、跨平臺進行文本轉(zhuǎn)換、處理的要求。
UTF-8
是一種針對Unicode的可變長度字符編碼,也是萬國碼。因為UNICODE比ASCII占用大一倍的空間,而對ASCII來說高字節(jié)的0對他毫無用處。為了解決這個問題,就出現(xiàn)了一些中間格式的字符集,他們被稱為通用轉(zhuǎn)換格式,即UTF(Universal Transformation Format)
實際工作中要使用的編碼
在中文中常用的字符集分為utf-8和GBK。
實際使用的如下:
觀察(圖一)的特點你會發(fā)現(xiàn),MySQL字符集由三個部份組成:
1.字符集?
2.語言
3.類型
最后的bin是指二進制字符集,后面的ci是指存儲排序時不區(qū)分字符的大小寫。
注意:
mysql在寫utf-8的時候?qū)懙氖莡tf8。不加中間的中橫線。
表引擎
MySQL的強大之處在于它的插件式存儲引擎,我們可以基于表的特點使用不同的存儲引擎,從而達到最好的性能。
如果你足夠熟悉,并且有一定工作經(jīng)驗后。你還可以使用阿里巴巴和網(wǎng)易開源出來的MySQL引擎在自己的服務器中使用。
大家在后面的一節(jié)《數(shù)據(jù)庫結(jié)構定義語句》中可以學到創(chuàng)建表的語句。mysql在創(chuàng)建表的時候,可以指定對應的引擎。
在mysql命令中使用:
show engines;
可以查看到當前服務器支持的所有引擎。
我們介紹幾種常用的引擎和了解幾個不常用的引擎。避免未來在實際工作中看到一些引擎不知道概念。
MyISAM
不支持事務,表鎖(表級鎖,加鎖會鎖住整個表),支持全文索引,操作速度快。常用于讀取多的業(yè)務。
myisam存儲引擎表由myd和myi組成。.myd用來存放數(shù)據(jù)文件,.myi用來存放索引文件。
對于myisam存儲引擎表,mysql數(shù)據(jù)庫只緩存其索引文件,數(shù)據(jù)文件的緩存由操作系統(tǒng)本身來完成。
InnoDB
支持事務,主要面向在線事務處理(OLTP)方面的應用。
行鎖設計,支持外鍵,即默認情況下讀取操作不加鎖。
InnoDB是為處理巨大數(shù)據(jù)量時的最大性能設計。
注:
行鎖:寫入、更新操作的時候?qū)⑦@一行鎖起來,不讓其他人再操作了。
表鎖:寫入、更新操作時,將表給鎖起來不讓其他人再操作了。
事務:同時操作多個數(shù)據(jù),若其中的一個數(shù)據(jù)操作失敗??苫貪L到操作之前。常用于銀行、電商、金融等系統(tǒng)中。
索引
索引看著挺高大上的一個名字,說白了就是我們書最新面的目錄。
假如你用新華字典來查找“張”這個漢字,不使用目錄的話,你可能要從新華字典的第一頁找到最后一頁,可能要花二個小時。字典越厚呢,你花的時間就越多?,F(xiàn)在你使用目錄來查找“張”這個漢字,張的首字母是z,z開頭的漢字從900多頁開始,有了這條線索,你查找一個漢字可能只要一分鐘,由此可見索引的重要性。
索引用于快速找出在某個列中有一特定值的行。
不使用索引,MySQL必須從第1條記錄開始然后讀完整個表直到找出相關的行。表越大,花費的時間越多。如果表中查詢的列有一個索引,MySQL能快速到達一個位置去搜尋到數(shù)據(jù)文件的中間,沒有必要看所有數(shù)據(jù)。
當然索引也不易過多,索引越多寫入,修改的速度越慢。因為,寫入修改數(shù)據(jù)時,也要修改索引。
MySQL的索引類型