国产av日韩一区二区三区精品,成人性爱视频在线观看,国产,欧美,日韩,一区,www.成色av久久成人,2222eeee成人天堂

目錄
創(chuàng)建數(shù)據(jù)腳本" >創(chuàng)建數(shù)據(jù)腳本
開始測試 " >開始測試
普通分頁查詢" >普通分頁查詢
相同偏移量,不同數(shù)據(jù)量" >相同偏移量,不同數(shù)據(jù)量
相同數(shù)據(jù)量,不同偏移量" >相同數(shù)據(jù)量,不同偏移量
如何優(yōu)化 " >如何優(yōu)化
優(yōu)化偏移量大問題" >優(yōu)化偏移量大問題
采用子查詢方式" >采用子查詢方式
采用 id 限定方式" >采用 id 限定方式
優(yōu)化數(shù)據(jù)量大問題" >優(yōu)化數(shù)據(jù)量大問題
首頁 Java Java面試題 面試官:一千萬的數(shù)據(jù),你是怎么查詢的?

面試官:一千萬的數(shù)據(jù),你是怎么查詢的?

Aug 15, 2023 pm 04:34 PM
java java面試

最近在給大家做模擬面試和簡歷優(yōu)化,其中發(fā)現(xiàn)很多人一看到什么千萬級數(shù)據(jù)之類的面試題就會腿軟。

也許有些人沒遇過上千萬數(shù)據(jù)量的表,也不清楚查詢上千萬數(shù)據(jù)量的時候會發(fā)生什么。

今天就來帶大家實操一下,這次是基于MySQL 5.7.26做測試

準(zhǔn)備數(shù)據(jù)

沒有一千萬的數(shù)據(jù)怎么辦?

沒有數(shù)據(jù)自己不會造嗎?

造數(shù)據(jù)難嗎?

代碼創(chuàng)建一千萬?

那是不可能的,太慢了,可能真的要跑一天??梢圆捎脭?shù)據(jù)庫腳本執(zhí)行速度快很多。

創(chuàng)建表
CREATE TABLE `user_operation_log`  (
  `id` int(11) NOT NULL AUTO_INCREMENT,
  `user_id` varchar(64) CHARACTER SET utf8mb4 COLLATE utf8mb4_general_ci NULL DEFAULT NULL,
  `ip` varchar(20) CHARACTER SET utf8mb4 COLLATE utf8mb4_general_ci NULL DEFAULT NULL,
  `op_data` varchar(255) CHARACTER SET utf8mb4 COLLATE utf8mb4_general_ci NULL DEFAULT NULL,
  `attr1` varchar(255) CHARACTER SET utf8mb4 COLLATE utf8mb4_general_ci NULL DEFAULT NULL,
  `attr2` varchar(255) CHARACTER SET utf8mb4 COLLATE utf8mb4_general_ci NULL DEFAULT NULL,
  `attr3` varchar(255) CHARACTER SET utf8mb4 COLLATE utf8mb4_general_ci NULL DEFAULT NULL,
  `attr4` varchar(255) CHARACTER SET utf8mb4 COLLATE utf8mb4_general_ci NULL DEFAULT NULL,
  `attr5` varchar(255) CHARACTER SET utf8mb4 COLLATE utf8mb4_general_ci NULL DEFAULT NULL,
  `attr6` varchar(255) CHARACTER SET utf8mb4 COLLATE utf8mb4_general_ci NULL DEFAULT NULL,
  `attr7` varchar(255) CHARACTER SET utf8mb4 COLLATE utf8mb4_general_ci NULL DEFAULT NULL,
  `attr8` varchar(255) CHARACTER SET utf8mb4 COLLATE utf8mb4_general_ci NULL DEFAULT NULL,
  `attr9` varchar(255) CHARACTER SET utf8mb4 COLLATE utf8mb4_general_ci NULL DEFAULT NULL,
  `attr10` varchar(255) CHARACTER SET utf8mb4 COLLATE utf8mb4_general_ci NULL DEFAULT NULL,
  `attr11` varchar(255) CHARACTER SET utf8mb4 COLLATE utf8mb4_general_ci NULL DEFAULT NULL,
  `attr12` varchar(255) CHARACTER SET utf8mb4 COLLATE utf8mb4_general_ci NULL DEFAULT NULL,
  PRIMARY KEY (`id`) USING BTREE
) ENGINE = InnoDB AUTO_INCREMENT = 1 CHARACTER SET = utf8mb4 COLLATE = utf8mb4_general_ci ROW_FORMAT = Dynamic;
創(chuàng)建數(shù)據(jù)腳本

采用批量插入,效率會快很多,而且每1000條數(shù)就commit,數(shù)據(jù)量太大,也會導(dǎo)致批量插入效率慢

DELIMITER ;;
CREATE PROCEDURE batch_insert_log()
BEGIN
  DECLARE i INT DEFAULT 1;
  DECLARE userId INT DEFAULT 10000000;
 set @execSql = 'INSERT INTO `test`.`user_operation_log`(`user_id`, `ip`, `op_data`, `attr1`, `attr2`, `attr3`, `attr4`, `attr5`, `attr6`, `attr7`, `attr8`, `attr9`, `attr10`, `attr11`, `attr12`) VALUES';
 set @execData = '';
  WHILE i<=10000000 DO
   set @attr = "&#39;測試很長很長很長很長很長很長很長很長很長很長很長很長很長很長很長很長很長的屬性&#39;";
  set @execData = concat(@execData, "(", userId + i, ", &#39;10.0.69.175&#39;, &#39;用戶登錄操作&#39;", ",", @attr, ",", @attr, ",", @attr, ",", @attr, ",", @attr, ",", @attr, ",", @attr, ",", @attr, ",", @attr, ",", @attr, ",", @attr, ",", @attr, ")");
  if i % 1000 = 0
  then
     set @stmtSql = concat(@execSql, @execData,";");
    prepare stmt from @stmtSql;
    execute stmt;
    DEALLOCATE prepare stmt;
    commit;
    set @execData = "";
   else
     set @execData = concat(@execData, ",");
   end if;
  SET i=i+1;
  END WHILE;

END;;
DELIMITER ;

開始測試

哥的電腦配置比較低:win10 標(biāo)壓渣渣i5 讀寫約500MB的SSD

由于配置低,本次測試只準(zhǔn)備了3148000條數(shù)據(jù),占用了磁盤5G(還沒建索引的情況下),跑了38min,電腦配置好的同學(xué),可以插入多點數(shù)據(jù)測試

SELECT count(1) FROM `user_operation_log`

返回結(jié)果:3148000

三次查詢時間分別為:

  • 14060 ms
  • 13755 ms
  • 13447 ms

普通分頁查詢

MySQL 支持 LIMIT 語句來選取指定的條數(shù)數(shù)據(jù), Oracle 可以使用 ROWNUM 來選取。

MySQL分頁查詢語法如下:

SELECT * FROM table LIMIT [offset,] rows | rows OFFSET offset
  • 第一個參數(shù)指定第一個返回記錄行的偏移量
  • 第二個參數(shù)指定返回記錄行的最大數(shù)目

下面我們開始測試查詢結(jié)果:

SELECT * FROM `user_operation_log` LIMIT 10000, 10

查詢3次時間分別為:

  • 59 ms
  • 49 ms
  • 50 ms

這樣看起來速度還行,不過是本地數(shù)據(jù)庫,速度自然快點。

換個角度來測試

相同偏移量,不同數(shù)據(jù)量

SELECT * FROM `user_operation_log` LIMIT 10000, 10
SELECT * FROM `user_operation_log` LIMIT 10000, 100
SELECT * FROM `user_operation_log` LIMIT 10000, 1000
SELECT * FROM `user_operation_log` LIMIT 10000, 10000
SELECT * FROM `user_operation_log` LIMIT 10000, 100000
SELECT * FROM `user_operation_log` LIMIT 10000, 1000000

查詢時間如下:

數(shù)量第一次第二次第三次
10條53ms52ms47ms
100條50ms60ms55ms
1000條61ms74ms60ms
10000條164ms180ms217ms
100000條1609ms1741ms1764ms
1000000條16219ms16889ms17081ms

從上面結(jié)果可以得出結(jié)束:數(shù)據(jù)量越大,花費時間越長

相同數(shù)據(jù)量,不同偏移量

SELECT * FROM `user_operation_log` LIMIT 100, 100
SELECT * FROM `user_operation_log` LIMIT 1000, 100
SELECT * FROM `user_operation_log` LIMIT 10000, 100
SELECT * FROM `user_operation_log` LIMIT 100000, 100
SELECT * FROM `user_operation_log` LIMIT 1000000, 100
偏移量第一次第二次第三次
10036ms40ms36ms
100031ms38ms32ms
1000053ms48ms51ms
100000622ms576ms627ms
10000004891ms5076ms4856ms

從上面結(jié)果可以得出結(jié)束:偏移量越大,花費時間越長

SELECT * FROM `user_operation_log` LIMIT 100, 100
SELECT id, attr FROM `user_operation_log` LIMIT 100, 100

如何優(yōu)化

既然我們經(jīng)過上面一番的折騰,也得出了結(jié)論,針對上面兩個問題:偏移大、數(shù)據(jù)量大,我們分別著手優(yōu)化

優(yōu)化偏移量大問題

采用子查詢方式

我們可以先定位偏移位置的 id,然后再查詢數(shù)據(jù)

SELECT * FROM `user_operation_log` LIMIT 1000000, 10

SELECT id FROM `user_operation_log` LIMIT 1000000, 1

SELECT * FROM `user_operation_log` WHERE id >= (SELECT id FROM `user_operation_log` LIMIT 1000000, 1) LIMIT 10

查詢結(jié)果如下:

sql花費時間
第一條4818ms
第二條(無索引情況下)4329ms
第二條(有索引情況下)199ms
第三條(無索引情況下)4319ms
第三條(有索引情況下)201ms

從上面結(jié)果得出結(jié)論:

  • 第一條花費的時間最大,第三條比第一條稍微好點
  • 子查詢使用索引速度更快

缺點:只適用于id遞增的情況

id非遞增的情況可以使用以下寫法,但這種缺點是分頁查詢只能放在子查詢里面

注意:某些 mysql 版本不支持在 in 子句中使用 limit,所以采用了多個嵌套select

SELECT * FROM `user_operation_log` WHERE id IN (SELECT t.id FROM (SELECT id FROM `user_operation_log` LIMIT 1000000, 10) AS t)
采用 id 限定方式

這種方法要求更高些,id必須是連續(xù)遞增,而且還得計算id的范圍,然后使用 between,sql如下

SELECT * FROM `user_operation_log` WHERE id between 1000000 AND 1000100 LIMIT 100

SELECT * FROM `user_operation_log` WHERE id >= 1000000 LIMIT 100

查詢結(jié)果如下:

sql花費時間
第一條22ms
第二條21ms

從結(jié)果可以看出這種方式非???/p>

注意:這里的 LIMIT 是限制了條數(shù),沒有采用偏移量

優(yōu)化數(shù)據(jù)量大問題

返回結(jié)果的數(shù)據(jù)量也會直接影響速度

SELECT * FROM `user_operation_log` LIMIT 1, 1000000

SELECT id FROM `user_operation_log` LIMIT 1, 1000000

SELECT id, user_id, ip, op_data, attr1, attr2, attr3, attr4, attr5, attr6, attr7, attr8, attr9, attr10, attr11, attr12 FROM `user_operation_log` LIMIT 1, 1000000

查詢結(jié)果如下:

sql 花費時間
第一條 15676ms
第二條 7298ms
第三條 15960ms

從結(jié)果可以看出減少不需要的列,查詢效率也可以得到明顯提升

第一條和第三條查詢速度差不多,這時候你肯定會吐槽,那我還寫那么多字段干啥呢,直接 * 不就完事了

注意本人的 MySQL 服務(wù)器和客戶端是在_同一臺機器_上,所以查詢數(shù)據(jù)相差不多,有條件的同學(xué)可以測測客戶端與MySQL分開

SELECT * 它不香嗎?

在這里順便補充一下為什么要禁止 SELECT *。難道簡單無腦,它不香嗎?SELECT *。難道簡單無腦,它不香嗎?

主要兩點:

  1. 用 "SELECT * " 數(shù)據(jù)庫需要解析更多的對象、字段、權(quán)限、屬性等相關(guān)內(nèi)容,在 SQL 語句復(fù)雜,硬解析較多的情況下,會對數(shù)據(jù)庫造成沉重的負(fù)擔(dān)。
  2. 增大網(wǎng)絡(luò)開銷,*
    主要兩點:
    1. 用 "SELECT * " 數(shù)據(jù)庫需要解析更多的對象、字段、權(quán)限、屬性等相關(guān)內(nèi)容,在 SQL 語句復(fù)雜,硬解析較多的情況下,會對數(shù)據(jù)庫造成沉重的負(fù)擔(dān)。
  • 增大網(wǎng)絡(luò)開銷,* 有時會誤帶上如log、IconMD5之類的無用且大文本字段,數(shù)據(jù)傳輸size會幾何增漲。特別是MySQL和應(yīng)用程序不在同一臺機器,這種開銷非常明顯。

  • ????????

    以上是面試官:一千萬的數(shù)據(jù),你是怎么查詢的?的詳細(xì)內(nèi)容。更多信息請關(guān)注PHP中文網(wǎng)其他相關(guān)文章!

    本站聲明
    本文內(nèi)容由網(wǎng)友自發(fā)貢獻(xiàn),版權(quán)歸原作者所有,本站不承擔(dān)相應(yīng)法律責(zé)任。如您發(fā)現(xiàn)有涉嫌抄襲侵權(quán)的內(nèi)容,請聯(lián)系admin@php.cn

    熱AI工具

    Undress AI Tool

    Undress AI Tool

    免費脫衣服圖片

    Undresser.AI Undress

    Undresser.AI Undress

    人工智能驅(qū)動的應(yīng)用程序,用于創(chuàng)建逼真的裸體照片

    AI Clothes Remover

    AI Clothes Remover

    用于從照片中去除衣服的在線人工智能工具。

    Clothoff.io

    Clothoff.io

    AI脫衣機

    Video Face Swap

    Video Face Swap

    使用我們完全免費的人工智能換臉工具輕松在任何視頻中換臉!

    熱工具

    記事本++7.3.1

    記事本++7.3.1

    好用且免費的代碼編輯器

    SublimeText3漢化版

    SublimeText3漢化版

    中文版,非常好用

    禪工作室 13.0.1

    禪工作室 13.0.1

    功能強大的PHP集成開發(fā)環(huán)境

    Dreamweaver CS6

    Dreamweaver CS6

    視覺化網(wǎng)頁開發(fā)工具

    SublimeText3 Mac版

    SublimeText3 Mac版

    神級代碼編輯軟件(SublimeText3)

    如何在Java的地圖上迭代? 如何在Java的地圖上迭代? Jul 13, 2025 am 02:54 AM

    遍歷Java中的Map有三種常用方法:1.使用entrySet同時獲取鍵和值,適用于大多數(shù)場景;2.使用keySet或values分別遍歷鍵或值;3.使用Java8的forEach簡化代碼結(jié)構(gòu)。entrySet返回包含所有鍵值對的Set集合,每次循環(huán)獲取Map.Entry對象,適合頻繁訪問鍵和值的情況;若只需鍵或值,可分別調(diào)用keySet()或values(),也可在遍歷鍵時通過map.get(key)獲取值;Java8中可通過Lambda表達(dá)式使用forEach((key,value)-&gt

    Java可選示例 Java可選示例 Jul 12, 2025 am 02:55 AM

    Optional能清晰表達(dá)意圖并減少null判斷的代碼噪音。1.Optional.ofNullable是處理可能為null對象的常用方式,如從map中取值時可結(jié)合orElse提供默認(rèn)值,邏輯更清晰簡潔;2.通過鏈?zhǔn)秸{(diào)用map實現(xiàn)嵌套取值,安全地避免NPE,任一環(huán)節(jié)為null則自動終止并返回默認(rèn)值;3.filter可用于條件篩選,滿足條件才繼續(xù)執(zhí)行后續(xù)操作,否則直接跳到orElse,適合輕量級業(yè)務(wù)判斷;4.不建議過度使用Optional,如基本類型或簡單邏輯中其反而增加復(fù)雜度,部分場景直接返回nu

    如何修復(fù)java.io.notserializable Exception? 如何修復(fù)java.io.notserializable Exception? Jul 12, 2025 am 03:07 AM

    遇到j(luò)ava.io.NotSerializableException的核心解決方法是確保所有需序列化的類實現(xiàn)Serializable接口,并檢查嵌套對象的序列化支持。1.給主類添加implementsSerializable;2.確保類中自定義字段對應(yīng)的類也實現(xiàn)Serializable;3.用transient標(biāo)記不需要序列化的字段;4.檢查集合或嵌套對象中的非序列化類型;5.查看異常信息定位具體哪個類未實現(xiàn)接口;6.對無法修改的類考慮替換設(shè)計,如保存關(guān)鍵數(shù)據(jù)或使用可序列化的中間結(jié)構(gòu);7.考慮改

    Java中的可比較與比較器 Java中的可比較與比較器 Jul 13, 2025 am 02:31 AM

    在Java中,Comparable用于類內(nèi)部定義默認(rèn)排序規(guī)則,Comparator用于外部靈活定義多種排序邏輯。1.Comparable是類自身實現(xiàn)的接口,通過重寫compareTo()方法定義自然順序,適用于類有固定、最常用的排序方式,如String或Integer。2.Comparator是外部定義的函數(shù)式接口,通過compare()方法實現(xiàn),適合同一類需要多種排序方式、無法修改類源碼或排序邏輯經(jīng)常變化的情況。兩者區(qū)別在于Comparable只能定義一種排序邏輯且需修改類本身,而Compar

    Java方法參考解釋了 Java方法參考解釋了 Jul 12, 2025 am 02:59 AM

    方法引用是Java中一種簡化Lambda表達(dá)式的寫法,使代碼更簡潔。它不是新語法,而是Java8引入的Lambda表達(dá)式的一種快捷方式,適用于函數(shù)式接口的上下文。其核心在于將已有方法直接作為函數(shù)式接口的實現(xiàn)來使用。例如System.out::println等價于s->System.out.println(s)。方法引用主要有四種形式:1.靜態(tài)方法引用(ClassName::staticMethodName);2.實例方法引用(綁定到特定對象,instance::methodName);3.

    如何處理Java中的字符編碼問題? 如何處理Java中的字符編碼問題? Jul 13, 2025 am 02:46 AM

    處理Java中的字符編碼問題,關(guān)鍵是在每一步都明確指定使用的編碼。1.讀寫文本時始終指定編碼,使用InputStreamReader和OutputStreamWriter并傳入明確的字符集,避免依賴系統(tǒng)默認(rèn)編碼。2.在網(wǎng)絡(luò)邊界處理字符串時確保兩端一致,設(shè)置正確的Content-Type頭并用庫顯式指定編碼。3.謹(jǐn)慎使用String.getBytes()和newString(byte[]),應(yīng)始終手動指定StandardCharsets.UTF_8以避免平臺差異導(dǎo)致的數(shù)據(jù)損壞。總之,通過在每個階段

    如何在Java解析JSON? 如何在Java解析JSON? Jul 11, 2025 am 02:18 AM

    解析JSON在Java中的常見方式有三種:使用Jackson、Gson或org.json。1.Jackson適合大多數(shù)項目,性能好且功能全面,支持對象與JSON字符串之間的轉(zhuǎn)換及注解映射;2.Gson更適合Android項目或輕量級需求,使用簡單但處理復(fù)雜結(jié)構(gòu)和高性能場景略遜;3.org.json適用于簡單任務(wù)或小腳本,不推薦用于大型項目,因其靈活性和類型安全不足。選擇應(yīng)根據(jù)實際需求決定。

    新電子郵件的Outlook快捷方式 新電子郵件的Outlook快捷方式 Jul 11, 2025 am 03:25 AM

    在Outlook中快速新建郵件的方法如下:1.桌面版使用快捷鍵Ctrl Shift M,可直接彈出新郵件窗口;2.網(wǎng)頁版可通過創(chuàng)建包含JavaScript的書簽(如javascript:document.querySelector("divrole='button'").click())實現(xiàn)一鍵新建郵件;3.使用瀏覽器插件(如Vimium、CrxMouseGestures)自定義快捷鍵觸發(fā)“新建郵件”按鈕;4.Windows用戶還可通過右鍵任務(wù)欄Outlook圖標(biāo)選擇“新建電

    See all articles