99久久精品免费看国产,国产99视频精品免视看7,国产av午夜精品一区二区入口

首頁

資料庫

mysql教程

Hbase入門6 -白話MySQL(RDBMS)與HBase之間

WBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWB

Jun 07, 2016 pm 04:26 PM

hbase mysql 入門

我的廢話1: 任何一項新技術(shù)并非救命稻草，一抹一擦立馬藥到病除的百寶箱，并非使用Spring或者NOSQL的產(chǎn)品就神乎其神+五光十色，如果那樣基本是扯淡。同類型產(chǎn)品中不管那種技術(shù)最終要達(dá)到的目的是一樣的，通過新的技術(shù)手段你往往可能避諱了當(dāng)前你所需要面對

我的廢話1:
?? 任何一項新技術(shù)并非救命稻草，一抹一擦立馬藥到病除的百寶箱，并非使用Spring或者NOSQL的產(chǎn)品就神乎其神+五光十色，如果那樣基本是扯淡。同類型產(chǎn)品中不管那種技術(shù)最終要達(dá)到的目的是一樣的，通過新的技術(shù)手段你往往可能避諱了當(dāng)前你所需要面對的問題，但過后新的問題又來了。也許回過頭來看看還不如在原來的基礎(chǔ)上多動動腦筋想想辦法做些改良可以得到更高的回報。??
?

?? 傳統(tǒng)數(shù)據(jù)庫是以數(shù)據(jù)塊來存儲數(shù)據(jù)，簡單來說，你的表字段越多，占用的數(shù)據(jù)空間就越多，那么查詢有可能就要跨數(shù)據(jù)塊，將會導(dǎo)致查詢的速度變慢。在大型系統(tǒng)中一張表上百個字段，并且表中的數(shù)據(jù)上億條這是完全是有可能的。因此會帶來數(shù)據(jù)庫查詢的瓶頸。我們都知道一個常識數(shù)據(jù)庫中表記錄的多少對查詢的性能有非常大的影響，此時你很有可能想到分表、分庫的做法來分載數(shù)據(jù)庫運(yùn)算的壓力，那么又會帶來新的問題，例如：分布式事務(wù)、全局唯一ID的生成、跨數(shù)據(jù)庫查詢等，依舊會讓你面對棘手的問題。如果打破這種按照行存儲的模式，采用一種基于列存儲的模式，對于大規(guī)模數(shù)據(jù)場景這樣情況有可能發(fā)生一些好轉(zhuǎn)。由于查詢中的選擇規(guī)則是通過列來定義的，因此整個數(shù)據(jù)庫是自動索引化的。按列存儲每個字段的數(shù)據(jù)聚集存儲，可以動態(tài)增加，并且列為空就不存儲數(shù)據(jù)，節(jié)省存儲空間。每個字段的數(shù)據(jù)按照聚集存儲，能大大減少讀取的數(shù)據(jù)量，查詢時指哪打哪，來的更直接。無需考慮分庫、分表 Hbase將對存儲的數(shù)據(jù)自動切分?jǐn)?shù)據(jù)，并支持高并發(fā)讀寫操作，使得海量數(shù)據(jù)存儲自動具有更強(qiáng)的擴(kuò)展性。

?? Java中的HashMap是Key/Value的結(jié)構(gòu)，你也可以把HBase的數(shù)據(jù)結(jié)構(gòu)看做是一個Key/Value的體系,話說HBase的區(qū)域由表名和行界定的。在HBase區(qū)域每一個"列族"都由一個名為HStore的對象管理。每個HStore由一個或多個MapFiles(Hadoop中的一個文件類型)組成。MapFiles的概念類似于Google的SSTable。在Hbase里面有以下兩個主要的概念，Row key 和 Column Family，其次是Cell qualifier和Timestamp tuple，Column family我們通常稱之為“列族”，訪問控制、磁盤和內(nèi)存的使用統(tǒng)計都是在列族層面進(jìn)行的。列族Column family是之前預(yù)先定義好的數(shù)據(jù)模型，每一個Column Family都可以根據(jù)“限定符”有多個column。在HBase每個cell存儲單元對同一份數(shù)據(jù)有多個版本，根據(jù)唯一的時間戳來區(qū)分每個版本之間的差異，最新的數(shù)據(jù)版本排在最前面。

口水：Hbase將table水平劃分成N個Region，region按column family劃分成Store，每個store包括內(nèi)存中的memstore和持久化到disk上的HFile。

上述可能我表達(dá)的還不夠到位，下面來看一個實踐中的場景，將原來是存放在MySQL中Blog中的數(shù)據(jù)遷移到HBase中的過程：
MySQL中現(xiàn)有的表結(jié)構(gòu)：

遷移HBase中的表結(jié)構(gòu)：

原來系統(tǒng)中有2張表blogtable和comment表，采用HBase后只有一張blogtable表，如果按照傳統(tǒng)的RDBMS的話，blogtable表中的列是固定的，比如schema 定義了Author,Title,URL,text等屬性，上線后表字段是不能動態(tài)增加的。但是如果采用列存儲系統(tǒng)，比如Hbase，那么我們可以定義blogtable表，然后定義info 列族，User的數(shù)據(jù)可以分為：info:title? ,info:author ,info:url 等，如果后來你又想增加另外的屬性，這樣很方便只需要 info:xxx 就可以了。
對于Row key你可以理解row key為傳統(tǒng)RDBMS中的某一個行的主鍵，Hbase是不支持條件查詢以及Order by等查詢，因此Row key的設(shè)計就要根據(jù)你系統(tǒng)的查詢需求來設(shè)計了額。 Hbase中的記錄是按照rowkey來排序的，這樣就使得查詢變得非?？?。

具體操作過程如下：
============================創(chuàng)建blogtable表=========================
create 'blogtable', 'info','text','comment_title','comment_author','comment_text'
?
============================插入概要信息=========================
put 'blogtable', '1', 'info:title', 'this is doc title'
put 'blogtable', '1', 'info:author', 'javabloger'
put 'blogtable', '1', 'info:url', 'http://www.javabloger.com/index.php'

put 'blogtable', '2', 'info:title', 'this is doc title2'
put 'blogtable', '2', 'info:author', 'H.E.'
put 'blogtable', '2', 'info:url', 'http://www.javabloger.com/index.html'

============================插入正文信息=========================
put 'blogtable', '1', 'text:', 'what is this doc context ?'
put 'blogtable', '2', 'text:', 'what is this doc context2?'

==========================插入評論信息===============================
put 'blogtable', '1', 'comment_title:', 'this is doc comment_title '
put 'blogtable', '1', 'comment_author:', 'javabloger'
put 'blogtable', '1', 'comment_text:', 'this is nice doc'

put 'blogtable', '2', 'comment_title:', 'this is blog comment_title '
put 'blogtable', '2', 'comment_author:', 'H.E.'
put 'blogtable', '2', 'comment_text:', 'this is nice blog'

HBase的數(shù)據(jù)查詢\讀取，可以通過單個row key訪問，row key的range和全表掃描,大致如下：
注意：HBase不能支持where條件、Order by 查詢，只支持按照Row key來查詢，但是可以通過HBase提供的API進(jìn)行條件過濾。
例如：http://hbase.apache.org/apidocs/org/apache/hadoop/hbase/filter/ColumnPrefixFilter.html

scan 'blogtable' ,{COLUMNS => ['text:','info:title'] }? —> 列出文章的內(nèi)容和標(biāo)題

scan 'blogtable' , {COLUMNS => 'info:url' , STARTROW => '2'}??? —> 根據(jù)范圍列出文章的內(nèi)容和標(biāo)題

get 'blogtable','1'??? —> 列出文章id 等于1的數(shù)據(jù)

get 'blogtable','1', {COLUMN => 'info'}??? —> 列出文章id 等于1 的 info 的頭(Head)內(nèi)容

get 'blogtable','1', {COLUMN => 'text'}?? —> 列出文章id 等于1 的 text? 的具體(Body)內(nèi)容

get 'blogtable','1', {COLUMN => ['text','info:author']}? —> 列出文章id 等于1 的內(nèi)容和作者(Body/Author)內(nèi)容

我的廢話2:
?? 有人會問Java Web服務(wù)器中是Tomcat快還是GlassFish快？小型數(shù)據(jù)庫中是MySQL效率高還是MS-SQL效率高？我看是關(guān)鍵用在什么場景和怎么使用這個產(chǎn)品(技術(shù))，所以我漸漸的認(rèn)為是需要對產(chǎn)品、技術(shù)本身深入的了解，而并非一項新的技術(shù)就是絕佳的選擇。試問：Tomcat的默認(rèn)的運(yùn)行參數(shù)能和我們線上正在使用的GlassFish性能相提并論嗎？我不相信GlassFishv2和GlassFishv3在默認(rèn)的配置參數(shù)下有顯著的差別。我們需要對產(chǎn) 品本身做到深入的了解才能發(fā)揮他最高的性能，而并非感觀聽從廠家的廣告和自己的感性認(rèn)識迷信哪個產(chǎn)品的優(yōu)越性。

我的廢話3:
? 對于NOSQL這樣的新技術(shù)，的的確確是可以解決過去我們所需要面對的問題，但也并非適合每個應(yīng)用場景，所以在使用新產(chǎn)品的同時需要切合當(dāng)前的產(chǎn)品需要，是需求在引導(dǎo)新技術(shù)的投入，而并非為了趕時髦去使用他。你的產(chǎn)品是否過硬不是你使用了什么新技術(shù)，用戶關(guān)心的是速度和穩(wěn)定性，不會關(guān)心你是否使用了 NOSQL。相反Google有著超大的數(shù)據(jù)量，能給全世界用戶帶來了驚人的速度和準(zhǔn)確性，大家才會回過頭來好奇Google到底是怎么做到的。所以根據(jù) 自己的需要千萬別太勉強(qiáng)自己使用了某項新技術(shù)。

我的廢話4:
? 總之一句話，用什么不是最關(guān)鍵，最關(guān)鍵是怎么去使用！

?
相關(guān)文章:
Lily-建立在HBase上的分布式搜索
MySQL向Hive/HBase的遷移工具
HBase入門5(集群) -壓力分載與失效轉(zhuǎn)發(fā)
Hive入門3–Hive與HBase的整合
HBase入門篇4
HBase入門篇3
HBase入門篇2-Java操作HBase例子
HBase入門篇
基于Hbase存儲的分布式消息(IM)系統(tǒng)-JABase

–end–

原文地址：Hbase入門6 -白話MySQL(RDBMS)與HBase之間, 感謝原作者分享。

本網(wǎng)站聲明

本文內(nèi)容由網(wǎng)友自願投稿，版權(quán)歸原作者所有。本站不承擔(dān)相應(yīng)的法律責(zé)任。如發(fā)現(xiàn)涉嫌抄襲或侵權(quán)的內(nèi)容，請聯(lián)絡(luò)admin@php.cn

熱AI工具

Undress AI Tool

免費(fèi)脫衣圖片

Undresser.AI Undress

人工智慧驅(qū)動的應(yīng)用程序，用於創(chuàng)建逼真的裸體照片

AI Clothes Remover

用於從照片中去除衣服的線上人工智慧工具。

Clothoff.io

AI脫衣器

Video Face Swap

使用我們完全免費(fèi)的人工智慧換臉工具，輕鬆在任何影片中換臉！

熱工具

記事本++7.3.1

好用且免費(fèi)的程式碼編輯器

SublimeText3漢化版

中文版，非常好用

禪工作室 13.0.1

強(qiáng)大的PHP整合開發(fā)環(huán)境

Dreamweaver CS6

視覺化網(wǎng)頁開發(fā)工具

SublimeText3 Mac版

神級程式碼編輯軟體(SublimeText3)

熱門話題

Laravel 教程

1600

PHP教程

1501

276

Related knowledge

如何用PHP開發(fā)問答社區(qū)平臺 PHP互動社區(qū)變現(xiàn)模式詳解 Jul 23, 2025 pm 07:21 PM

1.PHP開發(fā)問答社區(qū)首選Laravel MySQL Vue/React組合，因生態(tài)成熟、開發(fā)效率高；2.高性能需依賴緩存（Redis）、數(shù)據(jù)庫優(yōu)化、CDN和異步隊列；3.安全性必須做好輸入過濾、CSRF防護(hù)、HTTPS、密碼加密及權(quán)限控制；4.變現(xiàn)可選廣告、會員訂閱、打賞、傭金、知識付費(fèi)等模式，核心是匹配社區(qū)調(diào)性和用戶需求。

如何在PHP環(huán)境中設(shè)置環(huán)境變量 PHP運(yùn)行環(huán)境變量添加說明 Jul 25, 2025 pm 08:33 PM

PHP設(shè)置環(huán)境變量主要有三種方式：1.通過php.ini全局配置；2.通過Web服務(wù)器（如Apache的SetEnv或Nginx的fastcgi_param）傳遞；3.在PHP腳本中使用putenv()函數(shù)。其中，php.ini適用於全局且不常變的配置，Web服務(wù)器配置適用於需要隔離的場景，putenv()適用於臨時性的變量。持久化策略包括配置文件（如php.ini或Web服務(wù)器配置）、.env文件配合dotenv庫加載、CI/CD流程中動態(tài)注入變量。安全管理敏感信息應(yīng)避免硬編碼，推薦使用.en

將MySQL部署自動化為代碼 Jul 20, 2025 am 01:49 AM

要實現(xiàn)MySQL部署自動化，關(guān)鍵在於選用Terraform定義資源、Ansible管理配置、Git進(jìn)行版本控制，並強(qiáng)化安全與權(quán)限管理。 1.使用Terraform定義MySQL實例，如AWSRDS的版本、類型、訪問控制等資源屬性；2.通過AnsiblePlaybook實現(xiàn)數(shù)據(jù)庫用戶創(chuàng)建、權(quán)限設(shè)置等細(xì)節(jié)配置；3.所有配置文件納入Git管理，支持變更追蹤與協(xié)作開發(fā)；4.避免硬編碼敏感信息，使用Vault或AnsibleVault管理密碼，並設(shè)置訪問控制與最小權(quán)限原則。

使用SSL/TLS加密保護(hù)MySQL連接 Jul 21, 2025 am 02:08 AM

為什麼需要SSL/TLS加密MySQL連接？因為不加密的連接可能導(dǎo)致敏感數(shù)據(jù)被截取，啟用SSL/TLS可防止中間人攻擊並滿足合規(guī)要求；2.如何為MySQL配置SSL/TLS？需生成證書和私鑰，修改配置文件指定ssl-ca、ssl-cert和ssl-key路徑並重啟服務(wù)；3.客戶端連接時如何強(qiáng)制使用SSL？通過創(chuàng)建用戶時指定REQUIRESSL或REQUIREX509實現(xiàn)；4.SSL配置容易忽略的細(xì)節(jié)包括證書路徑權(quán)限、證書過期問題以及客戶端配置需求。

如何用PHP開發(fā)商品推薦模塊 PHP推薦算法與用戶行為分析 Jul 23, 2025 pm 07:00 PM

收集用戶行為數(shù)據(jù)需通過PHP記錄瀏覽、搜索、購買等信息至數(shù)據(jù)庫，並清洗分析以挖掘興趣偏好；2.推薦算法選擇應(yīng)根據(jù)數(shù)據(jù)特徵決定：基於內(nèi)容、協(xié)同過濾、規(guī)則或混合推薦；3.協(xié)同過濾在PHP中可實現(xiàn)為計算用戶餘弦相似度、選K近鄰、加權(quán)預(yù)測評分並推薦高分商品；4.性能評估用準(zhǔn)確率、召回率、F1值及CTR、轉(zhuǎn)化率並通過A/B測試驗證效果；5.冷啟動問題可通過商品屬性、用戶註冊信息、熱門推薦和專家評價緩解；6.性能優(yōu)化手段包括緩存推薦結(jié)果、異步處理、分佈式計算與SQL查詢優(yōu)化，從而提升推薦效率與用戶體驗。

如何用PHP開發(fā)AI智能表單系統(tǒng) PHP智能表單設(shè)計與分析 Jul 25, 2025 pm 05:54 PM

選擇合適的PHP框架需根據(jù)項目需求綜合考慮：Laravel適合快速開發(fā)，提供EloquentORM和Blade模板引擎，便於數(shù)據(jù)庫操作和動態(tài)表單渲染；Symfony更靈活，適合複雜系統(tǒng)；CodeIgniter輕量，適用於對性能要求較高的簡單應(yīng)用。 2.確保AI模型準(zhǔn)確性需從高質(zhì)量數(shù)據(jù)訓(xùn)練、合理選擇評估指標(biāo)（如準(zhǔn)確率、召回率、F1值）、定期性能評估與模型調(diào)優(yōu)入手，並通過單元測試和集成測試保障代碼質(zhì)量，同時持續(xù)監(jiān)控輸入數(shù)據(jù)以防止數(shù)據(jù)漂移。 3.保護(hù)用戶隱私需採取多項措施：對敏感數(shù)據(jù)進(jìn)行加密存儲（如AES

如何用PHP搭建在線客服機(jī)器人 PHP智能客服實現(xiàn)技術(shù) Jul 25, 2025 pm 06:57 PM

PHP在智能客服中扮演連接器和大腦中樞角色，負(fù)責(zé)串聯(lián)前端輸入、數(shù)據(jù)庫存儲與外部AI服務(wù)；2.實現(xiàn)時需構(gòu)建多層架構(gòu)：前端接收用戶消息，PHP後端預(yù)處理並路由請求，先匹配本地知識庫，未命中則調(diào)用外部AI服務(wù)如OpenAI或Dialogflow獲取智能回復(fù)；3.會話管理由PHP寫入MySQL等數(shù)據(jù)庫，保障上下文連續(xù)性；4.集成AI服務(wù)需用Guzzle發(fā)送HTTP請求，安全存儲APIKey，做好錯誤處理與響應(yīng)解析；5.數(shù)據(jù)庫設(shè)計需包含會話、消息、知識庫、用戶表，合理建索引、保障安全與性能，支撐機(jī)器人記憶

如何讓PHP容器支持自動構(gòu)建 PHP環(huán)境持續(xù)集成CI配置方式 Jul 25, 2025 pm 08:54 PM

要讓PHP容器支持自動構(gòu)建，核心在於配置持續(xù)集成（CI）流程。 1.使用Dockerfile定義PHP環(huán)境，包括基礎(chǔ)鏡像、擴(kuò)展安裝、依賴管理和權(quán)限設(shè)置；2.配置GitLabCI等CI/CD工具，通過.gitlab-ci.yml文件定義build、test和deploy階段，實現(xiàn)自動構(gòu)建、測試和部署；3.集成PHPUnit等測試框架，確保代碼變更後自動運(yùn)行測試；4.使用Kubernetes等自動化部署策略，通過deployment.yaml文件定義部署配置；5.優(yōu)化Dockerfile，採用多階段構(gòu)

See all articles

国产av日韩一区二区三区精品,成人性爱视频在线观看,国产,欧美,日韩,一区,www.成色av久久成人,2222eeee成人天堂

Hbase入門6 -白話MySQL(RDBMS)與HBase之間

熱AI工具

Undress AI Tool

Undresser.AI Undress

AI Clothes Remover

Clothoff.io

Video Face Swap

熱門文章

熱工具

記事本++7.3.1

SublimeText3漢化版

禪工作室 13.0.1

Dreamweaver CS6

SublimeText3 Mac版

熱門話題