国产av日韩一区二区三区精品,成人性爱视频在线观看,国产,欧美,日韩,一区,www.成色av久久成人,2222eeee成人天堂

目錄
提高 IP 地址解析速度
用于快速 IPv4 解析的矢量化解決方案
洗牌桌預(yù)計(jì)算
性能基準(zhǔn)
首頁 后端開發(fā) C++ 如何使用矢量化解決方案提高IP地址解析速度?

如何使用矢量化解決方案提高IP地址解析速度?

Nov 15, 2024 am 04:24 AM

How to improve IP address parsing speed using vectorized solutions?

提高 IP 地址解析速度

您當(dāng)前解析 IPv4 地址的代碼相當(dāng)高效,但可以進(jìn)一步優(yōu)化以獲得更快的速度。一種方法是利用專門為此任務(wù)設(shè)計(jì)的矢量化解決方案。

用于快速 IPv4 解析的矢量化解決方案

對于支持 SSE4.1 或 SSSE3 指令的 x86 處理器,這里有一個(gè)可顯著提高性能的矢量化解決方案:

__m128i shuffleTable[65536];    //can be reduced 256x times, see @IwillnotexistIdonotexist

UINT32 MyGetIP(const char *str) {
    __m128i input = _mm_lddqu_si128((const __m128i*)str);   //"192.167.1.3"
    input = _mm_sub_epi8(input, _mm_set1_epi8('0'));        //1 9 2 254 1 6 7 254 1 254 3 208 245 0 8 40 
    __m128i cmp = input;                                    //...X...X.X.XX...  (signs)
    UINT32 mask = _mm_movemask_epi8(cmp);                   //6792 - magic index
    __m128i shuf = shuffleTable[mask];                      //10 -1 -1 -1 8 -1 -1 -1 6 5 4 -1 2 1 0 -1 
    __m128i arr = _mm_shuffle_epi8(input, shuf);            //3 0 0 0 | 1 0 0 0 | 7 6 1 0 | 2 9 1 0 
    __m128i coeffs = _mm_set_epi8(0, 100, 10, 1, 0, 100, 10, 1, 0, 100, 10, 1, 0, 100, 10, 1);
    __m128i prod = _mm_maddubs_epi16(coeffs, arr);          //3 0 | 1 0 | 67 100 | 92 100 
    prod = _mm_hadd_epi16(prod, prod);                      //3 | 1 | 167 | 192 | ? | ? | ? | ?
    __m128i imm = _mm_set_epi8(-1, -1, -1, -1, -1, -1, -1, -1, -1, -1, -1, -1, 6, 4, 2, 0);
    prod = _mm_shuffle_epi8(prod, imm);                     //3 1 167 192 0 0 0 0 0 0 0 0 0 0 0 0
    return _mm_extract_epi32(prod, 0);
//  return (UINT32(_mm_extract_epi16(prod, 1)) << 16) + UINT32(_mm_extract_epi16(prod, 0)); //no SSE 4.1
}

洗牌桌預(yù)計(jì)算

為了有效地利用這個(gè)矢量化解決方案,需要一個(gè)預(yù)先計(jì)算的洗牌表shuffleTable,可以按如下方式生成:

void MyInit() {
    memset(shuffleTable, -1, sizeof(shuffleTable));
    int len[4];
    for (len[0] = 1; len[0] <= 3; len[0]++)
        for (len[1] = 1; len[1] <= 3; len[1]++)
            for (len[2] = 1; len[2] <= 3; len[2]++)
                for (len[3] = 1; len[3] <= 3; len[3]++) {
                    int slen = len[0] + len[1] + len[2] + len[3] + 4;
                    int rem = 16 - slen;
                    for (int rmask = 0; rmask < 1<<rem; rmask++) {
//                    { int rmask = (1<<rem)-1;    //note: only maximal rmask is possible if strings are zero-padded
                        int mask = 0;
                        char shuf[16] = {-1, -1, -1, -1, -1, -1, -1, -1, -1, -1, -1, -1, -1, -1, -1, -1};
                        int pos = 0;
                        for (int i = 0; i < 4; i++) {
                            for (int j = 0; j < len[i]; j++) {
                                shuf[(3-i) * 4 + (len[i]-1-j)] = pos;
                                pos++;
                            }
                            mask ^= (1<<pos);
                            pos++;
                        }
                        mask ^= (rmask<<slen);
                        _mm_store_si128(&amp;shuffleTable[mask], _mm_loadu_si128((__m128i*)shuf));
                    }
                }
}

性能基準(zhǔn)

在 Ivy Bridge 處理器上,矢量化解決方案展示了令人印象深刻的性能,每秒處理 3.36 億個(gè)地址。這比原始問題中提供的代碼大約快 7.8 倍。

以上是如何使用矢量化解決方案提高IP地址解析速度?的詳細(xì)內(nèi)容。更多信息請關(guān)注PHP中文網(wǎng)其他相關(guān)文章!

本站聲明
本文內(nèi)容由網(wǎng)友自發(fā)貢獻(xiàn),版權(quán)歸原作者所有,本站不承擔(dān)相應(yīng)法律責(zé)任。如您發(fā)現(xiàn)有涉嫌抄襲侵權(quán)的內(nèi)容,請聯(lián)系admin@php.cn

熱AI工具

Undress AI Tool

Undress AI Tool

免費(fèi)脫衣服圖片

Undresser.AI Undress

Undresser.AI Undress

人工智能驅(qū)動(dòng)的應(yīng)用程序,用于創(chuàng)建逼真的裸體照片

AI Clothes Remover

AI Clothes Remover

用于從照片中去除衣服的在線人工智能工具。

Clothoff.io

Clothoff.io

AI脫衣機(jī)

Video Face Swap

Video Face Swap

使用我們完全免費(fèi)的人工智能換臉工具輕松在任何視頻中換臉!

熱工具

記事本++7.3.1

記事本++7.3.1

好用且免費(fèi)的代碼編輯器

SublimeText3漢化版

SublimeText3漢化版

中文版,非常好用

禪工作室 13.0.1

禪工作室 13.0.1

功能強(qiáng)大的PHP集成開發(fā)環(huán)境

Dreamweaver CS6

Dreamweaver CS6

視覺化網(wǎng)頁開發(fā)工具

SublimeText3 Mac版

SublimeText3 Mac版

神級代碼編輯軟件(SublimeText3)

c認(rèn)識python的人的教程 c認(rèn)識python的人的教程 Jul 01, 2025 am 01:11 AM

學(xué)Python的人轉(zhuǎn)學(xué)C 最直接的困惑是:為什么不能像Python那樣寫?因?yàn)镃 雖然語法更復(fù)雜,但提供了底層控制能力和性能優(yōu)勢。1.語法結(jié)構(gòu)上,C 使用花括號{}而非縮進(jìn)組織代碼塊,且變量類型必須顯式聲明;2.類型系統(tǒng)與內(nèi)存管理方面,C 沒有自動(dòng)垃圾回收機(jī)制,需手動(dòng)管理內(nèi)存并注意釋放資源,使用RAII技術(shù)可輔助資源管理;3.函數(shù)與類定義中,C 需要明確訪問修飾符、構(gòu)造函數(shù)和析構(gòu)函數(shù),并支持如運(yùn)算符重載等高級功能;4.標(biāo)準(zhǔn)庫方面,STL提供了強(qiáng)大的容器和算法,但需要適應(yīng)泛型編程思想;5

C驅(qū)動(dòng)器:實(shí)用的代碼示例 C驅(qū)動(dòng)器:實(shí)用的代碼示例 Jun 22, 2025 am 12:16 AM

c destructorSarespecialememberfunctionsthatautapityReleSoursoursoursoursoursoursoursOutgoesOutofScopeOrisdelet.1)shemarecrucialformanagingmemory,filehandles,andNetworkConnections.2)初學(xué)者

C中的標(biāo)準(zhǔn)模板庫(STL)是什么? C中的標(biāo)準(zhǔn)模板庫(STL)是什么? Jul 01, 2025 am 01:17 AM

C STL是一組通用模板類和函數(shù),包含容器、算法、迭代器等核心組件。容器如vector、list、map、set用于存儲(chǔ)數(shù)據(jù),vector支持隨機(jī)訪問,適合頻繁讀?。籰ist插入刪除高效但訪問慢;map和set基于紅黑樹,自動(dòng)排序適用于快速查找。算法如sort、find、copy、transform、accumulate封裝常用操作,作用于容器的迭代器范圍。迭代器作為連接容器與算法的橋梁,支持遍歷和訪問元素。其他組件包括函數(shù)對象、適配器、分配器,用于定制邏輯、改變行為及內(nèi)存管理。STL簡化了C

c帶有OpenGL的圖形編程教程 c帶有OpenGL的圖形編程教程 Jul 02, 2025 am 12:07 AM

作為C 程序員入門圖形編程,OpenGL是一個(gè)好的選擇。首先需搭建開發(fā)環(huán)境,使用GLFW或SDL創(chuàng)建窗口,配合GLEW或glad加載函數(shù)指針,并正確設(shè)置上下文版本如3.3 。其次理解OpenGL的狀態(tài)機(jī)模型,掌握繪制核心流程:創(chuàng)建編譯著色器、鏈接程序、上傳頂點(diǎn)數(shù)據(jù)(VBO)、配置屬性指針(VAO)并調(diào)用繪制函數(shù)。此外要熟悉調(diào)試技巧,檢查著色器編譯與程序鏈接狀態(tài),啟用頂點(diǎn)屬性數(shù)組,設(shè)置清屏顏色等。推薦學(xué)習(xí)資源包括LearnOpenGL、OpenGLRedBook及YouTube教程系列。掌握上述

c標(biāo)準(zhǔn)模板庫(STL)的教程 c標(biāo)準(zhǔn)模板庫(STL)的教程 Jul 02, 2025 am 01:26 AM

STL(標(biāo)準(zhǔn)模板庫)是C 標(biāo)準(zhǔn)庫的重要組成部分,包含容器、迭代器和算法三大核心組件。1.容器如vector、map、set用于存儲(chǔ)數(shù)據(jù);2.迭代器用于訪問容器元素;3.算法如sort、find用于操作數(shù)據(jù)。選擇容器時(shí),vector適合動(dòng)態(tài)數(shù)組,list適合頻繁插入刪除,deque支持雙端快速操作,map/unordered_map用于鍵值對查找,set/unordered_set用于去重。使用算法時(shí)應(yīng)包含頭文件,并配合迭代器和lambda表達(dá)式。注意避免失效迭代器、刪除時(shí)更新迭代器、不可修改m

C競爭性編程教程 C競爭性編程教程 Jul 02, 2025 am 12:54 AM

學(xué)C 沖著打比賽應(yīng)從以下幾點(diǎn)入手:1.熟練基礎(chǔ)語法但不必深入,掌握變量定義、循環(huán)、條件判斷、函數(shù)等基本內(nèi)容;2.重點(diǎn)掌握STL容器如vector、map、set、queue、stack的使用;3.學(xué)會(huì)快速輸入輸出技巧,如關(guān)閉同步流或使用scanf和printf;4.利用模板與宏簡化代碼書寫,提高效率;5.多刷題熟悉邊界條件、初始化錯(cuò)誤等常見細(xì)節(jié)問題。

如何在C中使用CIN和COUT進(jìn)行輸入/輸出? 如何在C中使用CIN和COUT進(jìn)行輸入/輸出? Jul 02, 2025 am 01:10 AM

在C 中,cin和cout用于控制臺輸入輸出。1.使用cout讀取輸入,注意類型匹配問題,遇到空格停止;3.讀取含空格字符串時(shí)用getline(cin,str);4.混合使用cin和getline時(shí)需清理緩沖區(qū)殘留字符;5.輸入錯(cuò)誤時(shí)需調(diào)用cin.clear()和cin.ignore()處理異常狀態(tài)。掌握這些要點(diǎn)可編寫穩(wěn)定的控制臺程序。

在C中使用std :: Chrono 在C中使用std :: Chrono Jul 15, 2025 am 01:30 AM

std::chrono在C 中用于處理時(shí)間,包括獲取當(dāng)前時(shí)間、測量執(zhí)行時(shí)間、操作時(shí)間點(diǎn)與持續(xù)時(shí)間及格式化解析時(shí)間。1.獲取當(dāng)前時(shí)間使用std::chrono::system_clock::now(),可轉(zhuǎn)換為可讀字符串但系統(tǒng)時(shí)鐘可能不單調(diào);2.測量執(zhí)行時(shí)間應(yīng)使用std::chrono::steady_clock以確保單調(diào)性,并通過duration_cast轉(zhuǎn)換為毫秒、秒等單位;3.時(shí)間點(diǎn)(time_point)和持續(xù)時(shí)間(duration)可相互操作,但需注意單位兼容性和時(shí)鐘紀(jì)元(epoch)

See all articles