国产av日韩一区二区三区精品,成人性爱视频在线观看,国产,欧美,日韩,一区,www.成色av久久成人,2222eeee成人天堂

Table des matières
Arithmétique modulaire et optimisations NTT (DFT à champs finis)
énoncé du problème
Solution optimisée
Exemple d'implémentation
Conseils supplémentaires
Maison développement back-end C++ Comment puis-je optimiser ma transformation théorique des nombres (NTT) et mon arithmétique modulaire pour un calcul plus rapide, en particulier avec de très grands nombres (par exemple, plus de 12 000 bits)??

Comment puis-je optimiser ma transformation théorique des nombres (NTT) et mon arithmétique modulaire pour un calcul plus rapide, en particulier avec de très grands nombres (par exemple, plus de 12 000 bits)??

Dec 16, 2024 am 03:13 AM

How can I optimize my Number Theoretic Transform (NTT) and modular arithmetic for faster computation, especially with very large numbers (e.g., over 12000 bits)?

Arithmétique modulaire et optimisations NTT (DFT à champs finis)

énoncé du problème


Je voulais utiliser NTT pour obtenir rapidement quadrature (voir Calcul rapide du carré bignum), mais le résultat est lent même pour de très grands nombres .. plus de 12000 bits.


Ma question est donc?:

< ;ol>

  • Y a-t-il un moyen d'optimiser ma transformation NTT ? Je ne voulais pas l'accélérer par parallélisme (threads)?; il s'agit uniquement d'une couche de bas niveau.

  • Existe-t-il un moyen d'accélérer mon calcul modulaire??


  • Voici mon code source (déjà optimisé) en C pour NTT (il est complet et fonctionne à 100% en C sans avoir besoin de bibliothèques tierces et doit également être thread-safe. Attention, le tableau source est utilisé comme temporaire !!!, il ne peut pas non plus transformer le tableau en lui-même).
    < /p>

    Solution optimisée

    1. Utilisation de puissances précalculées?: Précalcul et stocker les puissances de W et iW (la racine primitive de l'unité et son inverse) pour éviter de les recalculer pendant le processus NTT. Cela peut réduire considérablement le nombre de multiplications et de divisions, conduisant à des calculs plus rapides.
    2. Déroulage des boucles?: Déroulez les boucles dans l'algorithme NTT pour réduire la surcharge associée aux itérations de boucle. Cela peut améliorer les performances en réduisant le nombre d'instructions de branchement.
    3. Optimisation de l'arithmétique modulaire?: Utilisez les opérations au niveau des bits et le langage d'assemblage pour implémenter efficacement les opérations arithmétiques modulaires (addition, soustraction, multiplication et exponentiation). . Cela peut éliminer les branchements inutiles et les instructions conditionnelles, ce qui entra?ne une exécution plus rapide.

    Exemple d'implémentation

    Voici un exemple d'implémentation NTT optimisée en C utilisant des puissances précalculées et des opérations au niveau du bit?:

    class NTT {
    public:
        NTT() {
            // Initialize constants
            p = 0xc0000001;
            W = modpow(2, 0x30000000 / n);
            iW = modpow(2, p - 1 - 0x30000000 / n);
            rN = modpow(n, p - 2);
            NN = n >> 1;
    
            // Precompute W and iW powers
            WW = new uint32_t[n];
            iWW = new uint32_t[n];
            WW[0] = 1;
            iWW[0] = 1;
            for (uint32_t i = 1; i < n; i++) {
                WW[i] = modmul(WW[i - 1], W);
                iWW[i] = modmul(iWW[i - 1], iW);
            }
        }
    
        void NTT(uint32_t *dst, uint32_t *src, uint32_t n) {
            if (n > 0) {
                // Reorder even, odd elements
                for (uint32_t i = 0, j = 0; i < NN; i++, j += 2) {
                    dst[i] = src[j];
                }
                for (j = 1; i < n; i++, j += 2) {
                    dst[i] = src[j];
                }
    
                // Recursive NTT
                NTT(src, dst, NN);  // Even
                NTT(src + NN, dst + NN, NN);  // Odd
    
                // Restore results
                for (uint32_t i = 0, j = NN; i < NN; i++, j++) {
                    uint32_t a0 = src[i];
                    uint32_t a1 = modmul(src[j], WW[i]);
                    dst[i] = modadd(a0, a1);
                    dst[j] = modsub(a0, a1);
                }
            }
        }
    
    private:
        uint32_t p, n, NN, W, iW, rN;
        uint32_t *WW, *iWW;
    
        // Modular arithmetic operations
        inline uint32_t modadd(uint32_t a, uint32_t b) {
            uint32_t d = a + b;
            if (d >= p) d -= p;
            return d;
        }
    
        inline uint32_t modsub(uint32_t a, uint32_t b) {
            uint32_t d = a - b;
            if (d > a) d += p;
            return d;
        }
    
        inline uint32_t modmul(uint32_t a, uint32_t b) {
            uint32_t m = (uint64_t)a * b;
            return m - (p * (m / p));
        }
    
        inline uint32_t modpow(uint32_t a, uint32_t b) {
            if (b == 0) return 1;
            uint32_t t = modpow(a, b / 2);
            t = modmul(t, t);
            if (b &amp; 1) t = modmul(t, a);
            return t;
        }
    };

    Conseils supplémentaires

    • Utilisez un langage de niveau supérieur prenant en charge opérations au niveau du bit et assemblage en ligne, tels que C .
    • Utilisez un profileur pour identifier les goulots d'étranglement dans votre code et ciblez-les pour l'optimisation.
    • Envisagez de paralléliser l'algorithme NTT à l'aide de plusieurs threads ou d'instructions SIMD.

    Ce qui précède est le contenu détaillé de. pour plus d'informations, suivez d'autres articles connexes sur le site Web de PHP en chinois!

    Déclaration de ce site Web
    Le contenu de cet article est volontairement contribué par les internautes et les droits d'auteur appartiennent à l'auteur original. Ce site n'assume aucune responsabilité légale correspondante. Si vous trouvez un contenu suspecté de plagiat ou de contrefa?on, veuillez contacter admin@php.cn

    Outils d'IA chauds

    Undress AI Tool

    Undress AI Tool

    Images de déshabillage gratuites

    Undresser.AI Undress

    Undresser.AI Undress

    Application basée sur l'IA pour créer des photos de nu réalistes

    AI Clothes Remover

    AI Clothes Remover

    Outil d'IA en ligne pour supprimer les vêtements des photos.

    Clothoff.io

    Clothoff.io

    Dissolvant de vêtements AI

    Video Face Swap

    Video Face Swap

    échangez les visages dans n'importe quelle vidéo sans effort grace à notre outil d'échange de visage AI entièrement gratuit?!

    Outils chauds

    Bloc-notes++7.3.1

    Bloc-notes++7.3.1

    éditeur de code facile à utiliser et gratuit

    SublimeText3 version chinoise

    SublimeText3 version chinoise

    Version chinoise, très simple à utiliser

    Envoyer Studio 13.0.1

    Envoyer Studio 13.0.1

    Puissant environnement de développement intégré PHP

    Dreamweaver CS6

    Dreamweaver CS6

    Outils de développement Web visuel

    SublimeText3 version Mac

    SublimeText3 version Mac

    Logiciel d'édition de code au niveau de Dieu (SublimeText3)

    Sujets chauds

    Tutoriel PHP
    1502
    276
    Utilisation de STD :: Chrono en C Utilisation de STD :: Chrono en C Jul 15, 2025 am 01:30 AM

    STD :: Chrono est utilisé en C pour traiter le temps, y compris l'obtention de l'heure actuelle, la mesure du temps d'exécution, le point de fonctionnement et la durée de l'opération et le temps d'analyse de formatage. 1. Utilisez STD :: Chrono :: System_clock :: Now () pour obtenir l'heure actuelle, qui peut être convertie en une cha?ne lisible, mais l'horloge système peut ne pas être monotone; 2. Utilisez STD :: Chrono :: standard_clock pour mesurer le temps d'exécution pour assurer la monotonie, et la convertir en millisecondes, secondes et autres unités via durée_cast; 3. Point de temps (temps_point) et durée (durée) peut être interopérable, mais l'attention doit être accordée à la compatibilité des unités et à l'époque de l'horloge (époque)

    Comment obtenir une trace de pile en C? Comment obtenir une trace de pile en C? Jul 07, 2025 am 01:41 AM

    Il existe principalement les méthodes suivantes pour obtenir des traces de pile dans C: 1. Utilisez des fonctions Backtrace et Backtrace_Symbols sur la plate-forme Linux. En incluant l'obtention de la pile d'appels et des informations sur le symbole d'impression, le paramètre -rdynamic doit être ajouté lors de la compilation; 2. Utilisez la fonction CaptureStackBackTrace sur la plate-forme Windows, et vous devez lier dbghelp.lib et vous fier au fichier PDB pour analyser le nom de la fonction; 3. Utilisez des bibliothèques tierces telles que Googlebreakpad ou boost.stackTrace pour multiplateforme et simplifier les opérations de capture de pile; 4. Dans la gestion des exceptions, combinez les méthodes ci-dessus pour produire automatiquement les informations de pile dans les blocs de capture

    Qu'est-ce qu'un type POD (Old Data) en C? Qu'est-ce qu'un type POD (Old Data) en C? Jul 12, 2025 am 02:15 AM

    En C, le type POD (PlainoldData) fait référence à un type avec une structure simple et compatible avec le traitement des données du langage C. Il doit remplir deux conditions: il a une sémantique de copie ordinaire, qui peut être copiée par MEMCPY; Il a une disposition standard et la structure de la mémoire est prévisible. Les exigences spécifiques incluent: tous les membres non statiques sont publics, pas de constructeurs ou de destructeurs définis par l'utilisateur, pas de fonctions virtuelles ou de classes de base, et tous les membres non statiques eux-mêmes sont des pods. Par exemple, structPoint {intx; Inty;} est pod. Ses utilisations incluent les E / S binaires, l'interopérabilité C, l'optimisation des performances, etc. Vous pouvez vérifier si le type est POD via STD :: IS_POD, mais il est recommandé d'utiliser STD :: IS_TRIVIA après C 11.

    Comment appeler Python de C? Comment appeler Python de C? Jul 08, 2025 am 12:40 AM

    Pour appeler le code Python en C, vous devez d'abord initialiser l'interprète, puis vous pouvez réaliser l'interaction en exécutant des cha?nes, des fichiers ou en appelant des fonctions spécifiques. 1. Initialisez l'interpréteur avec py_initialize () et fermez-le avec py_finalalize (); 2. Exécuter le code de cha?ne ou pyrun_simplefile avec pyrun_simplefile; 3. Importez des modules via pyimport_importmodule, obtenez la fonction via pyObject_getattrstring, construisez des paramètres de py_buildvalue, appelez la fonction et le retour de processus

    Qu'est-ce qu'un pointeur nul en C? Qu'est-ce qu'un pointeur nul en C? Jul 09, 2025 am 02:38 AM

    Anullpointerinc isasaspecialvalueINDICATINGSTATAPOInterDoOesNotPointToanyValidMemoryLocation, andisesesedTosafelyManageAndcheckpointersBeforedereencing.1.BeForec 11,0orlwasused, butnownullptrisprefort

    Comment passer une fonction de paramètre en C? Comment passer une fonction de paramètre en C? Jul 12, 2025 am 01:34 AM

    En C, il existe trois fa?ons principales de passer les fonctions comme paramètres: en utilisant des pointeurs de fonction, des expressions de fonction STD :: et de lambda et des génériques de modèle. 1. Les pointeurs de fonction sont la méthode la plus élémentaire, adaptée à des scénarios simples ou à une interface C compatible, mais une mauvaise lisibilité; 2. STD :: Fonction combinée avec les expressions de lambda est une méthode recommandée dans le C moderne, soutenant une variété d'objets appelées et étant de type type; 3. Template Les méthodes génériques sont les plus flexibles, adaptées au code de la bibliothèque ou à la logique générale, mais peuvent augmenter le temps de compilation et le volume de code. Les lambdas qui capturent le contexte doivent être passés à travers la fonction STD :: ou le modèle et ne peuvent pas être convertis directement en pointeurs de fonction.

    Comment STD :: Move fonctionne-t-il en C? Comment STD :: Move fonctionne-t-il en C? Jul 07, 2025 am 01:27 AM

    STD :: Move ne déplace rien, il convertit simplement l'objet en référence RValue, indiquant au compilateur que l'objet peut être utilisé pour une opération de déplacement. Par exemple, lorsque l'attribution de cha?ne, si la classe prend en charge la sémantique en mouvement, l'objet cible peut prendre en charge la ressource d'objet source sans copier. Doit être utilisé dans des scénarios où les ressources doivent être transférées et sensibles aux performances, comme le retour des objets locaux, l'insertion de conteneurs ou l'échange de propriété. Cependant, il ne doit pas être abusé, car il dégénérera en une copie sans structure mobile, et le statut d'objet d'origine n'est pas spécifié après le mouvement. Utilisation appropriée lors du passage ou du retour d'un objet peut éviter des copies inutiles, mais si la fonction renvoie une variable locale, l'optimisation RVO peut déjà se produire, l'ajout de std :: Move peut affecter l'optimisation. Les erreurs sujets aux erreurs incluent une mauvaise utilisation sur les objets qui doivent encore être utilisés, les mouvements inutiles et les types non movables

    Qu'est-ce qu'une classe abstraite en C? Qu'est-ce qu'une classe abstraite en C? Jul 11, 2025 am 12:29 AM

    La clé d'une classe abstraite est qu'elle contient au moins une fonction virtuelle pure. Lorsqu'une fonction virtuelle pure est déclarée dans la classe (comme VirtualVoidDoSomething () = 0;), la classe devient une classe abstraite et ne peut pas instancier directement l'objet, mais le polymorphisme peut être réalisé par des pointeurs ou des références; Si la classe dérivée n'implémente pas toutes les fonctions virtuelles pures, elle restera également une classe abstraite. Les classes abstraites sont souvent utilisées pour définir des interfaces ou des comportements partagés, tels que la conception de classes de forme dans des applications de dessin et la mise en ?uvre de la méthode Draw () par des classes dérivées telles que le cercle et le rectangle. Les scénarios utilisant des classes abstraits comprennent: la conception de classes de base qui ne devraient pas être instanciées directement, for?ant plusieurs classes connexes à suivre une interface unifiée, en fournissant un comportement par défaut et en nécessitant des sous-classes pour compléter les détails. De plus, C

    See all articles