japanesetube日本护士高潮,放荡的少妇2欧美版

Maison

développement back-end

Tutoriel Python

YOLOv Une nouvelle avancée dans l'analyse de la mise en page des documents

Barbara Streisand

Oct 30, 2024 pm 11:19 PM

Introduction

Comme mentionné dans le billet de blog précédent, YOLOv8 fonctionne exceptionnellement bien dans l'analyse de la mise en page des documents. J'ai formé tous les modèles de la série YOLOv8 par l'ensemble de données DocLayNet et j'ai découvert que même le plus petit modèle atteint un mAP50-95 global de 71,8, tandis que le plus grand modèle atteint un impressionnant 78,7.

Récemment, Ultralytics a publié YOLOv11, la dernière itération de sa série YOLO de détecteurs d'objets en temps réel. Cette nouvelle version apporte des améliorations significatives tant au niveau de l'architecture que des méthodes de formation.

YOLOv A New Breakthrough in Document Layout Analysis

? Les résultats semblent prometteurs ! J'ai décidé de former à nouveau tous les modèles YOLOv11 sur l'ensemble de données DocLayNet et de les comparer avec la série YOLOv8 précédente.

Méthode de formation

Pour cette expérience, j'ai continué à utiliser mon référentiel https://github.com/ppaanngggg/yolo-doclaynet pour préparer les données et entra?ner les modèles à l'aide de mes scripts personnalisés. Cette approche garantit la cohérence dans le processus de préparation des données et de formation, permettant une comparaison équitable entre les modèles YOLOv8 et YOLOv11.

Le processus de formation et d'évaluation des modèles YOLOv11 est simple et peut être exécuté avec de simples instructions de ligne de commande?:

# To train the model
python train.py {base-model}

# To evaluate the model
python eval.py {path-to-your-trained-model}

Comparaison des résultats

Voici le tableau d'évaluation détaillé comparant les modèles YOLOv8 avec YOLOv11?:

label	boxes	yolov8n	yolov11n	yolov8s	yolov11s	yolov8m	yolov11m	yolov8l	yolov11l	yolov8x	yolov11x
Params (M)		3.2	2.6	11.2	9.4	25.9	20.1	43.7	25.3	68.2	56.9
Caption	1542	0.682	0.717	0.721	0.744	0.746	0.746	0.75	0.772	0.753	0.765
Footnote	387	0.614	0.634	0.669	0.683	0.696	0.701	0.702	0.715	0.717	0.71
Formula	1966	0.655	0.673	0.695	0.705	0.723	0.729	0.75	0.75	0.747	0.765
List-item	10521	0.789	0.81	0.818	0.836	0.836	0.843	0.841	0.847	0.841	0.845
Page-footer	3987	0.588	0.591	0.61	0.621	0.64	0.653	0.641	0.678	0.655	0.684
Page-header	3365	0.707	0.704	0.754	0.76	0.769	0.778	0.776	0.788	0.784	0.795
Picture	3497	0.723	0.758	0.762	0.783	0.789	0.8	0.796	0.805	0.805	0.802
Section-header	8544	0.709	0.713	0.727	0.745	0.742	0.753	0.75	0.75	0.748	0.751
Table	2394	0.82	0.846	0.854	0.874	0.88	0.88	0.885	0.891	0.886	0.89
Text	29917	0.845	0.851	0.86	0.869	0.876	0.878	0.878	0.88	0.877	0.883
Title	334	0.762	0.793	0.806	0.817	0.83	0.832	0.846	0.844	0.84	0.848
All	66454	0.718	0.735	0.752	0.767	0.775	0.781	0.783	0.793	0.787	0.794

J'ai également créé un graphique pour illustrer la relation entre la taille du modèle et le score pour ces deux séries?:

YOLOv A New Breakthrough in Document Layout Analysis

Conclusion

Sur la base du tableau et du graphique ci-dessus, nous pouvons conclure

Sur la base du tableau et du graphique ci-dessus, nous pouvons conclure que les modèles YOLOv11 surpassent systématiquement leurs homologues YOLOv8 dans toutes les tailles. Les améliorations sont particulièrement visibles dans les modèles plus petits, YOLOv11n atteignant une augmentation de 1,7 % du mAP50-95 par rapport à YOLOv8n. De plus, les modèles YOLOv11 ont généralement moins de paramètres que leurs équivalents YOLOv8, ce qui indique une efficacité améliorée en plus de meilleures performances.

Mon modèle préféré est YOLOv11l. Il a à peu près la même taille que YOLOv8m, mais il surpasse même YOLOv8x?!

Cependant, YOLOv11x ne montre qu'une légère amélioration par rapport à YOLOv11l malgré une taille de modèle deux fois supérieure.

Plus

Que pensez-vous des résultats de YOLOv11?? Avez-vous déjà utilisé les modèles YOLO pour l'analyse de la mise en page de documents?? J'aimerais entendre vos idées et vos expériences dans les commentaires ci-dessous?!

Références

Documentation YOLOv11?: https://docs.ultralytics.com/models/yolo11/
Dép?t DocLayNet GitHub?: https://github.com/DS4SD/DocLayNet
Mon projet YOLO-DocLayNet GitHub?: https://github.com/ppaanngggg/yolo-doclaynet

Ce qui précède est le contenu détaillé de. pour plus d'informations, suivez d'autres articles connexes sur le site Web de PHP en chinois!

Déclaration de ce site Web

Le contenu de cet article est volontairement contribué par les internautes et les droits d'auteur appartiennent à l'auteur original. Ce site n'assume aucune responsabilité légale correspondante. Si vous trouvez un contenu suspecté de plagiat ou de contrefa?on, veuillez contacter admin@php.cn

Outils d'IA chauds

Undress AI Tool

Images de déshabillage gratuites

Undresser.AI Undress

Application basée sur l'IA pour créer des photos de nu réalistes

AI Clothes Remover

Outil d'IA en ligne pour supprimer les vêtements des photos.

Clothoff.io

Dissolvant de vêtements AI

Video Face Swap

échangez les visages dans n'importe quelle vidéo sans effort grace à notre outil d'échange de visage AI entièrement gratuit?!

Afficher plus

Article chaud

Guide de construction de Grass Wonder | Uma musume joli derby

1 Il y a quelques mois By Jack chen

<??>: 99 nuits dans la forêt - tous les badges et comment les déverrouiller

1 Il y a quelques mois By DDD

Guide de température de Rimworld Odyssey pour les navires et Gravtech

3 Il y a quelques semaines By Jack chen

Guide de construction Mejiro Ryan | Uma musume joli derby

4 Il y a quelques semaines By Jack chen

Rimworld Odyssey Comment pêcher

3 Il y a quelques semaines By Jack chen

Afficher plus

Outils chauds

Bloc-notes++7.3.1

éditeur de code facile à utiliser et gratuit

SublimeText3 version chinoise

Version chinoise, très simple à utiliser

Envoyer Studio 13.0.1

Puissant environnement de développement intégré PHP

Dreamweaver CS6

Outils de développement Web visuel

SublimeText3 version Mac

Logiciel d'édition de code au niveau de Dieu (SublimeText3)

Afficher plus

Sujets chauds

Tutoriel Laravel

1601

Tutoriel PHP

1502

276

Afficher plus

Related knowledge

Comment gérer l'authentification de l'API dans Python Jul 13, 2025 am 02:22 AM

La clé pour gérer l'authentification de l'API est de comprendre et d'utiliser correctement la méthode d'authentification. 1. Apikey est la méthode d'authentification la plus simple, généralement placée dans l'en-tête de demande ou les paramètres d'URL; 2. BasicAuth utilise le nom d'utilisateur et le mot de passe pour la transmission de codage Base64, qui convient aux systèmes internes; 3. OAuth2 doit d'abord obtenir le jeton via client_id et client_secret, puis apporter le Bearertoken dans l'en-tête de demande; 4. Afin de gérer l'expiration des jetons, la classe de gestion des jetons peut être encapsulée et rafra?chie automatiquement le jeton; En bref, la sélection de la méthode appropriée en fonction du document et le stockage en toute sécurité des informations clés sont la clé.

Comment itérer sur deux listes à la fois Python Jul 09, 2025 am 01:13 AM

Une méthode courante pour parcourir deux listes simultanément dans Python consiste à utiliser la fonction zip (), qui appariera plusieurs listes dans l'ordre et sera la plus courte; Si la longueur de liste est incohérente, vous pouvez utiliser itertools.zip_langest () pour être le plus long et remplir les valeurs manquantes; Combiné avec enumerate (), vous pouvez obtenir l'index en même temps. 1.zip () est concis et pratique, adapté à l'itération des données appariées; 2.zip_langest () peut remplir la valeur par défaut lorsqu'il s'agit de longueurs incohérentes; 3. L'énumération (zip ()) peut obtenir des indices pendant la traversée, en répondant aux besoins d'une variété de scénarios complexes.

Que sont les itérateurs Python? Jul 08, 2025 am 02:56 AM

Inpython, itérateurslawjectsThatallowloopingthroughCollectionsbyImpleting __iter __ () et__Next __ (). 1) iteratorsworkVeatheitorat

Tutoriel Python Fastapi Jul 12, 2025 am 02:42 AM

Pour créer des API modernes et efficaces à l'aide de Python, FastAPI est recommandé; Il est basé sur des invites de type Python standard et peut générer automatiquement des documents, avec d'excellentes performances. Après avoir installé FastAPI et ASGI Server Uvicorn, vous pouvez écrire du code d'interface. En définissant les itinéraires, en écrivant des fonctions de traitement et en renvoyant des données, les API peuvent être rapidement construites. Fastapi prend en charge une variété de méthodes HTTP et fournit des systèmes de documentation SwaggerUI et Redoc générés automatiquement. Les paramètres d'URL peuvent être capturés via la définition du chemin, tandis que les paramètres de requête peuvent être implémentés en définissant des valeurs par défaut pour les paramètres de fonction. L'utilisation rationnelle des modèles pydantiques peut aider à améliorer l'efficacité du développement et la précision.

Comment tester une API avec Python Jul 12, 2025 am 02:47 AM

Pour tester l'API, vous devez utiliser la bibliothèque des demandes de Python. Les étapes consistent à installer la bibliothèque, à envoyer des demandes, à vérifier les réponses, à définir des délais d'attente et à réessayer. Tout d'abord, installez la bibliothèque via PiPinstallRequests; Utilisez ensuite les demandes.get () ou les demandes.Post () et d'autres méthodes pour envoyer des demandes GET ou POST; Vérifiez ensuite la réponse.status_code et la réponse.json () pour vous assurer que le résultat de retour est en conformité avec les attentes; Enfin, ajoutez des paramètres de délai d'expiration pour définir l'heure du délai d'expiration et combinez la bibliothèque de réessayer pour obtenir une nouvelle tentative automatique pour améliorer la stabilité.

Portée variable python dans les fonctions Jul 12, 2025 am 02:49 AM

Dans Python, les variables définies à l'intérieur d'une fonction sont des variables locales et ne sont valides que dans la fonction; Les variables globales sont définies à l'extérieur qui peuvent être lues n'importe où. 1. Les variables locales sont détruites lors de l'exécution de la fonction; 2. La fonction peut accéder aux variables globales mais ne peut pas être modifiée directement, donc le mot-clé global est requis; 3. Si vous souhaitez modifier les variables de fonction externes dans les fonctions imbriquées, vous devez utiliser le mot-clé non local; 4. Les variables avec le même nom ne se affectent pas dans différentes lunettes; 5. Global doit être déclaré lors de la modification des variables globales, sinon une erreur non liée à la dorsale sera augmentée. Comprendre ces règles permet d'éviter les bogues et d'écrire des fonctions plus fiables.

Comment analyser une table HTML avec Python et Pandas Jul 10, 2025 pm 01:39 PM

Oui, vous pouvez analyser les tables HTML à l'aide de Python et Pandas. Tout d'abord, utilisez la fonction pandas.read_html () pour extraire la table, ce qui peut analyser les éléments HTML dans une page Web ou une cha?ne dans une liste de dataframe; Ensuite, si la table n'a pas de titre de colonne claire, il peut être corrigé en spécifiant les paramètres d'en-tête ou en définissant manuellement l'attribut .Columns; Pour les pages complexes, vous pouvez combiner la bibliothèque de requêtes pour obtenir du contenu HTML ou utiliser BeautifulSoup pour localiser des tables spécifiques; Faites attention à des pièges communs tels que le rendu JavaScript, les problèmes de codage et la reconnaissance multi-table.

Accès à l'objet JSON imbriqué en python Jul 11, 2025 am 02:36 AM

La fa?on d'accéder aux objets JSON imbriqués dans Python est de clarifier d'abord la structure, puis d'indexer la couche par couche. Tout d'abord, confirmez la relation hiérarchique de JSON, comme un dictionnaire ou une liste imbriquée du dictionnaire; Utilisez ensuite les clés du dictionnaire et la liste d'index pour accéder à la couche par couche, telles que les données "détails" ["zip"] pour obtenir le codage zip, les données "Détails" [0] pour obtenir le premier passe-temps; Pour éviter KeyError et IndexError, la valeur par défaut peut être définie par la méthode .get (), ou la fonction d'encapsulation Safe_get peut être utilisée pour obtenir un accès sécurisé; Pour des structures complexes, recherchez ou utilisez des bibliothèques tierces telles que JMESPath pour gérer.

See all articles

国产av日韩一区二区三区精品,成人性爱视频在线观看,国产,欧美,日韩,一区,www.成色av久久成人,2222eeee成人天堂

YOLOv Une nouvelle avancée dans l'analyse de la mise en page des documents

Introduction

Méthode de formation

Comparaison des résultats

Conclusion

Plus

Références

Outils d'IA chauds

Undress AI Tool

Undresser.AI Undress

AI Clothes Remover

Clothoff.io

Video Face Swap

Article chaud

Outils chauds

Bloc-notes++7.3.1

SublimeText3 version chinoise

Envoyer Studio 13.0.1

Dreamweaver CS6

SublimeText3 version Mac

Sujets chauds