Qu'est-ce que AWK et quels sont les cas d'utilisation courants?
Jun 20, 2025 am 12:27 AMAWK est un puissant outil de traitement du texte utilisé dans les environnements UNIX et Linux pour l'extraction et les rapports de données. Il lit la ligne d'entrée par ligne, divise chaque ligne dans les champs et permet la manipulation à l'aide de modèles et d'actions. 1. Awk excelle dans le filtrage des fichiers journaux en fonction des conditions, telles que la recherche d'erreurs HTTP 500 à l'aide de AWK '$ 9 == 500'. 2. Il extrait et formate des colonnes à partir de données structurées, comme la réalisation des ID de processus et des noms de commande avec PS Aux | awk '{print $ 2, $ 11}'. 3. AWK prend en charge la résumé des données via des fonctions intégrées, permettant des taches comme le calcul des revenus totaux à partir d'un fichier CSV à l'aide de awk -f ',' 'nr> 1 {sum = $ 3} end {imprimer sum}'. Ces capacités rendent AWK idéal pour les taches de script rapide impliquant efficacement le filtrage, la mise en forme et la résumé de données textuelles.
AWK est un puissant outil de traitement du texte qui est couramment utilisé dans les environnements Unix et Linux. Il est con?u pour gérer les taches d'extraction et de rapport de données, en particulier lorsqu'il s'agit de texte structuré comme des fichiers journaux ou des données CSV.
Ce que fait Awk réellement
à son c?ur, AWK lit la ligne d'entrée par ligne et divise chaque ligne en champs. Par défaut, il se divise sur Whitespace, mais vous pouvez définir des délimiteurs personnalisés. Une fois la ligne divisée, AWK vous permet de manipuler ces champs à l'aide de modèles et d'actions.
Par exemple, si vous avez un fichier où chaque ligne contient le nom et l'age d'une personne séparés par des espaces, vous pouvez écrire une commande awk pour imprimer uniquement les noms de personnes de plus de 30 ans.
Cela rend AWK idéal pour les taches de script rapides qui impliquent le filtrage, la mise en forme ou le résumé des données textuelles.
Filtrage des fichiers journaux en fonction des conditions
Un cas d'utilisation courant consiste à analyser les fichiers journaux. Les journaux système, les journaux de serveurs Web ou les journaux d'applications contiennent souvent des lignes de texte structuré. Avec AWK, vous pouvez extraire des entrées spécifiques en fonction du contenu ou de la position.
Disons que vous souhaitez trouver toutes les erreurs HTTP 500 dans un journal d'accès Apache:
awk '$ 9 == 500' /var/log/apache/access.log
Ici, $9
se réfère au neuvième champ de la ligne de journal - qui contient généralement le code d'état HTTP. Cette seule ligne imprime chaque ligne où le code d'état est exactement 500.
Vous pouvez également combiner des conditions:
- Les lignes de filtre où le temps de réponse est au-dessus d'un seuil
- Imprimer uniquement les demandes d'une certaine gamme IP
- Compter combien de fois chaque point final a été accessible
Il est rapide, ne nécessite pas de charger des fichiers entiers en mémoire et fonctionne bien dans les pipelines.
Extraction et formatage des colonnes à partir de données de texte
Si vous avez déjà regardé la sortie de commandes comme ps
, df
ou top
, vous avez vu des données en colonnes. Awk est parfait pour retirer des colonnes spécifiques ou les reformater.
Par exemple, pour répertorier les processus d'exécution avec leurs identifiants de processus:
PS aux Aux | awk '{print $ 2, $ 11}'
Cela tire les deuxième et onzième champs - PID et nom de commande - et les imprime.
Un autre exemple typique: extraire les informations d'utilisation du disque de df
:
DF -H | awk '/ dev \ / sd / {print $ 1, $ 5}'
Cette ligne filtre les lignes contenant des périphériques de stockage ( /dev/sd
) et affiche le nom du périphérique et le pourcentage d'utilisation.
Ces types d'extractions sont faciles à encha?ner avec d'autres outils comme grep
, sort
ou uniq
.
Résumé des données avec des fonctions intégrées
AWK a une prise en charge intégrée pour les opérations mathématiques de base, il est donc pratique pour des résumés rapides sans avoir besoin de scripts complets.
Supposons que vous ayez un fichier CSV avec des données de vente et que vous souhaitez calculer le chiffre d'affaires total:
awk -f ',' 'nr> 1 {sum = $ 3} end {imprimer sum}' Sales.csv
Briser cela:
-
-F','
définit le séparateur de champ sur la virgule -
NR > 1
saute la ligne d'en-tête -
$3
suppose que la troisième colonne contient des valeurs de revenus - Le bloc
END
s'exécute après le traitement de toutes les lignes
Vous pouvez étendre cela pour calculer les moyennes, compter les éléments uniques ou les totaux de groupe par catégories - le tout dans une seule commande awk.
La plupart de ces exemples fonctionnent dès la sortie de la bo?te dans la plupart des obus. Vous n'avez pas besoin d'installer quoi que ce soit de plus à moins que vous ne soyez sous Windows (où WSL ou GIT BASH aideraient). Ce n'est pas flashy, mais une fois que vous savez comment l'utiliser, AWK devient l'un de ces outils incontournables pour une analyse de texte rapide.
Ce qui précède est le contenu détaillé de. pour plus d'informations, suivez d'autres articles connexes sur le site Web de PHP en chinois!

Outils d'IA chauds

Undress AI Tool
Images de déshabillage gratuites

Undresser.AI Undress
Application basée sur l'IA pour créer des photos de nu réalistes

AI Clothes Remover
Outil d'IA en ligne pour supprimer les vêtements des photos.

Clothoff.io
Dissolvant de vêtements AI

Video Face Swap
échangez les visages dans n'importe quelle vidéo sans effort grace à notre outil d'échange de visage AI entièrement gratuit?!

Article chaud

Outils chauds

Bloc-notes++7.3.1
éditeur de code facile à utiliser et gratuit

SublimeText3 version chinoise
Version chinoise, très simple à utiliser

Envoyer Studio 13.0.1
Puissant environnement de développement intégré PHP

Dreamweaver CS6
Outils de développement Web visuel

SublimeText3 version Mac
Logiciel d'édition de code au niveau de Dieu (SublimeText3)

PythonforNLP?: Comment traiter le texte des fichiers PDF à l'aide de la bibliothèque PDFMiner?? Introduction : PDF (Portable Document Format) est un format utilisé pour stocker des documents, généralement utilisé pour le partage et la distribution de documents électroniques. Dans le domaine du traitement du langage naturel (NLP), nous avons souvent besoin d'extraire du texte à partir de fichiers PDF pour l'analyse et le traitement de texte. Python fournit de nombreuses bibliothèques pour traiter les fichiers PDF, parmi lesquelles PDFMiner est un puissant

Lors du traitement de fichiers sous les systèmes Linux, il est parfois nécessaire de supprimer des lignes à la fin du fichier. Cette opération est très courante dans les applications pratiques et peut être réalisée grace à quelques commandes simples. Cet article présentera les étapes pour supprimer rapidement la ligne à la fin du fichier dans le système Linux et fournira des exemples de code spécifiques. étape 1 : Vérifiez la dernière ligne du fichier Avant d'effectuer l'opération de suppression, vous devez d'abord confirmer quelle ligne est la dernière ligne du fichier. Vous pouvez utiliser la commande tail pour afficher la dernière ligne du fichier. La commande spécifique est la suivante?: tail-n1filena.

Avec la sortie de PHP8.0, de nombreuses personnes s'intéressent à ses nouvelles fonctionnalités. L'une de ses fonctionnalités les plus importantes est sa bibliothèque de traitement de texte, Phonetic. Cette bibliothèque fournit des méthodes utiles telles que la conversion de symboles phonétiques, la conversion pinyin et la correspondance approximative de cha?nes. Dans cet article, nous examinerons les fonctionnalités et l'utilisation de cette bibliothèque. Qu’est-ce que la phonétique ? Phonetic est une bibliothèque de traitement de texte. Elle propose plusieurs méthodes pour rendre le traitement de texte plus pratique et plus précis. Cette bibliothèque intègre trois fonctions principales : audio

Comment utiliser la commande awk pour l’analyse et le traitement des journaux sous Linux ? Introduction : Dans les systèmes Linux, awk est un puissant outil d'analyse et de traitement de texte. Il peut être utilisé pour rechercher et extraire du contenu spécifique dans des fichiers, formater des données et effectuer des calculs simples mais utiles. Cet article explique comment utiliser la commande awk pour l'analyse et le traitement des journaux sous Linux, y compris les options de commande awk couramment utilisées et des exemples de codes. 1. La syntaxe de base et les options de la commande awk La syntaxe de base de la commande awk est la suivante : awk.

Avec la croissance rapide d’Internet et la quantité de données, le traitement et l’exploration de texte sont devenus des compétences nécessaires dans le domaine informatique. PHP, en tant que langage de script à usage général, est souvent utilisé pour développer des applications Web. Qu’il soit utilisé pour l’exploration de données ou le traitement de texte dans le développement quotidien, PHP est un outil très utile. Dans cet article, nous présenterons quelques concepts et techniques de base pour le traitement de texte et l'exploration de texte en PHP, et fournirons quelques exemples de code pratiques pour aider les lecteurs à approfondir leur compréhension du traitement de texte et de l'exploration de texte PHP. personnage

Présentation Dans les systèmes Linux, le traitement de texte constitue une partie essentielle des taches quotidiennes. Que vous modifiiez des fichiers de configuration, analysiez des fichiers journaux ou traitiez des données, les outils de traitement de texte sont cruciaux. Bien que la commande sed soit largement utilisée sous Linux, sa syntaxe est complexe et difficile à apprendre. La commande sd est un outil de remplacement de texte simple et intuitif con?u pour fournir une alternative plus facile à utiliser à sed. Cet article présentera en détail le concept, la fonction et l'utilisation de la commande sd. La commande sd est un outil de ligne de commande pour le traitement de texte. Elle fournit une interface utilisateur conviviale et des fonctions riches, permettant aux utilisateurs d'effectuer facilement des opérations de texte, telles que le remplacement, la suppression, l'insertion de lignes, etc. Son objectif de conception est de simplifier le processus de traitement de texte et de le rendre plus intuitif et compréhensible. Grace à la commande sd, les utilisateurs peuvent

Technologie de développement PHP?: découvrez comment PHP gère les opérations de remplacement de ponctuation de texte. En tant que langage de script largement utilisé dans le développement Web, PHP fournit une multitude de fonctions de traitement de cha?nes pour aider les développeurs à gérer diverses opérations de texte. Dans le développement réel, nous rencontrons souvent des situations dans lesquelles nous devons gérer des signes de ponctuation dans le texte, comme la suppression, le remplacement ou l'échappement. Cet article se concentrera sur la fa?on dont PHP gère les opérations de remplacement de ponctuation dans le texte et fournira des exemples de code spécifiques. 1. Le r?le et les problèmes des signes de ponctuation Les signes de ponctuation jouent un r?le dans la division du texte.

Lors du traitement du texte, vous rencontrez souvent des situations où vous devez remplacer les signes de ponctuation. Avec l'aide de la programmation PHP, nous pouvons facilement implémenter cette fonction. Ce qui suit explique comment utiliser PHP pour écrire du code permettant de remplacer les signes de ponctuation dans le texte. Tout d'abord, nous devons clarifier la liste des signes de ponctuation qui doivent être remplacés, comme remplacer les points par des virgules, les points d'interrogation par des points d'exclamation, etc. Ensuite, nous pouvons écrire une simple fonction PHP pour implémenter ces fonctions de remplacement. Voici un exemple de code?:
