国产av日韩一区二区三区精品,成人性爱视频在线观看,国产,欧美,日韩,一区,www.成色av久久成人,2222eeee成人天堂

ホームページ バックエンド開(kāi)発 Python チュートリアル Python が正規(guī)表現(xiàn)を使用して HTML タグをフィルタリングまたは置換する方法の概要

Python が正規(guī)表現(xiàn)を使用して HTML タグをフィルタリングまたは置換する方法の概要

Sep 26, 2017 am 10:36 AM
python 表現(xiàn) フィルター

この記事では、Python の正規(guī)表現(xiàn)を使用して HTML タグをフィルタリングまたは置換する方法を主に紹介し、Python の正規(guī)表現(xiàn)関連の構(gòu)文を簡(jiǎn)単に紹介し、Python の正規(guī)表現(xiàn)ベースの HTML タグのフィルタリングおよび置換関連の操作テクニックを具體的な例に基づいて分析します。必須 お友達(dá)は參照してください

この記事では、Python が正規(guī)表現(xiàn)を使用して HTML タグをフィルターまたは置換する方法について説明します。參考として、次のようにみんなと共有してください:

Python 正規(guī)表現(xiàn)の主な內(nèi)容:

Python 正規(guī)表現(xiàn)エスケープ文字:

改行文字を除く任意の文字と一致します

w 文字またはを一致させます。數(shù)字、アンダースコア、または漢字
s 任意の空白文字と一致します
d 數(shù)字と一致します
b 単語(yǔ)の先頭または末尾と一致します
^ 文字列の先頭と一致します
$ 文字列の末尾と一致します
W 文字列以外のものと一致します
文字、數(shù)字、アンダースコア、漢字
S は空白文字ではない任意の文字に一致します
D は數(shù)字以外の文字に一致します
B は単語(yǔ)の先頭または末尾ではない位置に一致します
[^x] は任意の文字に一致しますx
[^aeiou] を除く aeiou 文字以外の任意の文字と一致します

一般的に使用される Python 正規(guī)表現(xiàn)修飾子コード/文法の説明:

*0 回以上繰り返します
+1 回以上繰り返します
?繰り返し0 回または 1 回
{n} を n 回繰り返します
{n,} を n 回以上繰り返します
{n,m} を n ~ m 回繰り返します
Python の正規(guī)表現(xiàn)について 名前付きグループ:
名前付きグループ: (?P< ;name> ....)
この記事では區(qū)切りについても觸れています (疑問(wèn)符で始まり、前方の場(chǎng)合は「<」記號(hào)があり、そうでない場(chǎng)合は「!」記號(hào)があります):
前方區(qū)切り (?< ) HTML タグを削除 (フィルタリング) するサンプルコード


#-*- coding:utf-8 -*-
import re
##過(guò)濾HTML中的標(biāo)簽
# 將HTML中標(biāo)簽等信息去掉
# @param htmlstr HTML字符串.
def filter_tags(htmlstr):
  # 先過(guò)濾CDATA
  re_cdata = re.compile("//<!
CDATA\[[>]?//
\]>", re.I) #匹配CDATA
  re_script = re.compile(&#39;<\s*script[^>]*>[^<]*<\s*/\s*script\s*>&#39;, re.I) # Script
  re_style = re.compile(&#39;<\s*style[^>]*>[^<]*<\s*/\s*style\s*>&#39;, re.I) # style
  re_br = re.compile(&#39;<br\s*?/?>&#39;) # 處理?yè)Q行
  re_h = re.compile(&#39;</?\w+[^>]*>&#39;) # HTML標(biāo)簽
  re_comment = re.compile(&#39;<!--[^>]*-->&#39;) # HTML注釋
  s = re_cdata.sub(&#39;&#39;, htmlstr) # 去掉CDATA
  s = re_script.sub(&#39;&#39;, s) # 去掉SCRIPT
  s = re_style.sub(&#39;&#39;, s) # 去掉style
  s = re_br.sub(&#39;\n&#39;, s) # 將br轉(zhuǎn)換為換行
  s = re_h.sub(&#39;&#39;, s) # 去掉HTML 標(biāo)簽
  s = re_comment.sub(&#39;&#39;, s) # 去掉HTML注釋
  # 去掉多余的空行
  blank_line = re.compile(&#39;\n+&#39;)
  s = blank_line.sub(&#39;\n&#39;, s)
  s = replaceCharEntity(s) # 替換實(shí)體
  return s
##替換常用HTML字符實(shí)體.
# 使用正常的字符替換HTML中特殊的字符實(shí)體.
# 你可以添加新的實(shí)體字符到CHAR_ENTITIES中,處理更多HTML字符實(shí)體.
# @param htmlstr HTML字符串.
def replaceCharEntity(htmlstr):
  CHAR_ENTITIES = {&#39;nbsp&#39;: &#39; &#39;, &#39;160&#39;: &#39; &#39;,
           &#39;lt&#39;: &#39;<&#39;, &#39;60&#39;: &#39;<&#39;,
           &#39;gt&#39;: &#39;>&#39;, &#39;62&#39;: &#39;>&#39;,
           &#39;amp&#39;: &#39;&&#39;, &#39;38&#39;: &#39;&&#39;,
           &#39;quot&#39;: &#39;"&#39;&#39;"&#39;, &#39;34&#39;: &#39;"&#39;, }
  re_charEntity = re.compile(r&#39;?(?P<name>\w+);&#39;)
  sz = re_charEntity.search(htmlstr)
  while sz:
    entity = sz.group() # entity全稱,如>
    key = sz.group(&#39;name&#39;) # 去除&;后entity,如>為gt
    try:
      htmlstr = re_charEntity.sub(CHAR_ENTITIES[key], htmlstr, 1)
      sz = re_charEntity.search(htmlstr)
    except KeyError:
      # 以空串代替
      htmlstr = re_charEntity.sub(&#39;&#39;, htmlstr, 1)
      sz = re_charEntity.search(htmlstr)
  return htmlstr
def repalce(s, re_exp, repl_string):
  return re_exp.sub(repl_string, s)
if __name__ == &#39;__main__&#39;:
  s = file(&#39;test.html&#39;).read()
  news = filter_tags(s)
  print news

以上がPython が正規(guī)表現(xiàn)を使用して HTML タグをフィルタリングまたは置換する方法の概要の詳細(xì)內(nèi)容です。詳細(xì)については、PHP 中國(guó)語(yǔ) Web サイトの他の関連記事を參照してください。

このウェブサイトの聲明
この記事の內(nèi)容はネチズンが自主的に寄稿したものであり、著作権は原著者に帰屬します。このサイトは、それに相當(dāng)する法的責(zé)任を負(fù)いません。盜作または侵害の疑いのあるコンテンツを見(jiàn)つけた場(chǎng)合は、admin@php.cn までご連絡(luò)ください。

ホットAIツール

Undress AI Tool

Undress AI Tool

脫衣畫(huà)像を無(wú)料で

Undresser.AI Undress

Undresser.AI Undress

リアルなヌード寫(xiě)真を作成する AI 搭載アプリ

AI Clothes Remover

AI Clothes Remover

寫(xiě)真から衣服を削除するオンライン AI ツール。

Clothoff.io

Clothoff.io

AI衣類リムーバー

Video Face Swap

Video Face Swap

完全無(wú)料の AI 顔交換ツールを使用して、あらゆるビデオの顔を簡(jiǎn)単に交換できます。

ホットツール

メモ帳++7.3.1

メモ帳++7.3.1

使いやすく無(wú)料のコードエディター

SublimeText3 中國(guó)語(yǔ)版

SublimeText3 中國(guó)語(yǔ)版

中國(guó)語(yǔ)版、とても使いやすい

ゼンドスタジオ 13.0.1

ゼンドスタジオ 13.0.1

強(qiáng)力な PHP 統(tǒng)合開(kāi)発環(huán)境

ドリームウィーバー CS6

ドリームウィーバー CS6

ビジュアル Web 開(kāi)発ツール

SublimeText3 Mac版

SublimeText3 Mac版

神レベルのコード編集ソフト(SublimeText3)

AIと組み合わせてPHPを使用してテキストエラー修正PHP構(gòu)文検出と最適化を?qū)g現(xiàn)する方法 AIと組み合わせてPHPを使用してテキストエラー修正PHP構(gòu)文検出と最適化を?qū)g現(xiàn)する方法 Jul 25, 2025 pm 08:57 PM

AIによるテキストエラーの修正と構(gòu)文最適化を?qū)g現(xiàn)するには、次の手順に従う必要があります。1。Baidu、Tencent API、またはオープンソースNLPライブラリなどの適切なAIモデルまたはAPIを選択します。 2。PHPのカールまたはガズルを介してAPIを呼び出し、返品結(jié)果を処理します。 3.アプリケーションにエラー修正情報(bào)を表示し、ユーザーが採(cǎi)用するかどうかを選択できるようにします。 4.構(gòu)文の検出とコードの最適化には、PHP-LとPHP_CODESNIFFERを使用します。 5.フィードバックを継続的に収集し、モデルまたはルールを更新して効果を改善します。 AIAPIを選択するときは、PHPの精度、応答速度、価格、サポートの評(píng)価に焦點(diǎn)を當(dāng)てます。コードの最適化は、PSR仕様に従い、キャッシュを合理的に使用し、円形クエリを避け、定期的にコードを確認(rèn)し、Xを使用する必要があります。

Python Seabornジョイントプロットの例 Python Seabornジョイントプロットの例 Jul 26, 2025 am 08:11 AM

Seabornのジョイントプロットを使用して、2つの変數(shù)間の関係と分布をすばやく視覚化します。 2。基本的な散布図は、sns.jointplot(data = tips、x = "total_bill"、y = "tip"、dind = "scatter")によって実裝され、中心は散布図であり、ヒストグラムは上部と右側(cè)と右側(cè)に表示されます。 3.回帰線と密度情報(bào)をdind = "reg"に追加し、marminal_kwsを組み合わせてエッジプロットスタイルを設(shè)定します。 4。データ量が大きい場(chǎng)合は、「ヘックス」を使用することをお?jiǎng)幛幛筏蓼埂?/p>

パイソンリストへの変換の例 パイソンリストへの変換の例 Jul 26, 2025 am 08:00 AM

文字列リストは、 '' .join(words)などのJoIn()メソッドとマージして、「Helloworldfrompython」を取得できます。 2。NUMBERリストは、參加する前にMAP(STR、數(shù)字)または[STR(x)forxinNumbers]を備えた文字列に変換する必要があります。 3.任意のタイプリストは、デバッグに適したブラケットと引用符のある文字列に直接変換できます。 4。カスタム形式は、 '|' .join(f "[{item}]" foriteminitems)output "[a] | [などのjoin()と組み合わせたジェネレーター式によって実裝できます。

PythonはSQL Server Pyodbcの例に接続します PythonはSQL Server Pyodbcの例に接続します Jul 30, 2025 am 02:53 AM

Pyodbcのインストール:Pipinstallpyodbcコマンドを使用してライブラリをインストールします。 2.接続sqlserver:pyodbc.connect()メソッドを介して、ドライバー、サーバー、データベース、uid/pwdまたはtrusted_connectionを含む接続文字列を使用し、それぞれSQL認(rèn)証またはWindows認(rèn)証をサポートします。 3.インストールされているドライバーを確認(rèn)します:pyodbc.drivers()を?qū)g行し、「sqlserver」を含むドライバー名をフィルタリングして、「sqlserverのodbcdriver17」などの正しいドライバー名が使用されるようにします。 4.接続文字列の重要なパラメーター

Python Pandas Meltの例 Python Pandas Meltの例 Jul 27, 2025 am 02:48 AM

pandas.melt()は、幅広い形式データを長(zhǎng)い形式に変換するために使用されます。答えは、ID_VARSを識(shí)別列を保持し、value_varsを溶かしてvar_nameおよびvalue_nameを選択する列を選択して、新しい列名を定義することです。列は1.id_vars = 'name'を意味します。 4.Value_Name = 'スコア'元の値の新しい列名を設(shè)定し、最後に名前、件名、スコアを含む3つの列を生成します。

メモリバウンド操作のためのPythonの最適化 メモリバウンド操作のためのPythonの最適化 Jul 28, 2025 am 03:22 AM

Pythoncanbeoptimizedformemory-boundoperationsは、ヘッドゲネレーター、EfficientDataStructures、およびManagingObjectlifetimes.first、Usegeneratoratoratoratoratoratoraturatussを使用していることを確認(rèn)してください

Python Djangoが例を形成します Python Djangoが例を形成します Jul 27, 2025 am 02:50 AM

まず、名前、メールボックス、メッセージフィールドを含む連絡(luò)先フォームを定義します。 2。ビューでは、フォームの送信はPOSTリクエストを?qū)彇摔工毪长趣摔瑜陝I理され、検証が渡された後、Cleaned_Dataが取得され、応答が返されます。 3。テンプレートでは、{{form.as_p}}を使用してフィールドをレンダリングし、{%csrf_token%}を追加してCSRF攻撃を防ぎます。 4. contact_viewビューにポイント /連絡(luò)先 /にURLルーティングを構(gòu)成します。 Modelformを使用してモデルを直接関連付けてデータストレージを?qū)g現(xiàn)します。 Djangoformsは、データ検証、HTMLレンダリング、エラープロンプトの統(tǒng)合処理を?qū)g裝します。これは、安全な形式機(jī)能の迅速な発展に適しています。

暗號(hào)通貨の統(tǒng)計(jì)的裁定とは何ですか?統(tǒng)計(jì)的な裁定はどのように機(jī)能しますか? 暗號(hào)通貨の統(tǒng)計(jì)的裁定とは何ですか?統(tǒng)計(jì)的な裁定はどのように機(jī)能しますか? Jul 30, 2025 pm 09:12 PM

統(tǒng)計(jì)アービトラージの紹介統(tǒng)計(jì)的arbitrageは、數(shù)學(xué)モデルに基づいて金融市場(chǎng)で価格の不一致を捉える取引方法です。その核となる哲學(xué)は、平均回帰に由來(lái)する、つまり、資産価格は短期的には長(zhǎng)期的な傾向から逸脫する可能性がありますが、最終的には歴史的平均に戻ります。トレーダーは統(tǒng)計(jì)的方法を使用して、資産間の相関を分析し、通常は同期して変更されるポートフォリオを探す。これらの資産の価格関係が異常に逸脫すると、裁定取引の機(jī)會(huì)が生じます。暗號(hào)通貨市場(chǎng)では、主に市場(chǎng)自體の非効率性と劇的な変動(dòng)のために、統(tǒng)計(jì)的な裁定が特に一般的です。従來(lái)の金融市場(chǎng)とは異なり、暗號(hào)通貨は24時(shí)間體制で動(dòng)作し、その価格はニュース速報(bào)、ソーシャルメディアの感情、テクノロジーのアップグレードに非常に敏感です。この一定の価格の変動(dòng)は、頻繁に価格設(shè)定バイアスを作成し、仲裁人を提供します

See all articles