国产av日韩一区二区三区精品,成人性爱视频在线观看,国产,欧美,日韩,一区,www.成色av久久成人,2222eeee成人天堂

社群

學(xué)習(xí)

工具庫

AI工具

休閒

繁體中文

python - 透過正規(guī)提取出來的ip，怎麼命名

僅有的幸福 2017-05-18 11:00:19

933

source_ip = line.split('- -')[0].strip()
            if re.match('[0-9]{1,3}.[0-9]{1,3}.[0-9]{1,3}',source_ip):
                if source_ip_dict.get(source_ip,'-')=='-':
                    source_ip_dict[source_ip]=1
                else:
                    source_ip_dict[source_ip]=source_ip_dict[source_ip]+1

透過以上的程式碼把a(bǔ)pache的日誌ip提取出來，並且進(jìn)行統(tǒng)計(jì)去重了，
提取的ip資料如下：

##那麼要怎麼將這些ip位址進(jìn)行命名分類，

如
202.108.11.103跟220.181.32.137為百度蜘蛛ip
#想要實(shí)現(xiàn)的效果如下
這兩個(gè)ip命名為百度蜘蛛，然後把他們的統(tǒng)計(jì)數(shù)據(jù)相加即4336 3411
百度蜘蛛7747

這個(gè)要怎麼操作

僅有的幸福

全部回覆(4)

僅有的幸福2017-05-18 11:02:19 4樓

雷雷

點(diǎn)贊 +0

新增回覆

黃舟2017-05-18 11:02:19 3樓

可以嘗試建構(gòu)一個(gè)大型的以字典為鍵, 爬蟲名字為值的字典;

ip_map = {
    '202.108.11.103': 'baidu-spider',
    '220'.181.32.137: 'baidu-spider',
    '192.168.1.1': 'other'
    ....
}
sum = {}
for ip in source_ip:
    print ip
    sum[ip_mapping.get(ip, 'other')] = sum.get(ip, 0) + source_ip[ip]
print sum

點(diǎn)贊 +0

新增回覆

滿天的星座2017-05-18 11:02:19 2樓

使用pandas的資料透視表

點(diǎn)贊 +0

新增回覆

阿神2017-05-18 11:02:19 1樓

這樣多累！
為什麼不給這個(gè)ip分組單獨(dú)建立一張表，名為IPGroup （id, ip, groupname)

id	ip	groupName
1	202.108.11.103	百度蜘蛛
2	220.181.32.137	百度蜘蛛

之後一個(gè)SQL就搞定了，多麼輕鬆（設(shè)樓主用的表明為IPStastics）

SELECT b.groupName, SUM(a.count)
FROM IPStastics a 
  INNER JOIN IPGroup b
  ON a.ip = b.ip
GROUP BY b.groupName

點(diǎn)贊 +0

新增回覆

熱門專題

更多>