使用
urllib.parse.unquote(from_ur)
解碼
%E7%8E%8B%E7%90%BC%E8%8C%B6%E8%89%BA
%E5%B0%8F%E7%BD%90%E8%8C%B6%E8%83%8C%E6%99%AF%E6%AD%8C%E6%9B%B2
%C2%BD%D3%F0%CD%BC%C6%AC
%E5%B0%8F%E7%BD%90%E8%8C%B6%E8%83%8C%E6%99%AF%E9%9F%B3%E4%B9%90
%C2%CC%B2%E8
%C2%CC%B2%E8%CD%BC%C6%AC%B4%F3%C8%AB
%BB%B1%BB%A8%B2%E8
%E7%8E%8B%E7%90%BC%E8%A1%8C%E8%8C%B6%E5%8D%81%E5%BC%8F
%E5%B0%8F%E7%BD%90%E8%8C%B6%E7%9A%84%E5%85%AB%E4%B8%AA%E5%A4%A7%E5%B8%88
%E9%BE%99%E4%BA%95%E8%8C%B6%E5%A5%BD%E5%9D%8F%E5%9B%BE%E7%89%87
%E9%9B%80%E8%88%8C%E8%8C%B6%E5%8F%B6%E5%B1%9E%E4%BA%8E%E4%BB%80%E4%B9%88%E8%8C%B6
%E7%9B%96%E7%A2%97%E8%8C%B6%E6%AD%A3%E7%A1%AE%E7%9A%84%E5%96%9D%E6%B3%95%E5%9B%BE%E8%A7%A3
%E7%A2%A7%E6%BD%AD%E9%A3%98%E9%9B%AA%E7%9A%84%E5%8A%9F%E6%95%88%E4%B8%8E%E4%BD%9C%E7%94%A8
%E8%8C%B6%E9%81%93
%BA%DA%BF%E0%DC%F1
%E8%8C%B6%E7%9A%84%E5%B9%BF%E5%91%8A%E6%AD%8C%E6%9B%B2
%E4%BF%A1%E9%98%B3%E6%AF%9B%E5%B0%96
%E5%AE%89%E5%90%89%E7%99%BD%E8%8C%B6%E5%9B%BE%E7%89%87
%E6%80%8E%E6%A0%B7%E5%8A%A0%E7%9B%9F%E5%B0%8F%E7%BD%90%E8%8C%B6
%E5%AE%89%E6%BA%AA%E8%8C%B6%E5%8F%B6%E6%89%B9%E5%8F%91%E5%B8%82%E5%9C%BA
%E7%A2%A7%E8%9E%BA%E6%98%A5
%E8%8B%A6%E8%8D%9E
%BA%DA%BF%E0%DC%F1%B2%E8
部分亂碼
#有什麼好的解決方法嗎
擁有18年軟件開發(fā)和IT教學經驗。曾任多家上市公司技術總監(jiān)、架構師、項目經理、高級軟件工程師等職務。 網絡人氣名人講師,...
>>> unquote(s, encoding="utf-8")
'王瓊茶藝\n小罐茶背景歌曲\n?????\n小罐茶背景音樂\n???\n????????\n??????\n王瓊行茶十式\n小罐茶的八個大師\n龍井茶好壞圖片\n雀舌茶葉屬于什么茶\n蓋碗茶正確的喝法圖解\n碧潭飄雪的功效與作用\n茶道\n?????\n茶的廣告歌曲\n信陽毛尖\n安吉白茶圖片\n怎樣加盟小罐茶\n安溪茶葉批發(fā)市場\n碧螺春\n苦蕎\n??????'
>>> unquote(s, encoding="gbk")
'鐜嬬惣鑼惰壓\n灝忕綈鑼惰儗鏅?姝屾洸\n陸羽圖片\n灝忕綈鑼惰儗鏅?闊充箰\n綠茶\n綠茶圖片大全\n槐花茶\n鐜嬬惣琛岃尪鍗佸紡\n灝忕綈鑼剁殑鍏?涓?澶у笀\n榫欎簳鑼跺ソ鍧忓浘鐗?\n闆?鑸岃尪鍙跺睘浜庝粈涔堣尪\n鐩栫?楄尪姝g‘鐨勫枬娉曞浘瑙?\n紕ф江椋橀洩鐨勫姛鏁堜笌浣滅敤\n鑼墮亾\n黑苦蕎\n鑼剁殑騫垮憡姝屾洸\n淇¢槼姣涘皷\n瀹夊悏鐧借尪鍥劇墖\n鎬庢牱鍔犵洘灝忕綈鑼?\n瀹夋邯鑼跺彾鎵瑰彂甯傚満\n紕ц灪鏄?\n鑻﹁崬\n黑苦蕎茶'
>>>
可以看到,亂碼的那部分編碼為 gbk,我也不知道為啥兩種編碼會混合。
解決方案:
s = '''
%E7%8E%8B%E7%90%BC%E8%8C%B6%E8%89%BA
%E5%B0%8F%E7%BD%90%E8%8C%B6%E8%83%8C%E6%99%AF%E6%AD%8C%E6%9B%B2
%C2%BD%D3%F0%CD%BC%C6%AC
%E5%B0%8F%E7%BD%90%E8%8C%B6%E8%83%8C%E6%99%AF%E9%9F%B3%E4%B9%90
%C2%CC%B2%E8
%C2%CC%B2%E8%CD%BC%C6%AC%B4%F3%C8%AB
%BB%B1%BB%A8%B2%E8
%E7%8E%8B%E7%90%BC%E8%A1%8C%E8%8C%B6%E5%8D%81%E5%BC%8F
%E5%B0%8F%E7%BD%90%E8%8C%B6%E7%9A%84%E5%85%AB%E4%B8%AA%E5%A4%A7%E5%B8%88
%E9%BE%99%E4%BA%95%E8%8C%B6%E5%A5%BD%E5%9D%8F%E5%9B%BE%E7%89%87
%E9%9B%80%E8%88%8C%E8%8C%B6%E5%8F%B6%E5%B1%9E%E4%BA%8E%E4%BB%80%E4%B9%88%E8%8C%B6
%E7%9B%96%E7%A2%97%E8%8C%B6%E6%AD%A3%E7%A1%AE%E7%9A%84%E5%96%9D%E6%B3%95%E5%9B%BE%E8%A7%A3
%E7%A2%A7%E6%BD%AD%E9%A3%98%E9%9B%AA%E7%9A%84%E5%8A%9F%E6%95%88%E4%B8%8E%E4%BD%9C%E7%94%A8
%E8%8C%B6%E9%81%93
%BA%DA%BF%E0%DC%F1
%E8%8C%B6%E7%9A%84%E5%B9%BF%E5%91%8A%E6%AD%8C%E6%9B%B2
%E4%BF%A1%E9%98%B3%E6%AF%9B%E5%B0%96
%E5%AE%89%E5%90%89%E7%99%BD%E8%8C%B6%E5%9B%BE%E7%89%87
%E6%80%8E%E6%A0%B7%E5%8A%A0%E7%9B%9F%E5%B0%8F%E7%BD%90%E8%8C%B6
%E5%AE%89%E6%BA%AA%E8%8C%B6%E5%8F%B6%E6%89%B9%E5%8F%91%E5%B8%82%E5%9C%BA
%E7%A2%A7%E8%9E%BA%E6%98%A5
%E8%8B%A6%E8%8D%9E
%BA%DA%BF%E0%DC%F1%B2%E8
'''
from urllib.parse import unquote_to_bytes
_list = unquote_to_bytes(s).split(b'\n')
result = []
for line in _list:
try :
result.append(line.decode('utf-8'))
except UnicodeDecodeError:
result.append(line.decode('gbk'))
print("\n".join(result))
運行結果
=================== RESTART: C:/Users/Zhang/Desktop/tmp.py ===================
王瓊茶藝
小罐茶背景歌曲
陸羽圖片
小罐茶背景音樂
綠茶
綠茶圖片大全
槐花茶
王瓊行茶十式
小罐茶的八個大師
龍井茶好壞圖片
雀舌茶葉屬于什么茶
蓋碗茶正確的喝法圖解
碧潭飄雪的功效與作用
茶道
黑苦蕎
茶的廣告歌曲
信陽毛尖
安吉白茶圖片
怎樣加盟小罐茶
安溪茶葉批發(fā)市場
碧螺春
苦蕎
黑苦蕎茶
>>>
輸入的問題吧,找個線上的URL解碼頁面試試,可以看到也是有亂碼的
http://www.convertstring.com/...