Le même code ne peut pas passer dans l'environnement Notepad (testé avec Notepad), mais peut passer dans Pycharm (Python3.5)
Code?:
import urllib
import urllib.request
url = "http://www.baidu.com"
data = urllib.request.urlopen(url).read()
data = data.decode('UTF-8')
Cette déclaration peut être transmise dans les deux environnements
data.decode('gbk', 'ignore').encode('UTF-8')
print(data)
Affichez la page Web explorée dans Pycharm et affichez-la dans la fenêtre cmd
UnicodeEncodeError?: le codec 'gbk' ne peut pas encoder le caractère 'xbb' en position 26830?:
séquence multi-octets illégale
Les caractères invalides doivent être supprimés.
import urllib
import urllib.request
url = "http://www.baidu.com"
data = urllib.request.urlopen(url).read()
data.decode('gbk', 'ignore').encode('UTF-8')
print(data)
Je peux vivre de cette fa?on, s'il te pla?t explique-moi
Vous pouvez rencontrer le même problème d'encodage python que moi, ou le problème de support d'encodage du terminal que vous utilisez. Jetez un ?il aux questions ci-dessous.
【Problème de codage Python ? 】Partagé depuis @SegmentFault, portail?: /q/10...