Python爬虫+Excel/VBA办公自动化帖子详情

想爬一个小说网页的全部中文内容，但是解码的时候变成字符串了，想请教一下什么原因。

代码：

def JinRuYeMian(wangzi):

html = wangzi

headers = {

'User-Agent':'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/81.0.4044.138 Safari/537.36',

'Accept':'text/html,application/xhtml+xml,application/xml;q=0.9,*/*;q=0.8',

'Accept-Language':'en-US,en;q=0.5',

'Accept-Encoding':'gzip',

'DNT':'1',

'Connection':'close'

}

soup_obj=BeautifulSoup(page.content,'html.parser')

txt_content = soup_obj.find(id = 'mainNewsContent')

jiema = txt_content.encode('GB2312')#以该网站的编码方式解码

print(jiema)

输出结果：

b'<div class="mainNewsContent NewsContent" id="mainNewsContent">\n\n<table border="0" width="100%">\n<tr>\n<td><script language="javascript" src="/adfile/contentad3.js"></script></td>\n<td><script language="javascript" src="/adfile/contentad4.js"></script></td>\n</tr>\n</table>\n\r\n\t\t\t\t\t 3GÃâ·ÑÍøwww.3gmfw.cnÃâ·ÑÎªÄã·ÖÏ\xa8\xaa\xa1\xe3Ù\xa1\xc0ä´\xa8\xaeÕ\xa8\xacÌ½ÈËÓãÖ®\xa8\xa6äÐ\xa1\xc1ÊÖÊÇË£¿ \xa1\xe3Ù\xa1\xc0ä´\xa8\xaeÕ\xa8\xacÌ½ÈËÓãÖ®\xa8\xa6ä¹¥ÂÔ,\xa1\xe3Ù\xa1\xc0ä´\xa8\xaeÕ\xa8\xacÌ½ ÈËÓãÖ®\xa8\xa6ä \xa1\xe3Ù\xa1\xc0ä´\xa8\xaeÕ\xa8\xacÌ½ÈËÓãÖ®\xa8\xa6äµÄÏ\xa8\xa4¹Ø\xa1\xc1ÊÔ´ÈçÏÂ£º\r\n \xa1\xe3Ù\xa1\xc0ä´\xa8\xaeÕ\xa8\xacÌ½ÈËÓãÖ®\xa8\xa6äÐ\xa1\xc1ÊÖÊÇË£¿ \xa1\xe3Ù\xa1\xc0ä´\xa8\xaeÕ\xa8\xacÌ½ÈËÓãÖ®\xa8\xa6ä¹¥ÂÔ\nÈËÓãÖ®\xa8\xa6äÕæÏ\xa8\xa4 \n \nÃÕµ\xa1\xc1: \n \nweaverflower(Ä¦Ë¹ÃÜÂë;Ö¯Å®»\xa1\xa7) \n \n¼´½«\xa1\xc0ØËÀÎÞÒÉµÄÈË£º \n \nÀÕ¿ËË¹(\xa1\xc0¾¹\xa8\xb2¹«¾ô) \n \nÔ\xa8\xac³É\xa1\xe3¬À\xa8\xb0¶\xa8\xb4\xa1\xc1îÖÕËÀÍöµÄÈËÊÇ£º \n \n\xa1\xe3£Èð¿Ë \n \n\xa1\xe3£Èð¿Ë(\xa1\xc0¾¹\xa8\xb2Íõ\xa1\xc1Ó)µÄÕæ\xa1\xe3®\xa1\xe3¡£º \n \n¸¥ÀÍµÂ(\xa1\xc0¾¹\xa8\xb2¹\xa8\xb2Íõ)¡¢ÀÕ¿ËË¹(\xa1\xc0¾¹\xa8\xb2¹«¾ô) \n \nË¹¿\xa1\xa7ÍÐ(\xa1\xc0¾¹\xa8\xb2ÆÍ´Ó)ºÍÀÕ¿ËË¹(\xa1\xc0¾¹\xa8\xb2¹«¾ô)µÄ¹ØÏµÊÇ£º \n \nºÏ\xa1\xc1\xa1\xc2¹ØÏµ \n \nÒ»¡¢ÈÎÎñÒ»: \n \nÍÆÀ\xa8\xaa·½·\xa1\xa7: \n \n·ÇÌÓÍÑ£¬´\xa8\xae¼ÒÀ\xa8\xaaÇåÃ¿¸öÈËË\xa8\xb4ÖÐµÄÒ©ÎïºÍÄ\xa1\xec·\xa1\xa7£¬ÔÙÒÀ¾ÝÆäÔÀ\xa8\xaaÍÆ¶Ï¼´¿É¡£

...................

扫码下载官方App

所有回复（1）

回复

扫码下载官方App

所有回复（1）

回复

使用协议与隐私政策