Google翻译

阅读量：5097 次

发布时间：2019-06-13

本文共 947 字，大约阅读时间需要 3 分钟。

Python爬虫视频教程零基础小白到scrapy爬虫高手-轻松入门

YouTube教程

Python Web Scraping Signature Series Tutorial 1 : Get Request with Python, Google Translate Part 1

检测---network---第二个single？client=。。。。。 ---preview可见翻译结果

name：第二个文件single?client=....

headers

request url:

http://translate.google.cn/translate_a/single?client=t&sl=en&tl=zh-CN&hl=zh-CN&dt=at&dt=bd&dt=ex&dt=ld&dt=md&dt=qca&dt=rw&dt=rm&dt=ss&dt=t&ie=UTF-8&oe=UTF-8&source=btn&srcrom=1&ssel=3&tsel=6&kc=0&tk=749722.875867&q=signature

复制这个链接，打开新的网页会下载一个txt

其内容是对具体的翻译解释

出现urllib2.HTTPError: HTTP Error 403: Forbidden错误是由于网站禁止爬虫，可以在请求加上头信息，伪装成浏览器访问

#伪装浏览器头

headers = {'User-Agent':'Mozilla/5.0 (Windows; U; Windows NT 6.1; en-US; rv:1.9.1.6) Gecko/20091201 Firefox/3.5.6'}

req = urllib2.Request(url = ' = headers)

feeddata = urllib2.urlopen(req).read()

#或者

#opener = urllib2.build_opener()

#feeddata = opener.open(request).read()

print feeddata.decode('u8')

转载于:https://www.cnblogs.com/webRobot/p/5267978.html

你可能感兴趣的文章

POJ---2492 A Bug's Life[并查集]

查看>>

[BZOJ1195] [HNOI2006]最短母串

Jenkins-在windows上配置自动化部署（Jenkins+Gitblit）

查看>>

ng-if可见

查看>>

[AGC003]E - Sequential operations on Sequence

Python Matplotlib作图指南

关于<context:property-placeholder>的一个有趣现象

查看>>

XigmaNAS中virtualbox无法启动问题

查看>>

ServletContext实现转发和读取Properties配置文件

查看>>

My Brute HDU - 3315（KM || 费用流）

查看>>

RestTemplate 中文乱码解决方法

查看>>