`
liyiwen007
  • 浏览: 107696 次
  • 性别: Icon_minigender_1
  • 来自: 武汉
社区版块
存档分类
最新评论

使用 Google API 进行翻译的 Python 小工具

阅读更多

因为能及时地完成这个小工具,全靠在网上找到一些代码来用,所以,也把自己完成的东西回馈给网络。:)

之前有这么一个小需求,要大量地翻译一些零散的句子,对于翻译的质量并不在意,直接采用翻译工具的结果就可以了。但是量很大,于是就想着用 Google 的翻译 API 来做。一开始想用 JavaScript 来写的,但由于只会 JavaScript 的对 Google 翻译 API 的异步调用方式,不知道如何才能进行批量的翻译。

于是决定用 Python 的来实现。先从网上抄了一些现成的代码(主要是参考这篇),但都不能正确地得到结果。由于稍微做了一些修改,使之能正常地运行得到翻译的结果,代码如下:

import urllib,urllib2   
from sgmllib import SGMLParser   
  
class URLLister(SGMLParser):   
    def __init__(self, result):   
        SGMLParser.__init__(self)   
        self.result = result   
        self.open = False  
    def start_div(self, attrs):   
        id = [v for k, v in attrs if k=='id']   
        if 'tts_button' in id:   
            self.open = True  
    def handle_data(self, text):   
        if self.open:   
            self.result.append(text)   
            self.open = False  
  
def Translate(text, f, t):   
    MySentence = []      
    values = {'hl':'zh-CN','ie':'UTF-8','text':text,'langpair':"%s|%s"%(f, t)}   
    url = 'http://translate.google.cn/translate_t'  
    data = urllib.urlencode(values)   
    req = urllib2.Request(url, data)   
    req.add_header('User-Agent', "Mozilla/4.0 (compatible; MSIE 6.0; Windows NT 5.1; SV1; .NET CLR 2.0.50727)")   
    response = urllib2.urlopen(req)   
    parser = URLLister(MySentence)   
    parser.feed(response.read())   
    parser.close()    
    return MySentence   
       
def TranlateForIgnorException(text):   
    excpCnt = 0  
    while 1:   
        try:   
            arStr = Translate(langStr, "en", "ar")[0]   
            break  
        except:   
            excpCnt = excpCnt + 1                       
            if excpCnt > 10:   
                break  
            time.sleep(2)   
    return arStr   
  
if __name__ == "__main__":   
    ArStr = TranlateForIgnorException("This")  

          

import urllib,urllib2
from sgmllib import SGMLParser

class URLLister(SGMLParser):
    def __init__(self, result):
        SGMLParser.__init__(self)
        self.result = result
        self.open = False
    def start_div(self, attrs):
        id = [v for k, v in attrs if k=='id']
        if 'tts_button' in id:
            self.open = True
    def handle_data(self, text):
        if self.open:
            self.result.append(text)
            self.open = False

def Translate(text, f, t):
    MySentence = []   
    values = {'hl':'zh-CN','ie':'UTF-8','text':text,'langpair':"%s|%s"%(f, t)}
    url = 'http://translate.google.cn/translate_t'
    data = urllib.urlencode(values)
    req = urllib2.Request(url, data)
    req.add_header('User-Agent', "Mozilla/4.0 (compatible; MSIE 6.0; Windows NT 5.1; SV1; .NET CLR 2.0.50727)")
    response = urllib2.urlopen(req)
    parser = URLLister(MySentence)
    parser.feed(response.read())
    parser.close() 
    return MySentence
    
def TranlateForIgnorException(text):
    excpCnt = 0
    while 1:
        try:
            arStr = Translate(langStr, "en", "ar")[0]
            break
        except:
            excpCnt = excpCnt + 1                    
            if excpCnt > 10:
                break
            time.sleep(2)
    return arStr

if __name__ == "__main__":
    ArStr = TranlateForIgnorException("This")

 

函数 Translate (第20行),是模拟浏览器向 google 发出 http 的请求。第一个参数是需要翻译的句子,第二、三个参数是原语言和目标语言,分别是一定预选定义好的字符串(英文是 "en",阿拉伯语是"ar",简体中文是'zh-CN'等),完整的定义在 Google 翻译 API 的文档中有描述。返回值是翻译后的字符串,是 UTF8 的编码。这个函数可以看成是同步的。

我在使用的时候,把要翻译的句子读入一个 list 中,然后依次进行翻译。连续调用的时候,很容易出现 http 506 错误的异常。我不知道如何正确地处理它,于是我用了另一个函数(第33行)TranlateForIgnorException ,当出现异常时就再进行一次翻译,直到翻译成功为止,或是,异常连续出现 10 次(因为有的句子无法进行翻译,比如,带有"http://"这样网址的字符串)。

另外一点需要说明的是,原来在网上抄的代码中,解析 html 文件得到翻译后字符串的部分有点问题,问题是在第 13 行代码处,原来的代码是以'result_box' 为标签时进行抽取,但我使用后发现不太对,于是把 google 发回的整个 html 文件存下来,查看后发现,翻译后文字是存在 'tts_button' 为 id 的 div 标签中的。所以我进行了修改,我不保证这个绝对正确,如果您发现有不对的地方,可以试着从这些看看。

 

本文来自CSDN博客,转载请标明出处:http://blog.csdn.net/liyiwen007/archive/2010/07/10/5726152.aspx

分享到:
评论

相关推荐

    Python库 | google_api_python_client-1.7.0-py2.py3-none-any.whl

    `google_api_python_client`是由Google官方提供的Python客户端库,用于与Google的各种API进行交互。这个库使得Python开发者能够轻松地访问和操作Google的云服务,包括但不限于Google Analytics、Google Calendar、...

    Python库 | google-api-python-client-1.0.tar.gz

    总之,`google-api-python-client`是一个强大的工具,它让Python开发者能够轻松地与Google的众多服务进行集成。无论你是开发Web应用、桌面应用还是脚本,这个库都能提供必要的支持。确保熟悉OAuth 2.0认证流程,并...

    基于GoogleAPI的翻译小程序的实现(二)

    总的来说,"基于GoogleAPI的翻译小程序的实现(二)"这篇博文提供了一个很好的起点,教你如何利用Google Translate API创建一个实用的翻译工具。通过学习和实践,你可以进一步扩展这个小程序,增加更多功能,例如语音...

    Python-APITranslationg各大翻译网站API集合

    在IT行业中,API(应用程序接口)是不同软件...通过这个项目,你可以深入学习到API的使用、Python编程技巧以及Web爬虫的实践,同时还能掌握多种翻译服务的集成,这对于开发多语言应用或者处理跨国数据具有重要意义。

    Python-一个用来翻译英文pdf论文的小工具

    总结来说,这个Python工具为翻译英文PDF论文提供了一种便捷的命令行解决方案,利用Python的PDF处理能力和翻译API,消除了换行符的干扰,提升了翻译体验。通过深入理解这个工具的工作原理,我们可以学习到Python在...

    google 翻译API的使用

    以下是一个简单的Python示例,演示如何使用`requests`库调用Google翻译API: ```python import requests def translate_text(text, src_lang, target_lang, api_key): url = ...

    Python-goLinux命令行使用谷歌搜索的Python工具

    4. **Google搜索API**:Python工具能够与Google搜索进行交互,意味着它可能使用了Google提供的搜索API。API(Application Programming Interface)允许不同的软件之间相互通信,此处可能涉及Google Custom Search ...

    Python-翻译PDF英文通过Python调取第三方库及接口进行翻译PDF文件

    Python中有一个叫做`googletrans`的库,它是Google Translate API的一个非官方客户端,可以方便地进行API调用。 安装`googletrans`库可以通过以下命令: ```bash pip install googletrans==4.0.0-rc1 ``` 接下来,...

    Python,通过Googlemap API获取地点信息

    在这个场景下,我们关注的是如何使用Python结合Google Maps API来获取特定地点的详细信息。Google Maps API是一个强大的工具,允许开发者集成地图功能到自己的应用程序中,包括搜索地点、获取地理位置坐标以及导航等...

    破解google翻译API

    Google Translate API 是谷歌提供的一款强大工具,它允许开发者集成谷歌的翻译能力到自己的应用或项目中,支持多种语言之间的自动翻译。然而,正如标题所提到的,“破解”Google翻译API通常是指寻找方法绕过其收费...

    Python实现自动翻译

    翻译功能的核心在于调用在线翻译API,例如Google Translate API或百度翻译API。这里以百度翻译API为例: ```python def baidu_translate(text): import requests appid = 'your_appid' secretKey = 'your_secret...

    量化投资以Python为工具_量化投资_python

    Python的`pandas`库是进行数据清洗、处理和分析的强大工具,能够高效地对金融时间序列数据进行操作。 2. **金融数据获取**:Python的`yfinance`、`pandas_datareader`和`Quandl`等库可以方便地从Yahoo Finance、...

    Python-Translator命令行聚合翻译工具支持谷歌必应有道百度词霸360

    【Python-Translator命令行聚合翻译工具支持谷歌必应有道百度词霸360】 Python-Translator是一款强大的命令行...通过学习和使用这个工具,不仅可以方便日常翻译需求,也能深入了解Python命令行工具的开发和API的使用。

    translate_PDF翻译_PDF翻译、python_pdfTranslate_

    标题“translate_PDF翻译_PDF翻译、python_pdfTranslate_”表明这是一个使用Python编程语言实现的PDF翻译工具,可能基于一个名为pdfTranslate的库或者模块。Python因其强大的文本处理能力,常被用于处理PDF文件。这...

    PyPI 官网下载 | google-api-python-client-stubs-0.3.1.tar.gz

    **google-api-python-client-stubs** 是一个Python库,专门用于与Google的API进行交互。它提供了客户端库的静态类型定义,帮助开发者使用Python的类型检查工具(如mypy)来增强代码的可读性和减少错误。这个库通常...

    谷歌api和英国地址案例

    在IT行业中,谷歌API(Google Application Programming Interface)是开发者广泛使用的工具,用于集成谷歌的各种服务,如地图、搜索、翻译等。在这个“谷歌API和英国地址案例”中,我们将探讨如何利用谷歌API来处理...

    python下载谷歌瓦片地图

    在Python编程领域,下载谷歌瓦片地图是一项常见的任务,尤其对于...通过`getmapreverse.py`,我们可以学习到如何利用Python工具来处理地理空间数据,这对于进行地理分析、地图可视化或其他与地图相关的项目都非常有用。

    基于Python的离线Google地图操作实现.pdf

    其中,Google提供的地图服务,包括Google Map、Google Earth和Google Sketchup等,极大地丰富了公众的地理信息认知,同时也为开发者提供了方便的API接口。 在测绘领域,利用Google Map提供的卫星影像和地形等离线...

    Python-V8Py使用V8引擎从JavaScript中调用PythonAPI

    要使用V8Py,首先需要确保你的系统上已经安装了V8引擎和Python的C++构建工具。你可以通过以下命令安装V8Py: ```bash pip install v8py ``` **创建Python API供JavaScript调用** 在Python中,我们可以定义一个函数...

    Python-CopyTranslatePaste是一个即时将您的输入剪切板中的文字进行翻译的一个工具

    这款基于Python的程序利用了强大的翻译API,如Google Translate或Microsoft Translator,使用户能够方便地在各种语言之间进行即时翻译,极大地提升了工作效率。 1. **Python编程基础**:该工具的基础是Python编程...

Global site tag (gtag.js) - Google Analytics