在全球化的大环境下,作为制造业大国,我国拥有世界最大规模的外贸出口企业。而作为开展外贸必不可少工具之一的网站,为了向海外各地提供本土化的服务,配置符合当地语言习惯的版本非常必要。但也面临翻译上的大难题,大多数中小企业可能并没有熟练掌握各种语言的人才,但又急于开展当地的业务,若招聘各种语言的员工必然会增加不少的开支,为公司运营带来更大的压力。于是,在线翻译API成了最好的选择之一。
能提供在线翻译的API有很多,比如国外的Google翻译,国内的百度翻译、有道翻译、阿里翻译等等。笔者有幸在一个网站项目中进行了实践,愿意将这些经验向大家进行分享。查看各翻译品牌的产品文档和技术文档后,最终选择了百度翻译API,并且获得了良好的效果,成功打通了13个(当然可以更多)语言版本的翻译,最终项目上线投入运营。本文重点就在网站中集成百度翻译API进行详细的分析。
在展开研究之前,先总结百度翻译API的一些特性,方便你为后续的决定做出初步的判断:
1、可翻译200多种语言,集成你需要翻译的语种即可;
2、企业认证后,每月免费翻译50万字符,超出部分按49元/百万字符计费;
3、支持纯文字翻译(通用文本翻译)、文章翻译(文档翻译),这两种在网站翻译中需要调用到;
4、百度翻译的结果可能并不十分完美,不及专业人工翻译,这是可以解理的;
百度翻译API的价格
通用文本翻译:每月免费翻译200万字符,超出部分按49元/百万字符计费。适用于纯文字翻译,提交的翻译内容不能带HTML标签,否则会将标签直接翻译出来。
文档翻译:每月免费翻译50万字符,超出部分按49元/百万字符计费。适用于文章翻译,可选择HTML翻译,即后面编辑器中的内容,可以带HTML标签,翻译结果中会原样输出HTML标签,从而不影响原内容的样式、排版等。
以上2种翻译API基本上可以覆盖网站翻译中的所有需求了,开发者可以根据项目需求搭配使用,从而实现最高的性价比。由于通用文本翻译的免费额度较大,所以,能用通用文本翻译的地方,尽量使用通用文本翻译,这样可以节省不少翻译成本。
省钱妙招:百度翻译API是通过提交的原始翻译内容字符数计费的,一个汉字、一个英文字母、一个标点符号、空格、换行等均记为一个字符。不难理解,从中文翻译成其他语种的性价比会高得多(几倍)。
百度翻译的结果与误差处理
就像中文一样,同一个词能够表达多个意思,同时也与对应语种的语法有些关系。所以,百度翻译API最终翻译出来的结果可能并不能让人满意,这完全可以理解,但可读性是很高的。因此,千万不要期待能获得专业翻译人士手工翻译的效果,需要有这个心理准备。如果不能容忍这种瑕疵,建议放弃自动在线翻译,转为使用人工翻译。
翻译结果的误差可以通过程序逻辑在一定程度上进行弥补和改进,例如某个专业名词在百度翻译结果中表现并不满意,这时可以建立本地的词语容错库,即对翻译出来的结果进行二次匹配处理,用你自定义的翻译词来替换翻译结果中出现的不那么正确的词。尽管仍然不可能达到十分完美的效果,但是在一定程度上能够有效缓解翻译结果误差的问题,最终将翻译结果保存到数据库。即使仍然不太满意,还可以进入对应版本,人工对该文章进行微调。
提示:尽管百度提供的自定义术语库,但笔者亲测仅支持中、英、日、韩四大语种,如果你需要的语种正好命中,可以使用术语库,从而使用翻译结果更精准。但笔者作为建站开发人员,需要面向不同需求的客户,这四种语言的术语库不能满足需求。所以,通过自定义翻译词的方式,建立本地的“术语库”完美解决了问题,提升了所有语种的翻译效果。
SEO问题
如果你重视SEO,那么上面提到的在线翻译API能够满足你的需求。或许你使用过Google翻译中的一个组件,它能集成在网站中,让用户能够切换各种语言从而在浏览器中获得对应翻译结果的网站。但有一个重大问题,它是通过JS实现的实时翻译结果,换句话说,翻译结果并不存在于你的网站数据库中,也就是说,这些翻译出来的内容在你的网站中是不存在的,只是临时翻译出来的。所以,搜索引擎无法找到这些翻译结果页面,也就无法收录了。然而,上面提到的方法,是将翻译结果保存到数据库中,是网站中实实在在的内容,有固定的独立页面,是可以被搜索引擎爬行、抓取和收录的。
通过调用百度翻译API获得翻译结果,再将翻译结果保存到数据库,前端生成固定的对应展示页面。是有利于SEO的。
本文大致讨论了百度翻译API在网站中的应用,比较粗浅,在实践的过程中,笔者也是踩过了不少的坑。更多的问题,期待与您探讨、研究。