如何建立一个准确的翻译引擎?

我在几个月前找到了一个公式,我自己可以将任何源语言(计算机字符)翻译成目标(计算机字符)。 使用Lua(桌面用户)和C ++类(用于本地访问),以便我可以将它嵌入到Web浏览器等。我想知道如果我们已经有更好的东西在C ++或Lua中。

有时候我的语言真的没有正确地翻译语法,甚至没有规则,在构建它之前,我认为我会是一个最好的完成方式,但它现在已经走到很久了,恐怕它可能会变成错误的实现。 现在我想查看其他人并比较我的。

我使用谷歌翻译或其他不是我的目标,我正在建立一个翻译引擎(如谷歌或其他人),在那里有人可以放在那里字典和创建规则。

是否有任何现有的翻译框架或库(OpenCOG或Moses)将源语言转换为目的地? 例如:阿拉伯文到中文还是英文到日文? 或Google /其他人使用了什么?

任何建议,将不胜感激

提前致谢。


您是否看过Google译者工具包API? 通过分析它的各个方面,您可以了解它实现的内容以及开发自己的翻译框架所需要的内容(顺便说一下很多工作)。

创建/上传翻译文档

支持的源语言和目标语言的完整列表

http://www.leniel.net/2010/12/playing-google-translator-toolkit-api.html

更多到堆栈:

免费/开源机器翻译系统和工具

GNU gettext

TinyTM - 开源翻译记忆库


摩西是一个非常好的C ++开源翻译库。 cdec代表当前的艺术状态(但要求源语言和目标语言都使用上下文无关语法)。 两者都需要大量的训练数据,即平行语料库。

完成后,跑到你的大学并要求博士学位。


我讨厌劝阻你,但你正试图单手解决机器翻译的问题。 像Systran这样的MT系统已经由科学家和工程师团队开发了几十年了,但它们还很不完善。

链接地址: http://www.djcxy.com/p/95449.html

上一篇: How to build an accurate translation engine?

下一篇: Deadlock on key update