机器翻译语料库大全(免费下)

分享时@该用户已经被封, 我就能回答你的问题奥!

文章目录
  1. 1. 数据格式
  2. 2. 关于这些语料的更多信息
  3. 3. 下面是不同语言的句子对

这是我从网上搜集的一些语料库, 主要是一些跨语言配对句子数据, 可以用于机器翻译的学习项目, 因为很多人缺少数据, 所以我在这里列出来, 希望对大家有帮助。这些语料可能不适合工业界, 更适合学习目的的项目。

数据格式

所有文件格式都一样, 每行都是句子1 tab 句子2, 例如:

1
2
Tom broke the window.	汤姆打破了窗户。
Tom checked the time. 汤姆看了看时间。

关于这些语料的更多信息

  • 我们网站的这一部分使用了Tatoeba项目的句子。 (阅读关于Tatoeba项目)
  • 我试图过滤掉可能令人反感并且不适合所有年龄和文化的句子。如果您发现应删除的内容,请在微博@该用户已经被封 向我发送“错误报告”。
  • 这些句子按长度排序,首先是最短的句子。

下面是不同语言的句子对