首页排行书库全本搜索轨迹

科技入侵现代最新章节 - 鸦的碎碎念 - 格格党

百书库
网游小说
科技入侵现代最新章节 - 鸦的碎碎念 - 格格党
第148章你们能比我更懂机器翻译（5k）

第148章你们能比我更懂机器翻译（5k）

上一页目录加书签下一页

/p>

另外三点则由乔治敦大学的成员们负责。

我们先来谈优化算法和规则设计。

你们一直的问题在于，你们对于规则集的扩张没有引入更加细化的句法规则。

因为存储有限，你们觉得扩充对照词汇库就够了。

实际上句法规则显得更加重要。

你们需要做到，引进常见的高频句型。

对上下文进行依赖处理。使词汇翻译考虑前后词，通过有限的上下文窗口来减少歧义。

比如свет同时有光和世界的意思。

这个完全可以根据前词判断是光还是世界。」

沃森弱弱提醒道：「教授，你还会俄语啊？」

林燃一副理所当然的样子：「当然，我都和科罗廖夫见了两面，我不会俄语怎麽和他交流的？

我同时会俄语丶德语丶英语和汉语。」

多语言大师的身份，给林燃的理论增添了几分可信度。

在这个时代，科学家们会几门语言并不奇怪。

当然一些敏感部门会提高对你的怀疑。

以前面提到的约翰·麦卡锡为例，他就精通俄语，从小接受俄语教育长大，尽管他出生在阿美莉卡。

「另外翻译过程，应该是模块化设计，而不是简单的映射关系。

它应该分成预处理丶翻译丶后处理三部分。

预处理包括了分词和词形还原，翻译才是词典的映射，后处理是对语序进行调整。

这样来降低单次计算的复杂度，提高规则的复用率！」

林燃的话给了在座研究团队的成员们非常多的灵感。

就好像之前一直陷在百越的丛林里找不到出路，而现在天上出现一道光指引他们怎麽样才能走出丛林迷宫。

大家都有点迫不及待去尝试了。

所有研究人员都疯狂在笔记本上记录下林燃所说的。

虽然不确定教授的方法是否管用，但有路总比之前没有好。

再者，如果你不好好记下来，到时候被开除只是教授一句话的事。

「好了刚才我们讲了一些简单的内容，现在才是最难的。

因为IBM的机器不是那麽强大，我们只能引入一些比较简单的统计学方法来提高我们翻译的准确度。

我把它叫做基于频率的词对齐。

这也是我们引入统计模型的核。

我们先要手动分析

本章未完，请点击下一页继续阅读！第2页 / 共7页

上一页目录加书签下一页

相关小说

苟在初圣魔门当人材最新章节 - 鹤守月满池 - 格格党

网游 /

苟在初圣魔门当人材最新章节 - 鹤守月满池 - 格格党: 鹤守月满池; 1068980字05-12

异度旅社

网游 /

异度旅社: 远瞳; 在日常之下,在理性尽头,在你所熟悉的世界之外——是你从未想象过的风景。当于生第一...; 2164880字08-13

重生2013：超级科技帝国

网游 /

重生2013：超级科技帝国: 昭灵驷玉; 重生2013：超级科技帝国是昭灵驷玉的经典科幻小说类作品,重生2013：超级科技帝国主...; 486202字08-22

神明调查报告

网游 /

神明调查报告: 黑山老鬼; 神明调查报告是黑山老鬼的经典科幻小说类作品,神明调查报告主要讲述了：一场来自过...; 522921字08-24

时空之头号玩家

网游 /

时空之头号玩家: 风上忍; 时空之头号玩家最新章节由网友风上忍提供,《时空之头号玩家》免费全文阅读情节跌宕...; 4513211字06-20

吞噬星空2起源大陆最新章节 - 我吃西红柿 - 格格党

网游 /

吞噬星空2起源大陆最新章节 - 我吃西红柿 - 格格党: 我吃西红柿; 1801682字08-23