1097172.png

kaixuan

关于AI机翻和人的参与作用的一点不成熟的观点

权当抛砖引玉了。
楼主有一些创意性的想法,思路是能否利用当下AI的api比机翻api更便宜的特点,让AI以创意性的方式完成多次处理以优化译文和总结参考性材料,最终有益于人对机翻的优化和分析。
  • 1.总结文本块——将要翻译的文本拆成一个个文本块,并让AI总结其中的内容
  • 2.识别人物(主角、路人……)——确认出文本块中有谁在说话和发言,这一步可以在前一步附加做到或者在一些有人名提示的时候单独程序摘出
  • 3.用语注释——对文本块中的固定翻译参考用程序添加,比如张酱(小张)
  • 4.让AI翻译文本块的同时参考前后文本块的总结以考虑上下文,参考人物所设定的不同的翻译语气,参考习惯翻译用法(在这一步可以比如单独翻译某某人物和旁白,在口语化和书面化上做出差异)
  • 5.让AI对原句进行语法、构句、语气分析
  • 6.对文本进行词语、文本替换
  • 7.让AI进行概念、名词注释和提出一些文采上的建议
  • 8.让人进行最终的审定和修改后,文本返回文本块在这些过程中可以做到多次摘用网络搜索进行注释,抓取机翻让AI将机翻和自己的翻译进行打分和参考性修改
这样一套流程下来,虽然看起来很麻烦,但是搭建完后人还是只需要面对很有限的工作的
楼主虽然有过一些翻译经验和试用AI的经验,但这些想法确实并未经过深入实践和良好检验,只是将一些处理文字中的个人设想试图整合,重点是希望各位多给建议,让这不成熟的想法能或在各位的指点下得到改进,或引来前辈高人愿分享己见,那楼主将实在感激不尽。
如果这些想法听来太过幼稚,那实在抱歉。

1097172.png

kaixuan

我的核心观点是能不能让AI进行多次处理
1.总结前后文
2.总结语气风格
3.进行名词注释
4.参考前后文、语气风格、名词注释、发言人进行翻译
5.抓取机翻让AI进行参考机翻后的翻译
6.在替换名词文本后让AI写一些概念的注释
这样会比单纯一句句翻效果好,而且AI现在便宜到成本几乎可以忽略不计

1358012.jpg

今夕是何年

B2F  2023-03-15 14:24
(你想知道生命的意义吗)
加1,现在汉化实在太费时费力了,大佬这个说的应该就是让ai在翻译这方面强化学习,感觉个人搞整合确实难了,但是感觉chatgpt自己会搞,微软本身就有翻译服务,应该会搞这方面的强化的

780603.jpg

driftwave

B3F  2023-03-15 16:09
(vimplus)
如果按照你的设想做的话,调用 api 的成本会暴增。你的设想中要大量涉及传递上下文和复杂化的prompt,gpt-3.5-turbo 很难在长上下文场景下遵守一个复杂 prompt 的约束,这样得到的结果可能会和你的设想差别较大,费用也比较高。对话场景还好,如果是长文本翻译的话就要很多人工介入了。

gpt-4 基于 zero shot 提高了 system role 下 prompt 的约束,而且支持更长的上下文,对于实现你这些设想有很大帮助。但是带来了一个更大的问题,就是 api 价格暴涨

780603.jpg

driftwave

B4F  2023-03-15 16:11
(vimplus)
你看现在 GitHub 上 star 比较多的几个 chatgpt 的翻译项目,为了节约 token,他们的 prompt 都很精简,上下文更是会传。