打字幕本身是个累人的技术活，如今点几下鼠标就搞定了-古次元

大家好我是T哥。

曾经，有个叫“字幕组”的东西，听起来他们干的活很简单，就是给视频加上字幕，实际上，以前给视频加字幕，跟如今比起来，就是一个技术活。你得会字幕软件，得会时间轴。而早期的字幕软件，即便是图形化的界面，我接触过，没有教程是完全不懂的…自己瞎摸索，也摸索不懂到底怎么折腾。

而如今的字幕软件，同样是图形界面，真正做到了傻瓜式的操作，我自己摸索了10分钟，已经会从嵌入文本到顺利出产字幕的全过程，简单方便易懂。

但是，在那个时候，并不是说精通了字幕软件的操作，就可以让效率事半功倍了。就算你精通字幕软件，一样需要一句话一句话的对轴，这是没有任何捷径可走的，因为你对轴的是视频的内容，也就是语音，你打的字幕和语音没办法靠着某种捷径关联，不如说打字幕本身就是这个对齐的过程，所以可以说是相当费时了。我自己制作视频，所以知道其中的痛苦。如果制作一个5分钟左右的解说视频，可以说有30分钟甚至更久的时间是花费在对齐字幕和时间轴的过程中。如果是填满1个小时30分钟的剧场版动画的字幕，加上校正，那的确是一个费时费力的工程。

而如今的字幕软件，结合了AI语音识别的功能，也就是说，把视频的内容中，声音的部分，和你的文本的部分打通了……把对齐字幕时间轴这个事情完全自动化完成。这就让我目瞪口呆了。也就是说，如今的字幕软件，只需要你嵌入已经写好的文本，利用语音识别，就能完成。原本需要一条条对轴的事情，现在，点几下鼠标就完成了。这大大节省了制作字幕的时间。

而且我试了，识别对轴的准确率非常高，基本只需要做一下轻微的调整，就能完成字幕的制作。看到这里我自己都傻了，都不知道为什么以前要花这么多时间在视频字幕的制作上……

不过你也肯定想问了，这个语音识别岂不是只能应用于语音和文本是同一国的语言情况下，才能对齐语音和文本的时间轴？话是没错，但这个软件ARCTIME PRO甚至还整合了翻译机的功能。比如说，有一段日文的内容，你想做翻译的字幕，它可以自动识别日语的语音，然后自动生成日文的字幕，再用机翻完成翻译。当然你会说，如今的机翻还是没有人工翻译这么流畅和准确，但我觉得机翻这个功能还是有使用场景的。如果语法特别正式，例如产品发布会、新闻报道等场合，用到的一些标准的词汇，那么机翻再稍加修饰基本就是可用的状态。而且随着机翻功能的迭代，它的效果一定会越来越好。

当然，这是机翻的不够成熟的导致的，而不是语音识别的或者说逻辑上的不合理导致的，目前的AI辅助字幕软件，我觉得已经消灭了字幕软件能想得到的所有痛点，并且给了你想要的一切功能……曾经在打字幕这件事上觉得备受折腾的我，此时泪流满面。

字幕软件的AI化辅助，是我最近在生活中对于AI改变生活的强感知。以前可能需要一支团队来完成的字幕注入，现在可能只需要翻译一个人就能操作。大幅节省了人员和时间成本的投入。

还有刚才提到的机翻。

以上是我用的机翻软件，Deep L2，以前的机翻给人的印象就是，填词造句生硬，甚至狗屁不通，但如今的机翻，我说了，只要有合适的场景，它就可以获得理想的效果，我用机翻去外文网站学习，和老外用英文进行交流，即便是硬核话题也可以做到互相理解。其实我自己也不知道我说的对不对，但从上下文来看，我觉得老外们肯定是读懂了我的意思…我有日语基础，也可以确信我和日本人用机翻可以顺利地沟通…我觉得这个世界都因为这些技术的跃腾，变得越来越近，没有距离。

AI技术的迭代，给生活带来的是飞跃式的递进。再打个比方，寄快递，或者说X宝发货，每次都要填写繁琐的姓名、地址、电话的信息，非常麻烦。如今的AI填写，你只需要把这些信息一股脑粘贴上去，AI算法会帮你自动填写到姓名栏、地址栏、城市、电话号码的不同栏目中，你需要做的只是确认一下信息就可以顺利下单。这种技术的应用大幅提升了发快递的体验，真的是“一键完成”。

AI技术的如此快速的发展，很多事情都是2-3年前都想不到的。AI技术大幅节约了人们的劳动时间，提升了劳动效率。但也会有人担心，照这个发展的速度，AI全面替代人们繁琐的劳动，社会的结构是否也会发生改变？我觉得，这事情还是留给布局的人们去思考，我们即便胡思乱想，也改变不了这个趋势，所以，享受AI带来的便利就是我们需要做的。

文章版权归作者所有，未经允许请勿转载。

THE END