中间件_mq消息队列使用_稳定性好

小七 2019年10月25日 21:23 141 0

训练自定义语言模型的新方法-毫不费力！

Video Indexer（VI）是Azure媒体服务的AI服务，它允许客户上传属于其特定用例词汇表的句子或单词示例，从而实现语言模型的定制。由于语音识别有时会很棘手，因此VI使您能够针对特定领域训练和调整模型。利用此功能，组织可以提高视频索引器在其帐户中生成的转录的准确性。在过去的几个月里，我们进行了一系列的改进，使这个定制过程更加有效和容易完成。增强功能包括自动捕获手动或通过API完成的任何文本编辑，以及允许客户添加封闭式字幕文件，以进一步培训其自定义语言模型。这些添加的思想是创建一个反馈循环，在这个循环中，组织从一个现成的基本语言模型开始，并在一段时间内通过手动编辑和其他资源逐步提高其准确性，最终得到一个以最小努力微调到其需求的模型。帐户的自定义语言模型和此博客共享的所有增强功能都是私有的，不在帐户之间共享。在下面的部分中，我将深入了解实现这一点的不同方法。使用脚本更新改进自定义语言模型一旦视频在VI中被编入索引，客户就可以使用视频索引器门户对视频的自动转录进行手动编辑和修复。这可以通过单击视频时间线窗格右上角的编辑按钮移动到编辑模式，然后简单地更新文本，如下图所示。这些变化反映在文本中，从文本编辑捕获到文本文件中，并自动插入到用于为视频编制索引的语言模型中。如果尚未使用客户语言模型，则更新将添加到在帐户中创建的新帐户适应语言模型中。您可以管理帐户中的语言模型，并通过转到VI网站的内容模型定制页面中的语言选项卡来查看源脚本编辑文件。打开其中一个From transcript edits文件后，您可以查看手动更新创建的新旧句子，以及它们之间的差异，如下所示。剩下要做的就是单击Train，用最新的更改更新语言模型。从那时起，这些变化将反映在未来使用该模型编制索引的所有视频中。当然，您不必使用门户来训练模型，同样可以通过Video Indexer train language model API来完成。使用API可以打开新的可能性，例如允许您自动执行重复的培训过程，以利用正在进行的更新。还有一个更新视频脚本API，允许客户通过上传包含更新的VTT文件来更新其帐户中视频的整个脚本。作为新功能增强的一部分，当客户使用此API时，Video Indexer还会添加客户自动上传到相关自定义模型的脚本，以便将内容用作培训材料。例如，为一个名为"教父"的视频调用update video transcript将得到一个名为"教父"的新脚本文件，该文件是用于索引该视频的自定义语言模型。使用闭路字幕文件改进自定义语言模型另一种快速有效地训练定制语言模型的方法是利用现有的隐藏字幕文件作为培训材料。这可以手动完成，方法是将新的闭路字幕文件上载到门户网站中的现有模型，如下图所示，或使用"创建语言模型"和"更新语言模型"API上载VTT、SRT或TTML文件（类似于到目前为止使用TXT文件所做的操作）一旦上传，VI会清理文件中的所有元数据，并将其分解为文本本身。您可以在下表中看到before和after结果。类型以前之后电压互感器注：置信度：0.89163500:00:02.620-->00:00:05.080但你不喜欢早上10点之前开会。但你不喜欢早上10点之前开会。SRT公司200:00:02620-->00:00:05080但你不喜欢早上10点之前开会。但你不喜欢早上10点之前开会。TTML

但你不喜欢在上午10点之前开会

但你不喜欢早上10点之前开会。从那时起，剩下要做的就是检查对模型的添加，然后单击Train或使用Train语言模型API来更新模型。下一步行动自定义语言模型培训流程的新增功能使您和您的组织能够轻松轻松地获得更准确的转录结果。现在，您可以使用我们刚刚讨论过的任何一种方法，将数据添加到您的自定义语言模型中，以便在下次为您的视频编制索引时获得更准确的结果。有问题或反馈？我们很想听到你的消息！使用我们的UserVoice页面来帮助我们区分功能的优先级，或者电子邮件VISupport@Microsoft.com任何问题。

本文地址： /ziyuan/1507.html