注释和转录服务
TRANSPERFECT DATAFORCE

注释为数据添加了有意义的标签,是可供各种系统学习的一种手段。正确地构造数据以使其可用于机器学习至关重要。注释任务类型多种多样,具体取决于项目需求。语言注释任务包括语态语法

如果自然语言处理基于监督学习,则带注释/标签的数据至关重要。简单的例子包括:

虚拟助手通过跟踪首语重复用法来掌握对话(例如,代词指代文本中的其他内容)。

数据提取系统扫描文本以检索项目的最重要信息。

文本摘要工具可以剔除文本的不重要部分,从而以更简洁的方式收集重要信息。

 

转录本质上是用书面形式标记口头文字。转录本身可以包含语言(属于某种语言的人声)和非语言(非人声或其他声音,例如汽车经过或吹口哨的声音)注释。

转录通常用于改进自动语音识别系统。该系统用于自动转录用户在使用设备时所说的内容。转录是处理口头数据的第一步,一旦成功将其转换为书面形式,便可以将其他NLP任务应用于文本。

对于注释和转录任务,TransPerfect DataForce遵循简单有效的策略。在定义需求并确定工作流程之后,DataForce会进行内部先行测试并与客户共享结果。经客户批准后,启动全面项目。

 

DataForce在全球拥有超过350,000位合作者和200多种语言的语言专家。DataForce为其自身搭建平台,但也可以使用客户或第三方的工具。这样一来,您的数据尽在掌控。