SERVICES D’ANNOTATION ET DE TRANSCRIPTION
TRANSPERFECT DATAFORCE

Les annotations permettent d’ajouter des marquages pertinents aux données afin qu’elles puissent être utilisées comme moyen d’apprentissage par différents systèmes. Il est essentiel que les données soient structurées de la bonne manière pour qu’elles puissent être utilisées à des fins d’apprentissage machine. Il existe de nombreux types de tâches d’annotation, adaptées aux besoins de chaque projet. Les tâches d’annotation linguistique comprennent l’annotation morphosyntaxique, le marquage des différentes parties d’un discours, l’annotation d’entités désignées et bien d’autres tâches.

Si le traitement du langage naturel (TLN) est basé sur un apprentissage supervisé, il est indispensable que les données soient annotées. Par exemple :

Un assistant virtuel tenant une conversation en assurant un suivi des usages anaphoriques (p. ex., les pronoms faisant référence à un autre élément du texte).

Un système d’extraction de données analysant le texte pour extraire les informations les plus importantes pour le projet.

Un outil de résumé de textes utilisé pour éliminer les parties négligeables d’un texte dans le but d’extraire les informations importantes sous une forme plus concise.

 

La transcription consiste essentiellement à associer le texte parlé à sa forme écrite. La transcription peut comprendre, en soi, des annotations linguistiques (sons humains appartenant à une langue) et non-linguistiques (sons non humains ou autres sons, tels que le bruit d’une voiture qui passe ou le souffle du vent).

Les transcriptions sont souvent utilisées pour améliorer les systèmes de reconnaissance vocale automatique, eux-mêmes utilisés pour transcrire automatiquement ce qu’un utilisateur dit lorsqu’il se sert d’un appareil. La transcription est la première étape du traitement des données orales puisqu’une fois qu’elles sont converties dans leur forme écrite, d’autres tâches de TLN peuvent être appliquées au texte.

Aussi bien dans le cadre des tâches d’annotation que dans celui des tâches de transcription, TransPerfect DataForce applique une stratégie simple et efficace. Après avoir défini les exigences applicables et décidé du flux de travail, DataForce mène un projet pilote et partage les résultats avec le client. Une fois l’approbation du client obtenue, le projet complet est lancé.

 

DataForce compte plus de 350 000 collaborateurs dans le monde entier et d’experts linguistes dans plus de 200 langues. DataForce dispose de sa propre plateforme, mais elle peut également utiliser les outils de clients ou de tiers. Ainsi, vos données sont toujours sous contrôle.