Choisissez le plan qui convient à votre les besoins de l'organisation.
Nos options de tarification flexibles répondent aux différentes tailles et exigences des entreprises, en vous garantissant l'accès au bon niveau de technologie d'anonymisation vocale à un prix rentable.
Data volume: 100h
Full integration support
Single Language
Non commercial use
Data volume: 1 000h
Shared access to the API
Pre-built AI models
8h engineering support
Single Language
Data volume: 10 000h
Priority access to the API
Pre-built AI models
16h engineering support
Multiple Languages
Voice + Content
Data volume: Unlimited
Fine-tuned AI models
Multiple Languages
Voice + Content



Pilot Package
Includes:
Security & DPA onboarding, pipeline configuration, 1 calibration cycle, documentation of processing & deletion workflow, and gold-standard QC on a 1% sample.
Unit Rates
Questions fréquemment posées
Fonctionnalité
Qu'est-ce que l'anonymisation vocale ?
Biometric anonymisation is the process of removing or altering the unique voice characteristics that can identify a person — such as vocal timbre, pitch patterns, rhythm, and other biometric markers. Instead of masking or distorting the audio, the voice is transformed into a new, natural-sounding voice that cannot be linked back to the original speaker.
This ensures that the content of the speech remains fully usable while the identity, privacy, and safety of the speaker are completely protected, meeting strict standards like non-linkability, non-singling-out, and non-inference.
Combien de langues prenez-vous en charge ?
Notre plateforme prend en charge plus de 90 langues pour la suppression du contenu personnellement identifiable et 2 langues (anglais et français) pour la suppression des informations biométriques.
Quels formats de fichiers prenez-vous en charge ?
Nous prenons en charge tous les formats audio et texte courants. Veuillez vous référer à notre documentation pour obtenir la liste des formats pris en charge.
Cela fonctionne-t-il en temps réel, par exemple pour le streaming audio ?
Pour l'instant, nos solutions ne fonctionnent pas en temps réel. Nous prévoyons de publier la version en temps réel de notre solution d'ici le troisième trimestre 2025.
Mini mode: < 0.5× real-time factor (RTF), Advanced mode: ~ 0.75× RTF.
Users who require streaming must implement their own streaming architecture, embedding API requests within their chosen workflow.
L'anonymisation fonctionne-t-elle pour les voix d'enfants ?
Non, notre solution ne fonctionne pas correctement pour les voix d'enfants. Il s'agit d'un domaine de recherche actif à Nijta et nous travaillons en partenariat avec des fournisseurs renommés de technologies de l'éducation pour créer une solution robuste pour les voix des enfants.
L'âge et le sexe du locuteur pourraient-ils être préservés après l'anonymisation ?
Le sexe des voix de sortie peut être contrôlé, mais pas l'âge. Nous travaillons activement pour fournir la fonction de préservation de l'âge.
This allows you to customise the target voice identity.
L'émotion initiale de l'orateur pourrait-elle être préservée après l'anonymisation ?
Nous avons observé que l'émotion d'origine est dégradée après l'anonymisation, mais elle peut être récupérée en affinant le modèle de détection des émotions à l'aide de voix anonymisées. Nous travaillons sur une technique d'anonymisation qui permettra de préserver l'émotion d'origine grâce à la haute fidélité.
Les indices non verbaux tels que le rythme de parole, la prononciation, l'intonation, etc. du locuteur d'origine pourraient-ils être préservés après l'anonymisation ?
Oui, ces signaux non verbaux sont largement préservés sous certaines conditions. On remarque parfois une légère dégradation de la prononciation.
L'anonymisation peut-elle filtrer le langage profane ?
Il s'agit d'un domaine de recherche actif. Nous travaillons avec un grand groupe pour filtrer le langage profane dans les appels en direct.
Rendement
Quelle est la précision de votre solution ?
According to the latest documentation (Version 4.0):
Speech Quality Accuracy
- MOS (Mean Opinion Score): 4.15
High naturalness and clarity in anonymised output.
Automatic Speech Recognition Accuracy
- WER reduction:
- Mini mode: −58%
- Advanced mode: −62%
Indicates improved intelligibility for downstream transcription.
Privacy / Biometric Anonymisation Metrics
- Equal Error Rate (EER): 42%
- UAR (Unweighted Average Recall): 38%
- WER after anonymisation: 2.7
These metrics indicate strong degradation of speaker-identifiability while preserving speech intelligibility.
Quel est le délai de traitement de votre solution ?
Processing speed depends on the anonymisation mode:In benchmark tests (e.g., a 5 min 49 sec multilingual audio with two speakers, diarisation + code-switch enabled), biometric anonymisation took ~8.35 minutes.
- Mini mode: < 0.5× RTF
- Advanced mode: ~ 0.75× RTF
Quelle est la taille maximale des fichiers audio pouvant être envoyés à l'API ?
The maximum allowed size is 10 MB. Files larger than this are rejected.
Combien de requêtes simultanées pourraient être traitées par l'API sans dégrader le temps de traitement ?
Up to 1 simultaneous request per user without performance degradation.
Le client peut-il affiner les modèles hébergés sur son site ?
No. Model fine-tuning is not supported, even for on-premise deployments.
Installation
Fonctionne-t-il en mode SaaS ou sur site ?
Nous proposons des solutions SaaS et sur site.
Quelles sont les exigences de calcul pour héberger la solution sur site ?
Minimum recommended configuration:
- OS: Ubuntu 20.04 or later
- RAM: 32 GB minimum
- Disk: 100 GB minimum
- GPU: Nvidia l40
Quelles sont les mesures concrètes suivies pour garantir la sécurité de la solution SaaS ?
Nous suivons les mesures de conformité SOC2 pour garantir la sécurité de notre solution SaaS hébergée. Veuillez vous référer à pour plus d'informations.