Elija el plan que mejor se adapte a sus necesidades de la organización.

Nuestras opciones de precios flexibles se adaptan a los diferentes tamaños y requisitos de las empresas,
garantizando que tenga acceso al nivel adecuado de tecnología de anonimización de voz a un precio rentable.

Starter
Foundation
Lorem ipsum dolor sit amet, consectetur adipiscing elit, sed do eiusmod tempor
0/month

Data volume: 100h

Full integration support

Single Language

Non commercial use

<50 Agents
Basic
Lorem ipsum dolor sit amet, consectetur adipiscing elit, sed do eiusmod tempor
0/month

Data volume: 1 000h

Shared access to the API

Pre-built AI models

8h engineering support

Single Language

50 - 500 Agents
Premium
Lorem ipsum dolor sit amet, consectetur adipiscing elit, sed do eiusmod tempor
0/month

Data volume: 10 000h

Priority access to the API

Pre-built AI models

16h engineering support

Multiple Languages

Voice + Content

>500 Agents
Entreprise
Lorem ipsum dolor sit amet, consectetur adipiscing elit, sed do eiusmod tempor
0/month

Data volume: Unlimited

Fine-tuned AI models

Multiple Languages

Voice + Content

Pilot Package

€15,000 for up to 8,000 minutes (≈133 hours) of audio.


Includes:
Security & DPA onboarding, pipeline configuration, 1 calibration cycle, documentation of processing & deletion workflow, and gold-standard QC on a 1% sample.

Unit Rates

0 - 10k
€0.27/min
10k - 100k
€0.20/min
100k - 500k
€0.14/min
>500k
€0.10/min
Get Access

Get Access in 5 Simple Steps

1

Choose Your Mode

Decide whether you want to integrate via the API or use the Plugin for your workflow.

2

Sign Up & Activate Tokens

Sign up on the Nijta Admin Dashboard at voiceharbor.ai, then purchase or redeem trial anonymization tokens to get started.

3

Install & Connect

For Plugin: Download the plugin directly from your dashboard (currently available for Avid) and log in.
For API: Refer to the API documentation to connect your environment.

4

Anonymize

Upload files or process live sessions. Select speakers and customize voice attributes — age, gender, tone, expressiveness — then start anonymization.

5

Review & Publish

Preview your output and export broadcast-ready audio.

Preguntas frecuentes

Funcionalidad

¿Qué es la anonimización de voz?

Biometric anonymisation is the process of removing or altering the unique voice characteristics that can identify a person — such as vocal timbre, pitch patterns, rhythm, and other biometric markers. Instead of masking or distorting the audio, the voice is transformed into a new, natural-sounding voice that cannot be linked back to the original speaker.

This ensures that the content of the speech remains fully usable while the identity, privacy, and safety of the speaker are completely protected, meeting strict standards like non-linkability, non-singling-out, and non-inference.

¿Cuántos idiomas admite?

Nuestra plataforma admite más de 90 idiomas para la eliminación de contenido de identificación personal y 2 idiomas (inglés y francés) para la eliminación de información biométrica.

¿Qué formatos de archivo admiten?

Admitimos todos los formatos populares de audio y texto. Por favor, consulte nuestra documentación para obtener una lista de los formatos compatibles.

¿Funciona en tiempo real, por ejemplo, en streaming de audio?

Por ahora, nuestras soluciones no funcionan en tiempo real. Tenemos previsto lanzar la versión en tiempo real de nuestra solución antes del tercer trimestre de 2025.
Mini mode: < 0.5× real-time factor (RTF), Advanced mode: ~ 0.75× RTF.
Users who require streaming must implement their own streaming architecture, embedding API requests within their chosen workflow.

¿Funciona la anonimización para las voces de los niños?

No, nuestra solución no funciona con precisión para las voces de los niños. Esta es un área de investigación activa en Nijta y nos estamos asociando con renombrados proveedores de tecnología educativa para crear una solución sólida para las voces de los niños.

¿Podrían conservarse la edad y el sexo del hablante tras la anonimización?

Se puede controlar el género de las voces emitidas, pero no la edad. Estamos trabajando activamente para ofrecer la función de preservación de la edad.
This allows you to customise the target voice identity.

¿Podría conservarse la emoción original del orador tras la anonimización?

Hemos observado que la emoción original se degrada después de la anonimización, pero podría recuperarse ajustando el modelo de detección de emociones utilizando voces anónimas. Estamos trabajando en una técnica de anonimización que preservará la emoción original con alta fidelidad.

¿Podrían conservarse las señales no verbales, como el ritmo de habla, la pronunciación, la entonación, etc. del hablante original tras la anonimización?

Sí, estas señales no verbales se conservan en gran medida bajo ciertas condiciones. A veces notamos una pequeña degradación en la pronunciación.

¿La anonimización puede filtrar el lenguaje profano?

Esta es un área de investigación activa. Estamos trabajando con un grupo grande para filtrar el lenguaje profano en las llamadas en vivo.

Rendimiento

¿Cuál es la precisión de su solución?

According to the latest documentation (Version 4.0):

Speech Quality Accuracy

  • MOS (Mean Opinion Score): 4.15
    High naturalness and clarity in anonymised output.

Automatic Speech Recognition Accuracy

  • WER reduction:
    • Mini mode: −58%
    • Advanced mode: −62%
      Indicates improved intelligibility for downstream transcription.

Privacy / Biometric Anonymisation Metrics

  • Equal Error Rate (EER): 42%
  • UAR (Unweighted Average Recall): 38%
  • WER after anonymisation: 2.7

These metrics indicate strong degradation of speaker-identifiability while preserving speech intelligibility.

¿Cuál es el tiempo de procesamiento de su solución?

Processing speed depends on the anonymisation mode:In benchmark tests (e.g., a 5 min 49 sec multilingual audio with two speakers, diarisation + code-switch enabled), biometric anonymisation took ~8.35 minutes.

  1. Mini mode: < 0.5× RTF
  2. Advanced mode: ~ 0.75× RTF

¿Cuál es el tamaño máximo de los archivos de audio que se pueden enviar a la API?

The maximum allowed size is 10 MB. Files larger than this are rejected.

¿Cuántas solicitudes simultáneas podría procesar la API sin reducir el tiempo de procesamiento?

Up to 1 simultaneous request per user without performance degradation.

¿Puede el cliente ajustar los modelos alojados en su sitio?

No. Model fine-tuning is not supported, even for on-premise deployments.

Instalación

¿Funciona como SaaS o de forma local?

Ofrecemos soluciones SaaS y locales.

¿Cuáles son los requisitos computacionales para hospedar la solución local?

Minimum recommended configuration:

  • OS: Ubuntu 20.04 or later
  • RAM: 32 GB minimum
  • Disk: 100 GB minimum
  • GPU: Nvidia l40

¿Cuáles son las medidas concretas que se siguen para garantizar la seguridad de la solución SaaS?

Seguimos las medidas de cumplimiento de SOC2 para garantizar la seguridad de nuestra solución SaaS alojada. Por favor, consulte para obtener más información.

Más de 1 millón de grabaciones limpiadas hasta la fecha.
Nuestro objetivo es conseguir miles de millones.

Reserve una llamada
Reserve una llamada
Prueba Voice harbor gratis
Prueba Voice harbor gratis