Modalidad · Soberanía de datos

IA en tu casa: ningún dato sale de tu empresa.

Cualquiera de los servicios de Fossil se puede entregar desplegado dentro de tu propia infraestructura, con modelos IA locales, sin llamadas a APIs externas. Control total sobre dónde están tus datos, quién los procesa y bajo qué reglas.

Por qué importa

La mayoría de soluciones IA del mercado funcionan llamando a APIs externas (OpenAI, Anthropic, Google, Azure). Esto es eficaz para muchos casos, pero tiene una contraindicación clara: cada documento, cada email, cada consulta que procesa la IA viaja a un servidor de un tercero, fuera de tu control.

Para algunas empresas esto es inaceptable: por sector (sanidad, legal, financiero, defensa), por requisitos de cliente (administraciones públicas, contratos confidenciales), por posición estratégica (no querer depender de un proveedor cloud) o simplemente por cultura. Para esas empresas, la única IA viable es la que corre dentro de su propia casa.

Cómo lo hacemos

Modelos open-source de calidad. Trabajamos con modelos LLM de código abierto (Llama, Mistral, Qwen, GLM, Gemma) que pueden desplegarse localmente y que en muchas tareas alcanzan calidad cercana o equivalente a los modelos comerciales. Elegimos el modelo adecuado para cada caso de uso.
Despliegue en tu infraestructura. Sobre tu hardware existente si tiene capacidad, o sobre máquinas dedicadas que dimensionamos contigo. Compatible con servidores físicos, VMs en tu cloud privada, o entornos Kubernetes.
Cero dependencia externa. Una vez desplegado, el sistema funciona sin conexión a internet si quieres. Las únicas llamadas externas son las que tú autorices (por ejemplo, para actualizar modelos cuando lo decidas).
Integración con tus sistemas existentes. El agente local se conecta a tus aplicaciones internas (ERP, base de datos, file servers, sistemas de identidad) como cualquier servicio interno más.

Qué te entregamos

Sistema completo desplegado en tu infraestructura, listo para operar.
Documentación operativa para que tu equipo de IT pueda gestionarlo.
Monitorización y alertas integradas con tus herramientas de observabilidad.
Plan de actualizaciones de modelos cuando aparezcan versiones mejores.
Soporte y mantenimiento los primeros meses, opcional después.
Transferencia de conocimiento a tu equipo para autonomía a largo plazo.

Para quién encaja

Sector legal: despachos y asesorías que manejan información confidencial de clientes y no pueden enviarla a terceros.
Sector sanitario: clínicas, hospitales y aseguradoras con datos clínicos sometidos a normativa especialmente estricta.
Sector financiero: entidades con datos personales y económicos sensibles, o con compliance que exige procesamiento local.
Defensa, seguridad y administraciones públicas: organizaciones donde la soberanía de datos es requisito.
Empresas industriales con know-how técnico que no quieren exponer a modelos comerciales.
Cualquier empresa que prefiera no depender de proveedores cloud externos por estrategia o cultura.

Hardware y dimensionamiento

Lo que necesitas en hardware depende del caso de uso, el volumen y la latencia esperada. Algunas referencias:

Casos pequeños y medios (asistente para un equipo de 50-100 personas, procesamiento documental moderado): un servidor con una GPU profesional de gama media-alta.
Casos grandes (volumen alto, varios servicios concurrentes, baja latencia): cluster con varias GPUs, normalmente reaprovechando hardware existente o sumando unidades.
Casos solo CPU: posible para muchos casos de uso si la latencia no es crítica y el volumen es moderado, usando modelos más ligeros optimizados.

En el diagnóstico inicial te decimos exactamente qué necesitas y por qué. Si tu hardware actual sirve, lo aprovechamos.

Limitaciones honestas

El despliegue local tiene ventajas claras (control, soberanía, sin coste por consulta) pero también limitaciones que merece la pena conocer:

Los modelos open-source son cada vez mejores, pero en algunas tareas muy complejas los modelos comerciales más punteros aún tienen ventaja. En el diagnóstico te decimos si tu caso requiere esa calidad o no.
El coste de hardware inicial existe. Para casos de volumen muy bajo, puede no compensar frente a una API externa.
Mantener modelos al día requiere actualizaciones periódicas, que se planifican.

Si tu caso encaja mejor con una solución cloud por economía o calidad, te lo decimos. No vendemos despliegue local porque sí.

Preguntas frecuentes

¿Pierdo calidad respecto a usar GPT-4 o Claude?

Depende del caso. Para clasificación, extracción de datos estructurados, resúmenes, búsqueda semántica y muchos casos conversacionales, los mejores modelos open-source actuales (Llama 3, Qwen, GLM, Mistral Large) están al nivel o muy cerca. Para tareas de razonamiento muy complejo o creativas avanzadas, todavía hay diferencia con los modelos comerciales punta. Lo evaluamos contra tu caso concreto.

¿Necesito un equipo de IT especializado para mantenerlo?

No es imprescindible si te encargamos el mantenimiento nosotros. Si quieres autonomía, basta con un perfil de IT/DevOps que sepa administrar Linux y Docker. Te formamos.

¿Puedo desconectarlo de internet completamente?

Sí. Una vez desplegado el sistema funciona en local. Las únicas conexiones externas son las que tú autorices explícitamente (por ejemplo, para descargar actualizaciones cuando lo decidas).

¿Qué pasa si más adelante quiero usar también modelos cloud?

Se puede mezclar. El sistema admite enrutar ciertos casos a modelos locales (sensibles) y otros a modelos cloud (no sensibles, donde necesites más calidad). Tú decides la política de enrutamiento.

¿Cuánto cuesta?

Hay coste de hardware (si no lo tienes) y coste de despliegue/integración (nuestros honorarios). El coste recurrente es muy bajo: no pagas por consulta. En proyectos de volumen medio-alto, el modelo local sale rentable rápidamente frente a APIs.

Hablemos de tu caso

Última actualización: 1 de mayo de 2026.