Job Description
Estamos construyendo algo que todavía no existe en Latinoamérica.
No podemos darte todos los detalles todavía (startup life), pero sí podemos prometerte esto: es IA de frontera, texto en español, un problema real con clientes reales esperando, y un equipo pequeño donde tu trabajo importa de verdad.
Buscamos al ingeniero que quiera construir el pipeline completo — desde el corpus hasta el modelo cuantizado corriendo en hardware propietario — sin un jefe de producto diciéndote en cada sprint qué significa done.
Lo que construirás
Pipeline de datos en español a escala: limpieza real, tokenización, deduplicación
Continual Pre-Training sobre modelo base open-source en GPUs dedicadas (ya las tenemos)
Fine-tuning supervisado: SFT con Lo RA/QLo RA, Hugging Face + TRL
Pipeline RLHF/DPO con anotadores de dominio
Cuantización para deployment on-premise: GGUF, MLX
RAG sobre PostgreSQL + pgvector
Suite de evaluación y monitoreo de calidad
Necesitamos q...