Estamos construyendo algo que todavía no existe en Latinoamérica. No podemos darte todos los detalles todavía (startup life), pero sí podemos prometerte esto: es IA de frontera, texto en español, un problema real con clientes reales esperando, y un equipo pequeño donde tu trabajo importa de verdad. Buscamos al ingeniero que quiera construir el pipeline completo — desde el corpus hasta el modelo cuantizado corriendo en hardware propietario — sin un jefe de producto diciéndote en cada sprint qué significa \"done\". ────────────────────────── LO QUE CONSTRUIRÁS ────────────────────────── → Pipeline de datos en español a escala: limpieza real, tokenización, deduplicación → Continual Pre-Training sobre modelo base open-source en GPUs dedicadas (ya las tenemos) → Fine-tuning supervisado: SFT con LoRA/QLoRA, HuggingFace + TRL → Pipeline RLHF/DPO con anotadores de dominio → Cuantización para deployment on-premise: GGUF, MLX → RAG sobre PostgreSQL + pgvector → Suite de evaluación y monitoreo de calidad ────────────────────────── ✅ NECESITAMOS QUE SEPAS ────────────────────────── Indispensable: → Python avanzado → PyTorch + HuggingFace Transformers (experiencia real) → Fine-tuning de LLMs: SFT, LoRA, QLoRA → Linux en línea de comandos → Datasets a escala: ETL, tokenización, pipelines → Español nativo o C2 Deseable (bonus points): → MLX / Apple Silicon → RLHF, DPO, Reward Modeling → Unsloth, DeepSpeed, FSDP → Cuantización: GGUF, GPTQ, AWQ → pgvector, llama.cpp, Ollama ────────────────────────── LO QUE OFRECEMOS ────────────────────────── Sueldo competitivo ️ Hardware dedicado: GPUs reales, no tu laptop