Buscamos incorporar un profesional para participar en una iniciativa estratégica de Inteligencia Artificial Generativa enfocada en el desarrollo de capacidades de análisis semántico y agentes conversacionales. El proyecto tiene como objetivo transformar grandes volúmenes de información no estructurada proveniente de diversas fuentes, como chats, transcripciones de llamadas y registros CRM, en conocimiento accionable mediante el uso de tecnologías de IA Generativa, Large Language Models (LLMs), embeddings y arquitecturas RAG (Retrieval-Augmented Generation). La persona seleccionada participará en el diseño e implementación de soluciones que permitan mejorar la recuperación inteligente de información, la trazabilidad de respuestas y la experiencia de interacción conversacional. Principales Responsabilidades Diseñar e implementar soluciones de Ciencia de Datos e Inteligencia Artificial. Procesar, limpiar y transformar grandes volúmenes de datos provenientes de distintas fuentes. Desarrollar pipelines de datos para la automatización de procesos analíticos. Construir modelos predictivos, analíticos y de IA Generativa según las necesidades del negocio. Implementar soluciones basadas en Large Language Models (LLMs). Generar embeddings y trabajar con bases de datos vectoriales. Participar en la definición de arquitecturas de datos y analítica avanzada. Integrar distintas fuentes de información para generar modelos y automatizaciones. Colaborar con equipos de negocio para identificar oportunidades de uso de datos e inteligencia artificial. Documentar procesos, modelos y soluciones implementadas. Competencias Críticas (Excluyentes) Curado y limpieza de texto no estructurado proveniente de múltiples fuentes (chats, llamadas transcritas, registros CRM). Diseño de curado y limpieza de texto no estructurado para preparación de contenido destinado a modelos de lenguaje. Generación, gestión y versionado de embeddings. Implementación y administración de bases de datos vectoriales (ej. pgvector, Qdrant, Chroma, Weaviate, Pinecone, Milvus) y búsqueda híbrida. Construcción de pipelines RAG (Retrieval-Augmented Generation) completos, incluyendo evaluación y trazabilidad de respuestas. Integración con APIs de modelos de lenguaje (LLM), tanto en servidores propios/internos como proveedores externos (Anthropic, OpenAI, Azure OpenAI, Google Gemini), con diseño agnóstico al proveedor. Requisitos Técnicos Programación y Datos Python SQL PySpark Apache Spark Big Data Desarrollo de procesos ETL/ELT Manipulación y análisis de grandes volúmenes de datos Ciencia de Datos e IA Análisis exploratorio de datos Feature Engineering Evaluación y optimización de modelos Herramientas y Framework Bases de datos vectoriales (Pinecone, Weaviate, Chroma, Qdrant, Milvus o similares) Git Cloud Azure Servicios de almacenamiento y procesamiento de datos Conocimientos Deseables Experiencia en Microsoft Fabric #J-18808-Ljbffr
Senior Data Scientist – Genai & Rag (Latam)
BC TECNOLOGÍA
Ciudad De México, Ciudad De México
Publicado hace 11 días
Denunciar empleo