Buscamos incorporar un profesional para participar en una iniciativa estratégica de Inteligencia Artificial Generativa enfocada en el desarrollo de capacidades de análisis semántico y agentes conversacionales. El proyecto tiene como objetivo transformar grandes volúmenes de información no estructurada proveniente de diversas fuentes, como chats, transcripciones de llamadas y registros CRM, en conocimiento accionable mediante el uso de tecnologías de IA Generativa, Large Language Models (LLMs), embeddings y arquitecturas RAG (Retrieval-Augmented Generation). La persona seleccionada participará en el diseño e implementación de soluciones que permitan mejorar la recuperación inteligente de información, la trazabilidad de respuestas y la experiencia de interacción conversacional. Principales Responsabilidades Diseñar e implementar soluciones de Ciencia de Datos e Inteligencia Artificial. Procesar, limpiar y transformar grandes volúmenes de datos provenientes de distintas fuentes. Desarrollar pipelines de datos para la automatización de procesos analíticos. Construir modelos predictivos, analíticos y de IA Generativa según las necesidades del negocio. Implementar soluciones basadas en Large Language Models (LLMs). Generar embeddings y trabajar con bases de datos vectoriales. Participar en la definición de arquitecturas de datos y analítica avanzada. Integrar distintas fuentes de información para generar modelos y automatizaciones. Colaborar con equipos de negocio para identificar oportunidades de uso de datos e inteligencia artificial. Documentar procesos, modelos y soluciones implementadas. Competencias Críticas (Excluyentes) Curado y limpieza de texto no estructurado proveniente de múltiples fuentes (chats, llamadas transcritas, registros CRM). Diseño de curado y limpieza de texto no estructurado para preparación de contenido destinado a modelos de lenguaje. Generación, gestión y versionado de embeddings. Implementación y administración de bases de datos vectoriales (ej. pgvector, Qdrant, Chroma, Weaviate, Pinecone, Milvus) y búsqueda híbrida. Construcción de pipelines RAG (Retrieval-Augmented Generation) completos, incluyendo evaluación y trazabilidad de respuestas. Integración con APIs de modelos de lenguaje (LLM), tanto en servidores propios/internos como proveedores externos (Anthropic, OpenAI, Azure OpenAI, Google Gemini), con diseño agnóstico al proveedor. Requisitos Técnicos Programación y Datos Python SQL PySpark Apache Spark Big Data Desarrollo de procesos ETL/ELT Manipulación y análisis de grandes volúmenes de datos Ciencia de Datos e IA Análisis exploratorio de datos Feature Engineering Evaluación y optimización de modelos Herramientas y Framework Bases de datos vectoriales (Pinecone, Weaviate, Chroma, Qdrant, Milvus o similares) Git Cloud Azure Servicios de almacenamiento y procesamiento de datos Conocimientos Deseables Experiencia en Microsoft Fabric #J-18808-Ljbffr

Senior Data Scientist – Genai & Rag (Latam)

BC TECNOLOGÍA

Empleos similares

Construcción De Invernadero Para Flores O Planta Ornamental

CRONOSHARE.COM.MX

Cotizaciones Para Construir Un Sótano Bajo Una Vivienda O Edificio

CRONOSHARE.COM.MX

Construcción De Invernadero Para Agricultura

CRONOSHARE.COM.MX

Construcción De Invernadero Para Agricultura

CRONOSHARE.COM.MX

Cotizaciones Para Construir Una Casa Con Sótano

CRONOSHARE.COM.MX

Construcción De Invernadero Para Rosas

CRONOSHARE.COM.MX

Construcción De Invernadero Para Agricultura

CRONOSHARE.COM.MX

Recibe empleos similares por e-mail