2026-05-15

Azure AI Foundry: la plataforma de Microsoft para construir aplicaciones con IA

Aprende a usar Azure AI Foundry para desplegar modelos, diseñar prompts, construir un flujo RAG y evaluar tu aplicación de IA con un caso práctico paso a paso.

Si quieres construir aplicaciones con inteligencia artificial en entornos empresariales, Azure AI Foundry es el punto de partida en el ecosistema Microsoft.

En este artículo vamos a recorrer la plataforma con enfoque aprender haciendo: desde entender sus componentes hasta construir un flujo real de preguntas y respuestas sobre documentos propios.

¿Qué es Azure AI Foundry?

Azure AI Foundry (antes conocido como Azure AI Studio) es la plataforma unificada de Microsoft para diseñar, desplegar y operar aplicaciones de inteligencia artificial generativa.

Centraliza en un solo lugar:

Acceso al catálogo de modelos (GPT-4o, Phi, Llama, Mistral y más).
Herramientas de ingeniería de prompts y evaluación.
Gestión de conexiones con datos, búsqueda y servicios cognitivos.
SDK para integrar todo en tu código.

No es solo una interfaz para llamar a un modelo. Es una capa completa para construir, medir y mantener aplicaciones de IA en producción.

Componentes principales

Proyectos y hubs

La unidad de trabajo en Foundry es el proyecto. Un proyecto agrupa modelos, conexiones, despliegues y evaluaciones.

Los proyectos viven dentro de un hub, que gestiona la infraestructura compartida: red virtual, almacenamiento, identidades y políticas de seguridad.

Esta separación permite que múltiples equipos trabajen con diferentes proyectos sobre una misma infraestructura controlada.

Catálogo de modelos

Foundry da acceso a modelos de distintos proveedores desde un solo lugar:

Azure OpenAI: GPT-4o, GPT-4o mini, o1, text-embedding-3-large.
Modelos open source: Llama 3, Mistral, Phi-3/4, Cohere Command R+.
Modelos especializados: para visión, audio, código y documentos.

Puedes comparar capacidades, explorar ejemplos y desplegar con un par de clics antes de escribir una sola línea de código.

Despliegues

Una vez que eliges un modelo, creas un despliegue: un endpoint HTTP con nombre, versión y cuota asignada.

Desde ese despliegue puedes llamar al modelo vía API, ajustar parámetros de inferencia y controlar el acceso con claves o identidades gestionadas.

Azure AI Search como memoria externa

Para aplicaciones que necesitan responder sobre documentos propios, Foundry se integra nativamente con Azure AI Search.

El patrón es RAG (Retrieval-Augmented Generation):

[Pregunta del usuario]
         |
         v
[Azure AI Search]
  - Busca en tu base de documentos
  - Devuelve fragmentos relevantes
         |
         v
[Modelo de lenguaje (GPT-4o, etc.)]
  - Recibe la pregunta + fragmentos
  - Genera respuesta basada en tu contenido
         |
         v
[Respuesta fundamentada en tus datos]

Esto evita que el modelo "invente" respuestas y garantiza que la información provenga de fuentes verificadas.

Caso práctico: preguntas y respuestas sobre documentos internos

Vamos a construir una aplicación que permita hacer preguntas sobre documentos de una empresa usando el SDK de Azure AI Foundry.

Paso 1: instalar el SDK

pip install azure-ai-projects azure-ai-inference azure-identity openai

Paso 2: conectar con el proyecto

from azure.ai.projects import AIProjectClient
from azure.identity import DefaultAzureCredential

client = AIProjectClient.from_connection_string(
    conn_str="<tu-connection-string>",
    credential=DefaultAzureCredential()
)

El connection_string lo encuentras en tu proyecto de Foundry en la sección Overview.

Paso 3: obtener el cliente de inferencia

inference_client = client.inference.get_azure_openai_client(api_version="2024-08-01-preview")

Esto devuelve un cliente compatible con el SDK de OpenAI, listo para hacer llamadas a tu despliegue.

Paso 4: construir el flujo RAG

def responder_con_contexto(pregunta: str, fragmentos: list[str]) -> str:
    contexto = "\n\n".join(fragmentos)

    system_prompt = """Eres un asistente que responde preguntas basándose únicamente
en el contexto proporcionado. Si la respuesta no está en el contexto, dilo claramente.
No inventes información."""

    messages = [
        {"role": "system", "content": system_prompt},
        {
            "role": "user",
            "content": f"Contexto:\n{contexto}\n\nPregunta: {pregunta}"
        }
    ]

    response = inference_client.chat.completions.create(
        model="gpt-4o",
        messages=messages,
        temperature=0.2,
        max_tokens=800
    )

    return response.choices[0].message.content

Parámetros clave:

temperature=0.2 — respuestas más consistentes y menos creativas, ideal para casos factuales.
max_tokens=800 — controla el tamaño máximo de la respuesta.
El prompt del sistema ancla el modelo a tu contexto y evita alucinaciones.

Paso 5: integrar con Azure AI Search

from azure.search.documents import SearchClient
from azure.core.credentials import AzureKeyCredential

search_client = SearchClient(
    endpoint="https://<tu-servicio>.search.windows.net",
    index_name="documentos-empresa",
    credential=AzureKeyCredential("<tu-key>")
)

def buscar_fragmentos(pregunta: str, top: int = 5) -> list[str]:
    resultados = search_client.search(
        search_text=pregunta,
        top=top,
        select=["contenido", "titulo"]
    )
    return [r["contenido"] for r in resultados]

# Uso completo
pregunta = "¿Cuál es la política de vacaciones para empleados nuevos?"
fragmentos = buscar_fragmentos(pregunta)
respuesta = responder_con_contexto(pregunta, fragmentos)
print(respuesta)

Con este patrón, el modelo solo responde con lo que está en tus documentos.

Ingeniería de prompts en Foundry

La interfaz de Foundry incluye un Playground donde puedes:

Probar prompts del sistema de forma interactiva.
Comparar respuestas entre diferentes modelos y configuraciones.
Ajustar temperatura, top-p y penalizaciones antes de llevar el prompt a código.

Una buena práctica es iterar el prompt en el Playground antes de fijarlo en tu aplicación. Los cambios de un par de palabras en el system prompt pueden cambiar significativamente la calidad de las respuestas.

Evaluación de tu aplicación

Antes de llevar una aplicación de IA a producción, debes medir qué tan bien responde.

Foundry tiene un módulo de evaluación que ejecuta un conjunto de preguntas y respuestas esperadas contra tu despliegue y calcula métricas como:

Groundedness: si la respuesta está soportada por el contexto recuperado.
Relevance: si la respuesta es pertinente a la pregunta.
Coherence: si la respuesta está bien redactada y es consistente.
Fluency: calidad lingüística de la salida.

Puedes lanzar evaluaciones desde el SDK:

from azure.ai.projects.models import (
    EvaluatorConfiguration,
    EvaluationTarget,
    Evaluation,
    Dataset
)

evaluation = Evaluation(
    display_name="Evaluación RAG documentos",
    description="Verificar calidad de respuestas sobre documentos internos",
    data=Dataset(id="<id-de-tu-dataset>"),
    target=EvaluationTarget(
        deployment_name="gpt-4o",
        system_prompt="Eres un asistente que responde solo con base en el contexto."
    ),
    evaluators={
        "groundedness": EvaluatorConfiguration(id="azureml://...groundedness"),
        "relevance": EvaluatorConfiguration(id="azureml://...relevance"),
    }
)

result = client.evaluations.create(evaluation)
print(result.id)

Ejecutar evaluaciones regularmente te permite detectar regresiones cuando cambias el modelo o el prompt.

Content Safety: filtros de contenido

Foundry incluye integración con Azure AI Content Safety, que filtra automáticamente:

Contenido violento, sexual u odioso.
Inyecciones de prompt (intentos de manipular el sistema).
Información sensible o protegida.

Los filtros se configuran por despliegue y aplican tanto a la entrada del usuario como a la salida del modelo. En aplicaciones empresariales esto es indispensable antes de abrir el acceso a usuarios finales.

Buenas prácticas para producción

Usa identidades gestionadas en lugar de claves API donde sea posible. Es más seguro y simplifica la rotación de credenciales.
Versiona tus prompts del sistema como lo harías con código. Un cambio de prompt es un cambio de comportamiento de la aplicación.
Establece un dataset de evaluación desde el inicio, aunque sea pequeño. Facilita detectar regresiones con cada iteración.
Monitorea costos por despliegue desde el portal de Azure. Los modelos más potentes cuestan más por token: usa el modelo mínimo necesario para cada tarea.
Limita el contexto enviado al modelo al mínimo útil. Contextos muy largos aumentan latencia y costo sin mejorar necesariamente la calidad.

¿Cuándo usar Foundry vs. llamar directamente a la API?

Escenario	Recomendación
Prototipo rápido	API directa de OpenAI o Azure OpenAI
App empresarial con documentos propios	Azure AI Foundry + AI Search
Múltiples modelos en un solo proyecto	Foundry (catálogo unificado)
Evaluación y trazabilidad requeridas	Foundry (módulo de evaluaciones)
Restricciones de red y compliance	Foundry con hub en red virtual

Conclusión

Azure AI Foundry no es solo un wrapper sobre GPT. Es la plataforma para llevar aplicaciones de IA desde el experimento hasta producción con seguridad, trazabilidad y control de calidad.

El patrón RAG que vimos —buscar en tus documentos y generar respuestas fundamentadas— es la base de la mayoría de aplicaciones empresariales de IA generativa.

Empieza con un proyecto pequeño, mide desde el primer día y escala con criterio técnico.

Construye aplicaciones de IA con Azure desde cero

¿Quieres ir más allá y dominar Azure OpenAI, RAG y desarrollo de aplicaciones con IA aplicadas a casos reales de negocio?

Accede al curso completo en Udemy: