Del curso: Microsoft Azure IA esencial: Introducción a Workloads y Machine Learning en Azure
Desarrollo de modelos tradicionales vs. modelos fundacionales
Del curso: Microsoft Azure IA esencial: Introducción a Workloads y Machine Learning en Azure
Desarrollo de modelos tradicionales vs. modelos fundacionales
En la inteligencia artificial tradicional, se requiere entrenar modelos con conjuntos de datos etiquetados para tareas específicas y limitadas. Como mencioné anteriormente en este curso, cada modelo de inteligencia artificial se construye con un propósito concreto. Por ejemplo, los modelos de procesamiento del lenguaje natural se usan para tareas como análisis de sentimientos y extracción de entidades, mientras que los modelos de visión por computadora analizan las imágenes para detectar objetos y clasificarlas. Aunque estos modelos tradicionales han resuelto muchos problemas del mundo real, su desarrollo y despliegue requieren mucho tiempo y recursos. Se necesitan grandes volúmenes de datos etiquetados, y si no están disponibles, es necesario invertir muchísimo tiempo para etiquetarlos manualmente. Solo después de reconocer y procesar todos los datos, se puede aplicar el modelo a la tarea objetivo. Un modelo fundacional, en cambio, se entrena con enormes cantidades de datos no etiquetados, lo que le permite adaptarse a una variedad de tareas. Estos modelos capturan patrones generales y reemplazan a los modelos específicos para cada tarea, convirtiéndose en la base de múltiples aplicaciones. Gracias al aprendizaje autosupervisado y al aprendizaje por transferencia, los modelos fundacionales pueden aplicar conocimientos adquiridos en un contexto a otros contextos distintos. Esto es similar a cómo aprender a conducir a un automóvil nos ayuda a conducir un camión o un autobús. Algunos de los modelos fundacionales que podemos aquí mencionar como ejemplo son los large language models, como por ejemplo, GPT-4o o O3 de la empresa OpenAI, que son modelos de propósito general y multimodales, lo que significa que pueden procesar y generar tanto texto como imágenes, ya sea como entrada o como salida. Florence, el modelo fundacional de Microsoft entrenado con miles de millones de pares texto-imagen, que permite tareas como clasificación de imágenes, detección de objetos y recuperación de videos. O Aurora, un modelo fundacional desarrollado por Microsoft Research, que es capaz de extraer conocimientos valiosos a partir de enormes cantidades de datos atmosféricos. Veamos el uso de algunos de estos modelos en la vida real. Por ejemplo, aquí ya navegué a ChatGPT usando mi cuenta y, como podrás observar, ya creé con anticipación este GPT llamado GastoViajero, el cual me permite automatizar la generación de reportes de gastos. Los GPT son asistentes personalizados que pueden ser configurados con conocimientos, tono de voz y funciones específicas para alguna empresa o proyecto. Entonces, aquí lo que voy a decirle es: «Nuevo proyecto, nuevo viaje a Graz del 7 al 19 de abril de 2025». Entonces, aquí registra este proyecto y ahora lo que voy a hacer es subir un ticket. Voy a hacer clic en este botón, y una vez seleccionada la imagen que quiero subir, que es esta fotografía de un ticket, lo que hace es extraer todo el texto y lo agrega a este reporte de gastos. Un ejemplo del uso de estos modelos multimodales, ya que estamos hablando tanto de texto como de imágenes. Muy bien, ahora vámonos a Microsoft Copilot. Bien, aquí ya abrí este otro navegador y me fui a copilot.microsoft.com y entré con mi cuenta de Microsoft. Y lo que voy a hacer es algo similar, voy a subir la fotografía del ticket, pero ahora voy a pedir que cambie de euros a dólares. Entonces, voy a hacer clic en este botón, y aquí lo que voy a hacer es escribir: «Haz la conversión de euros a dólares americanos». Aquí se sube la imagen y, posteriormente, me está diciendo cuál es el equivalente, pero en dólares americanos.
Contenido
-
-
-
-
-
-
-
-
Introducción a la IA generativa4 min 19 s
-
Desarrollo de modelos tradicionales vs. modelos fundacionales4 min 47 s
-
Tokens, Embeddings y Transformer7 min 15 s
-
Uso de modelos de lenguaje: LLM vs. SLM3 min 50 s
-
Mejorando tus prompts8 min 20 s
-
Introducción a Microsoft Copilot3 min 28 s
-
Personalización de modelos de lenguaje3 min 13 s
-
Introducción a Azure AI Foundry2 min 8 s
-
Introducción a Azure OpenAI1 min 37 s
-
Aplicación práctica de la IA generativa en los negocios2 min 37 s
-
Demostración de Azure AI Foundry3 min 39 s
-
-
-
-