Envío de solicitudes y generación de respuestas con inferencia de modelos - Amazon Bedrock

Las traducciones son generadas a través de traducción automática. En caso de conflicto entre la traducción y la version original de inglés, prevalecerá la version en inglés.

Envío de solicitudes y generación de respuestas con inferencia de modelos

La inferencia se refiere al proceso de generar una salida a partir de una entrada proporcionada a un modelo.

Amazon Bedrock ofrece un conjunto de modelos fundacionales que puede utilizar para generar resultados de las siguientes modalidades. Para ver la compatibilidad de modalidades por modelo fundacional, consulte Modelos fundacionales compatibles en Amazon Bedrock.

Modalidad de salida Descripción Ejemplos de casos de uso
Texto Proporcionar entrada de texto y generar varios tipos de texto Chat, intercambio de ideas question-and-answering, resumen, generación de código, creación de tablas, formateo de datos, reescritura
Imagen Proporcionar texto o imágenes de entrada y generar o modificar imágenes Generación de imágenes, edición de imágenes, variación de imágenes
Video Proporcione texto o imágenes de referencia y genere un vídeo Generación de vídeo, conversión de imágenes a vídeo
Incrustaciones Proporcionar texto, imágenes o texto e imágenes y generar un vector de valores numéricos que represente la entrada. El vector de salida se puede comparar con otros vectores de incrustaciones para determinar la similitud semántica (para el texto) o la similitud visual (para las imágenes). Búsqueda de texto e imágenes, consulta, categorización, recomendaciones, personalización, creación de bases de conocimientos

Puede ejecutar directamente la inferencia de modelos de las siguientes maneras:

  • En AWS Management Console, utilice cualquiera de los parques de juegos de Amazon Bedrock para realizar inferencias en una interfaz gráfica fácil de usar.

  • Utilice Converse o la ConverseStreamAPI para implementar aplicaciones conversacionales.

  • Usa la InvokeModelWithResponseStreamAPI InvokeModelo para enviar una sola solicitud.

  • Prepare un conjunto de datos de peticiones con las configuraciones que desee y realice una inferencia por lotes con una solicitud CreateModelInvocationJob.

Las siguientes características de Amazon Bedrock también utilizan la inferencia de modelos como un paso en un flujo de trabajo más amplio:

  • La evaluación del modelo utiliza el proceso de invocación del modelo para evaluar el rendimiento de los diferentes modelos después de enviar una CreateEvaluationJobsolicitud.

  • Las bases de conocimiento utilizan la invocación del modelo cuando utilizan el RetrieveAndGenerateAPI para generar una respuesta basada en los resultados recuperados de una base de conocimientos.

  • Los agentes utilizan la invocación de modelos para generar respuestas en varias etapas durante un InvokeAgent request.

  • Los flujos incluyen recursos de Amazon Bedrock, como solicitudes, bases de conocimiento y agentes, que utilizan la invocación de modelos.

Tras probar diferentes modelos básicos con distintas indicaciones y parámetros de inferencia, puede configurar su aplicación para que los invoque con las APIs especificaciones que desee.