Envío de solicitudes y generación de respuestas con inferencia de modelos

La inferencia se refiere al proceso de generar una salida a partir de una entrada proporcionada a un modelo.

Amazon Bedrock ofrece un conjunto de modelos fundacionales que puede utilizar para generar resultados de las siguientes modalidades. Para ver la compatibilidad de modalidades por modelo fundacional, consulte Modelos fundacionales compatibles en Amazon Bedrock.

Modalidad de salida	Descripción	Ejemplos de casos de uso
Texto	Proporcionar entrada de texto y generar varios tipos de texto	Chat, intercambio de ideas question-and-answering, resumen, generación de código, creación de tablas, formateo de datos, reescritura
Imagen	Proporcionar texto o imágenes de entrada y generar o modificar imágenes	Generación de imágenes, edición de imágenes, variación de imágenes
Video	Proporcione texto o imágenes de referencia y genere un vídeo	Generación de vídeo, conversión de imágenes a vídeo
Incrustaciones	Proporcionar texto, imágenes o texto e imágenes y generar un vector de valores numéricos que represente la entrada. El vector de salida se puede comparar con otros vectores de incrustaciones para determinar la similitud semántica (para el texto) o la similitud visual (para las imágenes).	Búsqueda de texto e imágenes, consulta, categorización, recomendaciones, personalización, creación de bases de conocimientos

Puede ejecutar directamente la inferencia de modelos de las siguientes maneras:

En AWS Management Console, utilice cualquiera de los parques de juegos de Amazon Bedrock para realizar inferencias en una interfaz gráfica fácil de usar.
Utilice Converse o la ConverseStreamAPI para implementar aplicaciones conversacionales.
Usa la InvokeModelWithResponseStreamAPI InvokeModelo para enviar una sola solicitud.
Prepare un conjunto de datos de peticiones con las configuraciones que desee y realice una inferencia por lotes con una solicitud CreateModelInvocationJob.

Las siguientes características de Amazon Bedrock también utilizan la inferencia de modelos como un paso en un flujo de trabajo más amplio:

La evaluación del modelo utiliza el proceso de invocación del modelo para evaluar el rendimiento de los diferentes modelos después de enviar una CreateEvaluationJobsolicitud.
Las bases de conocimiento utilizan la invocación del modelo cuando utilizan el RetrieveAndGenerateAPI para generar una respuesta basada en los resultados recuperados de una base de conocimientos.
Los agentes utilizan la invocación de modelos para generar respuestas en varias etapas durante un InvokeAgent request.
Los flujos incluyen recursos de Amazon Bedrock, como solicitudes, bases de conocimiento y agentes, que utilizan la invocación de modelos.

Tras probar diferentes modelos básicos con distintas indicaciones y parámetros de inferencia, puede configurar su aplicación para que los invoque con las APIs especificaciones que desee.

Temas

Aviso JavaScript está desactivado o no está disponible en su navegador.

Para utilizar la documentación de AWS, debe estar habilitado JavaScript. Para obtener más información, consulte las páginas de ayuda de su navegador.

Convenciones del documento

Compatibilidad del modelo

Cómo funciona la inferencia