Las traducciones son generadas a través de traducción automática. En caso de conflicto entre la traducción y la version original de inglés, prevalecerá la version en inglés.
Envío de solicitudes y generación de respuestas con inferencia de modelos
La inferencia se refiere al proceso de generar una salida a partir de una entrada proporcionada a un modelo.
Amazon Bedrock ofrece un conjunto de modelos fundacionales que puede utilizar para generar resultados de las siguientes modalidades. Para ver la compatibilidad de modalidades por modelo fundacional, consulte Modelos fundacionales compatibles en Amazon Bedrock.
Modalidad de salida | Descripción | Ejemplos de casos de uso |
---|---|---|
Texto | Proporcionar entrada de texto y generar varios tipos de texto | Chat, intercambio de ideas question-and-answering, resumen, generación de código, creación de tablas, formateo de datos, reescritura |
Imagen | Proporcionar texto o imágenes de entrada y generar o modificar imágenes | Generación de imágenes, edición de imágenes, variación de imágenes |
Video | Proporcione texto o imágenes de referencia y genere un vídeo | Generación de vídeo, conversión de imágenes a vídeo |
Incrustaciones | Proporcionar texto, imágenes o texto e imágenes y generar un vector de valores numéricos que represente la entrada. El vector de salida se puede comparar con otros vectores de incrustaciones para determinar la similitud semántica (para el texto) o la similitud visual (para las imágenes). | Búsqueda de texto e imágenes, consulta, categorización, recomendaciones, personalización, creación de bases de conocimientos |
Puede ejecutar directamente la inferencia de modelos de las siguientes maneras:
-
En AWS Management Console, utilice cualquiera de los parques de juegos de Amazon Bedrock para realizar inferencias en una interfaz gráfica fácil de usar.
Utilice Converse o la ConverseStreamAPI para implementar aplicaciones conversacionales.
-
Usa la InvokeModelWithResponseStreamAPI InvokeModelo para enviar una sola solicitud.
-
Prepare un conjunto de datos de peticiones con las configuraciones que desee y realice una inferencia por lotes con una solicitud CreateModelInvocationJob.
Las siguientes características de Amazon Bedrock también utilizan la inferencia de modelos como un paso en un flujo de trabajo más amplio:
-
La evaluación del modelo utiliza el proceso de invocación del modelo para evaluar el rendimiento de los diferentes modelos después de enviar una CreateEvaluationJobsolicitud.
-
Las bases de conocimiento utilizan la invocación del modelo cuando utilizan el RetrieveAndGenerateAPI para generar una respuesta basada en los resultados recuperados de una base de conocimientos.
-
Los agentes utilizan la invocación de modelos para generar respuestas en varias etapas durante un InvokeAgent request.
-
Los flujos incluyen recursos de Amazon Bedrock, como solicitudes, bases de conocimiento y agentes, que utilizan la invocación de modelos.
Tras probar diferentes modelos básicos con distintas indicaciones y parámetros de inferencia, puede configurar su aplicación para que los invoque con las APIs especificaciones que desee.
Temas
Influencia sobre la generación de respuestas con parámetros de inferencia
Regiones y modelos compatibles para ejecutar la inferencia de modelos
Generación de respuestas en la consola mediante áreas de juego
Mejore las respuestas de los modelos con el razonamiento de los modelos
Envío de solicitudes y generación de respuestas mediante la API
Uso de una herramienta para completar una respuesta modelo de Amazon Bedrock
Almacenamiento rápido en caché para una inferencia de modelos más rápida