Evaluación de modelos en Agent Platform (original) (raw)

El servicio de evaluación de IA de inferencia te permite evaluar el rendimiento de un modelo en diversos casos de uso específicos. La evaluación también puede denominarse observabilidad del rendimiento de un modelo. La evaluación del modelo que proporciona Agent Platform puede ajustarse al flujo de trabajo típico del aprendizaje automático de varias maneras:

La forma de interpretar y usar estas métricas depende de las necesidades de su empresa y del problema para el que entrenó tu modelo. Por ejemplo, es posible que tengas una tolerancia más baja para los falsos positivos que para los falsos negativos, o viceversa. Estos tipos de preguntas afectan las métricas en las que te enfocarás a medida que iteras en el modelo.

Estas son algunas de las métricas clave que ofrece el servicio de evaluación de modelos de IA predictiva:

Funciones

Para evaluar un modelo con Agent Platform, necesitas un modelo entrenado, un resultado de inferencia por lotes y un conjunto de datos de verdad fundamental. El siguiente es un flujo de trabajo típico de evaluación de modelos que usa Agent Platform:

  1. Entrena un modelo. Puedes hacerlo en Gemini Enterprise Agent Platform con AutoML o el entrenamiento personalizado.
  2. Ejecuta un trabajo de inferencia por lotes en el modelo para generar resultados de inferencia.
  3. Prepara los datos de verdad fundamental, que son los datos “etiquetados de forma correcta” según lo que determinen las personas. La verdad fundamental suele ser el conjunto de datos de prueba que usaste durante el proceso de entrenamiento de modelos.
  4. Ejecuta un trabajo de evaluación en el modelo, que evalúa la exactitud de los resultados de la inferencia por lotes en comparación con los datos de verdad fundamental.
  5. Analiza las métricas que resultan del trabajo de evaluación.
  6. Itera en tu modelo para ver si puedes mejorar la exactitud de tu modelo. Puedes ejecutar varios trabajos de evaluación y comparar los resultados de varios trabajos en los modelos o versiones de modelos.

Puedes ejecutar la evaluación de modelos en Agent Platform de varias maneras:

Agent Platform admite la evaluación de los siguientes tipos de modelos:

Imagen

Clasificación

Puedes ver y descargar archivos de esquema desde la siguiente ubicación de Cloud Storage:
gs://google-cloud-aiplatform/schema/modelevaluation/

Tabular

Clasificación

Puedes ver y descargar archivos de esquema desde la siguiente ubicación de Cloud Storage:
gs://google-cloud-aiplatform/schema/modelevaluation/

Regresión

Puedes ver y descargar archivos de esquema desde la siguiente ubicación de Cloud Storage:
gs://google-cloud-aiplatform/schema/modelevaluation/

Previsión

Puedes ver y descargar archivos de esquema desde la siguiente ubicación de Cloud Storage:
gs://google-cloud-aiplatform/schema/modelevaluation/

Instructivos para uso de notebooks

Datos tabulares de AutoML

Entrenamiento personalizado: Tabular

Gemini Enterprise Agent Platform Model Registry

¿Qué sigue?