Comienza a usar la IA integrada (original) (raw)

Alexandra Klepper

Fecha de publicación: 12 de diciembre de 2024; última actualización: 20 de mayo de 2025

Con las APIs de IA integradas, tu aplicación web puede realizar tareas potenciadas por IA sin necesidad de implementar ni administrar sus propios modelos de IA. Estamos trabajando para estandarizar estas APIs en todos los navegadores.

Requisitos

Para usar la IA integrada, hay requisitos de hardware y de modelos.

Modelos

Las APIs de Translator y Language Detector usan modelos expertos. Todas las demás APIs usan un modelo de lenguaje diseñado para ejecutarse de forma local en computadoras de escritorio y laptops.

Las APIs de Summarizer, Writer, Rewriter y Proofreader solo admiten la modalidad de texto a texto. La API de Prompt tiene capacidades multimodales.

Gemini Nano en Chrome

Chrome usa los modelos de lenguaje de Gemini Nano. Gemini Nano no está disponible en dispositivos móviles.

A partir de Chrome 140, Gemini Nano admite inglés, español y japonés para el texto de entrada y salida.

Antes de usar las APIs de IA integradas, acepta la Política de Uso Prohibido de IA Generativas de Google.

Hardware

Existen los siguientes requisitos para los desarrolladores y los usuarios que operan funciones con estas APIs en Chrome. Es posible que otros navegadores tengan requisitos de funcionamiento diferentes.

Las APIs de Language Detector y Translator funcionan en Chrome en computadoras de escritorio. Estas APIs no funcionan en dispositivos móviles. Las APIs de Prompt, Summarizer, Writer, Rewriter y Proofreader funcionan en Chrome cuando se cumplen las siguientes condiciones:

El tamaño exacto de Gemini Nano puede variar a medida que el navegador actualiza el modelo. Para determinar el tamaño actual, visita chrome://on-device-internals.

una vez que se cumplen los requisitos.

Comienza con la compilación

Hay varias APIs de IA integradas disponibles en diferentes etapas de desarrollo. Algunas están en la versión estable de Chrome, otras están disponibles para los participantes de las pruebas de origen y otras solo están disponibles para los participantes del Programa de vista previa anticipada.

Cada API tiene su propio conjunto de instrucciones para comenzar a usarla y descargar el modelo, tanto para la creación de prototipos locales como en entornos de producción con las pruebas de origen.

Todas estas APIs se pueden usar cuando se compilan extensiones de Chrome.

Descarga de modelos

Las APIs están integradas en Chrome, al igual que los modelos. La primera vez que un usuario interactúa con estas APIs, el modelo se debe descargar en el navegador.

Para determinar si una API está lista y se puede usar, llama a la función asíncrona availability(), que devuelve una promesa con uno de los siguientes valores:

Algunas APIs requieren opciones adicionales cuando se llama a la disponibilidad. Por ejemplo, la API de Prompt requiere que se declare la compatibilidad con idiomas:

// Makes sure the model is available for English and Japanese.
await LanguageModel.availability({ languages: ["en", "ja"] });

Activación del usuario

Si el dispositivo admite las APIs de IA integradas, pero el modelo aún no se descargó, el usuario debe interactuar de manera significativa con tu página para que tu aplicación inicie una sesión con create().

Usa la propiedad UserActivation.isActive para confirmar que un usuario interactuó directamente con la página desde que terminó de cargarse. Esto puede incluir un toque, un clic, una presión de tecla, mousedown o cualquier otro evento de activación persistente.

// Check for user activation.
if (navigator.userActivation.isActive) {
  // Create an instance of a built-in API
}

Por ejemplo, con la API de Summarizer, puedes pedirles a los usuarios que interactúen con un botón que diga "Resumir" para activar Summarizer.create(), o bien puedes crear el resumidor una vez que un usuario comience a escribir, un evento keydown.

Usa APIs en localhost

Todas las APIs están disponibles en localhost en Chrome.

  1. Ve a chrome://flags/#optimization-guide-on-device-model.
  2. Selecciona Habilitada.
  3. Haz clic en Reiniciar o reinicia Chrome.

En el caso de las APIs que usan Gemini Nano, también debes configurar chrome://flags/#prompt-api-for-gemini-nano como Habilitado o Habilitado (multilingüe). Puedes confirmar que el modelo se descargó y funciona según lo previsto en la consola de DevTools. Ejecuta await LanguageModel.availability(); en la consola.

Soluciona problemas relacionados con localhost

Si las marcas no aparecen en chrome://flags, asegúrate de haber descargado la versión más reciente de Chrome.

Si el modelo no funciona como se espera, sigue estos pasos:

  1. Reinicia Chrome.
  2. Ve a chrome://on-device-internals.
  3. Selecciona la pestaña Estado del modelo y asegúrate de que no haya errores.
  4. Abre Herramientas para desarrolladores y escribe LanguageModel.availability(); en la consola. Esto debería mostrar available.

Si es necesario, espera un tiempo y repite estos pasos.

Proceso de estándares

Estamos trabajando para estandarizar estas APIs, de modo que funcionen en todos los navegadores. Esto significa que propusimos las APIs a la comunidad de plataformas web y las trasladamos al W3C Web Incubator Community Group para seguir debatiéndolas.

Estamos solicitando comentarios al W3C, Mozilla y WebKit para cada API.

Si pruebas la IA integrada y tienes comentarios, nos encantaría conocerlos.