Comienza a usar la IA integrada (original) (raw)

Alexandra Klepper

Fecha de publicación: 12 de diciembre de 2024; última actualización: 20 de mayo de 2025

Con las APIs de IA integradas, tu aplicación web puede realizar tareas potenciadas por IA sin necesidad de implementar ni administrar sus propios modelos de IA. Estamos trabajando para estandarizar estas APIs en todos los navegadores.

Requisitos

Para usar la IA integrada, hay requisitos de hardware y de modelos.

Modelos

Las APIs de Translator y Language Detector usan modelos expertos. Todas las demás APIs usan un modelo de lenguaje diseñado para ejecutarse de forma local en computadoras de escritorio y laptops.

Las APIs de Summarizer, Writer, Rewriter y Proofreader solo admiten la modalidad de texto a texto. La API de Prompt tiene capacidades multimodales.

Gemini Nano en Chrome

Chrome usa los modelos de lenguaje de Gemini Nano. Gemini Nano no está disponible en dispositivos móviles.

A partir de Chrome 140, Gemini Nano admite inglés, español y japonés para el texto de entrada y salida.

Antes de usar las APIs de IA integradas, acepta la Política de Uso Prohibido de IA Generativas de Google.

Hardware

Existen los siguientes requisitos para los desarrolladores y los usuarios que operan funciones con estas APIs en Chrome. Es posible que otros navegadores tengan requisitos de funcionamiento diferentes.

Las APIs de Language Detector y Translator funcionan en Chrome en computadoras de escritorio. Estas APIs no funcionan en dispositivos móviles. Las APIs de Prompt, Summarizer, Writer, Rewriter y Proofreader funcionan en Chrome cuando se cumplen las siguientes condiciones:

Sistema operativo: Windows 10 o 11; macOS 13 o versiones posteriores (Ventura y versiones posteriores); Linux; o ChromeOS (desde la plataforma 16389.0.0 y versiones posteriores) en dispositivosChromebook Plus Las APIs que usan Gemini Nano aún no son compatibles con Chrome para Android, iOS y ChromeOS en dispositivos que no son Chromebook Plus.
Almacenamiento: Al menos 22 GB de espacio libre en el volumen que contiene tu perfil de Chrome
GPU o CPU: Los modelos integrados se pueden ejecutar con GPU o CPU.
- GPU: Estrictamente más de 4 GB de VRAM
- CPU: 16 GB de RAM o más y 4 núcleos de CPU o más
Red: Datos ilimitados o una conexión sin medición

El tamaño exacto de Gemini Nano puede variar a medida que el navegador actualiza el modelo. Para determinar el tamaño actual, visita chrome://on-device-internals.

una vez que se cumplen los requisitos.

Comienza con la compilación

Hay varias APIs de IA integradas disponibles en diferentes etapas de desarrollo. Algunas están en la versión estable de Chrome, otras están disponibles para los participantes de las pruebas de origen y otras solo están disponibles para los participantes del Programa de vista previa anticipada.

Cada API tiene su propio conjunto de instrucciones para comenzar a usarla y descargar el modelo, tanto para la creación de prototipos locales como en entornos de producción con las pruebas de origen.

Todas estas APIs se pueden usar cuando se compilan extensiones de Chrome.

Descarga de modelos

Las APIs están integradas en Chrome, al igual que los modelos. La primera vez que un usuario interactúa con estas APIs, el modelo se debe descargar en el navegador.

Para determinar si una API está lista y se puede usar, llama a la función asíncrona availability(), que devuelve una promesa con uno de los siguientes valores:

"unavailable": No se admiten el dispositivo del usuario ni las opciones de sesión solicitadas. Es posible que el dispositivo no tenga suficiente energía o espacio en el disco.
"downloadable": Se necesitan descargas adicionales para crear una sesión, que pueden incluir un modelo experto, un modelo de lenguaje o un ajuste. Es posible que se requiera la activación del usuario para llamar a create().
"downloading": Las descargas están en curso y deben completarse antes de que puedas usar una sesión.
"available": Puedes crear una sesión de inmediato.

Algunas APIs requieren opciones adicionales cuando se llama a la disponibilidad. Por ejemplo, la API de Prompt requiere que se declare la compatibilidad con idiomas:

// Makes sure the model is available for English and Japanese.
await LanguageModel.availability({ languages: ["en", "ja"] });

Activación del usuario

Si el dispositivo admite las APIs de IA integradas, pero el modelo aún no se descargó, el usuario debe interactuar de manera significativa con tu página para que tu aplicación inicie una sesión con create().

Usa la propiedad UserActivation.isActive para confirmar que un usuario interactuó directamente con la página desde que terminó de cargarse. Esto puede incluir un toque, un clic, una presión de tecla, mousedown o cualquier otro evento de activación persistente.

// Check for user activation.
if (navigator.userActivation.isActive) {
  // Create an instance of a built-in API
}

Por ejemplo, con la API de Summarizer, puedes pedirles a los usuarios que interactúen con un botón que diga "Resumir" para activar Summarizer.create(), o bien puedes crear el resumidor una vez que un usuario comience a escribir, un evento keydown.

Usa APIs en localhost

Todas las APIs están disponibles en localhost en Chrome.

Ve a chrome://flags/#optimization-guide-on-device-model.
Selecciona Habilitada.
Haz clic en Reiniciar o reinicia Chrome.

En el caso de las APIs que usan Gemini Nano, también debes configurar chrome://flags/#prompt-api-for-gemini-nano como Habilitado o Habilitado (multilingüe). Puedes confirmar que el modelo se descargó y funciona según lo previsto en la consola de DevTools. Ejecuta await LanguageModel.availability(); en la consola.

Soluciona problemas relacionados con localhost

Si las marcas no aparecen en chrome://flags, asegúrate de haber descargado la versión más reciente de Chrome.

Si el modelo no funciona como se espera, sigue estos pasos:

Reinicia Chrome.
Ve a chrome://on-device-internals.
Selecciona la pestaña Estado del modelo y asegúrate de que no haya errores.
Abre Herramientas para desarrolladores y escribe LanguageModel.availability(); en la consola. Esto debería mostrar available.

Si es necesario, espera un tiempo y repite estos pasos.

Proceso de estándares

Estamos trabajando para estandarizar estas APIs, de modo que funcionen en todos los navegadores. Esto significa que propusimos las APIs a la comunidad de plataformas web y las trasladamos al W3C Web Incubator Community Group para seguir debatiéndolas.

Estamos solicitando comentarios al W3C, Mozilla y WebKit para cada API.

Si pruebas la IA integrada y tienes comentarios, nos encantaría conocerlos.

Descubre todas las APIs de IA integradas.
Únete al Programa de Versión Preliminar Anticipadapara ver un adelanto de las nuevas APIs y acceder a nuestra lista de distribución.
Si tienes comentarios sobre la implementación de Chrome, informa un error de Chromium.
Obtén información sobre los estándares web.