Cloud Vision API-Dokumentation | Google Cloud (original) (raw)

Mit der Cloud Vision API können Entwickler auf einfache Weise Features zur visuellen Erkennung in Anwendungen einbinden. Hierzu zählen die Erkennung von Bildlabels, Gesichtern und Sehenswürdigkeiten, die optische Zeichenerkennung (Optical Character Recognition, OCR) sowie die Kennzeichnung expliziter Inhalte mit Tags.

Proof of Concept mit einem Guthaben in Höhe von 300 $starten

Zugriff auf Gemini 2.0 Flash Thinking erhalten
Kostenlose monatliche Nutzung beliebter Produkte wie KI-APIs und BigQuery
Keine automatischen Abbuchungen, keine Verpflichtungen

Angebote für kostenlose Produkte ansehen

Mehr als 20 Produkte immer kostenlos nutzen

Sie haben Zugriff auf mehr als 20 kostenlose Produkte für gängige Anwendungsfälle, darunter KI-APIs, VMs, Data Warehouses und mehr.

Dokumentationsressourcen

Finden Sie Kurzanleitungen und Leitfäden, prüfen Sie wichtige Referenzen und erhalten Sie Hilfe bei häufigen Problemen.

Leitfäden

Referenz

Ressourcen

Entdecken Sie Schulungen von Google Cloud Skills Boost, Anwendungsfälle, Referenzarchitekturen und Codebeispiele mit Details zur Verwendung und Verbindung von Google Cloud-Diensten. Google Cloud

Training

Schulungen und Tutorials

OCR-Anleitung

Hier erfahren Sie, wie Sie optische Zeichenerkennung (Optical Character Recognition, OCR) auf der Google Cloud Platform ausführen. In dieser Anleitung wird gezeigt, wie Sie Bilddateien in Google Cloud Storage hochladen, Text mit der Google Cloud Vision API aus den Bildern extrahieren, den Text mithilfe der Google Cloud Translation API übersetzen und Ihre Übersetzungen wieder in Cloud Storage speichern.

Training

Schulungen und Tutorials

Eine einfache „Hello World“-Funktion in der Konsole erstellen

Stellen Sie Ihre erste Funktion ohne lokale Einrichtung schnell bereit.

Training

Schulungen und Tutorials

Big Data- & ML-Grundlagen

In diesem eintägigen Präsenzkurs lernen die Teilnehmer die Big Data- und Machine-Learning-Funktionen von Google Cloud kennen. Sie erhalten einen kurzen Überblick über Google Cloud und einen tieferen Einblick in die Datenverarbeitungsfunktionen.

Training

Schulungen und Tutorials

Erkennen Sie Text in Bildern durch Verknüpfen von Functions, Storage, die Vision API, Pub/Sub und die Translation API.

Reagieren Sie auf Cloud Storage-Änderungen mit einer Funktion, die ein Bild mit der Vision API verarbeitet, um Text zu extrahieren und dann an andere Dienste zu übergeben.

Training

Schulungen und Tutorials

Automatische Klassifizierung von Daten, die mit der DLP API und Cloud Functions in Cloud Storage hochgeladen wurden

In Pub/Sub, Cloud Functions und der Data Loss Prevention API hochgeladene Daten können automatisch klassifiziert werden.

Codebeispiel

Codebeispiele

Mehrere Bilder in einer einzelnen Anfrage zusammenfassen und Ausgabe in Cloud Storage speichern

Führen Sie asynchrone Offline-Erkennungsdienste und -Annotationen großer Batches von Bilddateien über jeden Vision-Funktionstyp aus.

Java Node.js Python Ruby

Codebeispiel

Codebeispiele

Speicher- und Verarbeitungsstandort für OCR-Anfragen festlegen

Legen Sie eine bestimmte Region fest, um Ressourcen für eine Anfrage zur optischen Zeichenerkennung (Optical Character Recognition, OCR) zu speichern und zu verarbeiten.

C# Go Java Node.js PHP Python Ruby

Codebeispiel

Codebeispiele

Anstößige Bildinhalte erkennen und unkenntlich machen

Veranschaulicht die Verwendung der Google Cloud Vision API und ImageMagick, um anstößige Bilder zu erkennen und unkenntlich zu machen, die in einen Cloud Storage-Bucket hochgeladen werden.

Node.js Python Go Java

Codebeispiel

Codebeispiele

Text aus einem Foto mit Glossaren übersetzen und sprechen (Advanced)

Mit der Vision API, der Translation API und der Text-to-Speech API können Sie Text in einem Bild erkennen, Übersetzungen personalisieren und synthetische Sprache aus dem übersetzten Text generieren.

Python

Codebeispiel

Codebeispiele

Text in einem Bild (OCR) erkennen und einen Rahmen um den gefundenen Text zeichnen

Mithilfe der Vision API können Sie Text in einem Bild erkennen und das Bild dann anhand des erkannten Texts annotieren.

Python

Cloud Vision API-Dokumentation | Google Cloud (original) (raw)

Proof of Concept mit einem Guthaben in Höhe von 300 $starten

Mehr als 20 Produkte immer kostenlos nutzen

Dokumentationsressourcen

Leitfäden

Referenz

Ressourcen

OCR-Anleitung

Eine einfache „Hello World“-Funktion in der Konsole erstellen

Big Data- & ML-Grundlagen

Erkennen Sie Text in Bildern durch Verknüpfen von Functions, Storage, die Vision API, Pub/Sub und die Translation API.

Automatische Klassifizierung von Daten, die mit der DLP API und Cloud Functions in Cloud Storage hochgeladen wurden

Mehrere Bilder in einer einzelnen Anfrage zusammenfassen und Ausgabe in Cloud Storage speichern

Speicher- und Verarbeitungsstandort für OCR-Anfragen festlegen

Anstößige Bildinhalte erkennen und unkenntlich machen

Text aus einem Foto mit Glossaren übersetzen und sprechen (Advanced)

Text in einem Bild (OCR) erkennen und einen Rahmen um den gefundenen Text zeichnen

Ähnliche Videos