Cloud Vision API-Dokumentation | Google Cloud (original) (raw)
Mit der Cloud Vision API können Entwickler auf einfache Weise Features zur visuellen Erkennung in Anwendungen einbinden. Hierzu zählen die Erkennung von Bildlabels, Gesichtern und Sehenswürdigkeiten, die optische Zeichenerkennung (Optical Character Recognition, OCR) sowie die Kennzeichnung expliziter Inhalte mit Tags.
Proof of Concept mit einem Guthaben in Höhe von 300 $starten
- Zugriff auf Gemini 2.0 Flash Thinking erhalten
- Kostenlose monatliche Nutzung beliebter Produkte wie KI-APIs und BigQuery
- Keine automatischen Abbuchungen, keine Verpflichtungen
Angebote für kostenlose Produkte ansehen
Mehr als 20 Produkte immer kostenlos nutzen
Sie haben Zugriff auf mehr als 20 kostenlose Produkte für gängige Anwendungsfälle, darunter KI-APIs, VMs, Data Warehouses und mehr.
Dokumentationsressourcen
Finden Sie Kurzanleitungen und Leitfäden, prüfen Sie wichtige Referenzen und erhalten Sie Hilfe bei häufigen Problemen.
Leitfäden
Referenz
Ressourcen
Entdecken Sie Schulungen von Google Cloud Skills Boost, Anwendungsfälle, Referenzarchitekturen und Codebeispiele mit Details zur Verwendung und Verbindung von Google Cloud-Diensten. Google Cloud
Training
Schulungen und Tutorials
OCR-Anleitung
Hier erfahren Sie, wie Sie optische Zeichenerkennung (Optical Character Recognition, OCR) auf der Google Cloud Platform ausführen. In dieser Anleitung wird gezeigt, wie Sie Bilddateien in Google Cloud Storage hochladen, Text mit der Google Cloud Vision API aus den Bildern extrahieren, den Text mithilfe der Google Cloud Translation API übersetzen und Ihre Übersetzungen wieder in Cloud Storage speichern.
Training
Schulungen und Tutorials
Eine einfache „Hello World“-Funktion in der Konsole erstellen
Stellen Sie Ihre erste Funktion ohne lokale Einrichtung schnell bereit.
Training
Schulungen und Tutorials
Big Data- & ML-Grundlagen
In diesem eintägigen Präsenzkurs lernen die Teilnehmer die Big Data- und Machine-Learning-Funktionen von Google Cloud kennen. Sie erhalten einen kurzen Überblick über Google Cloud und einen tieferen Einblick in die Datenverarbeitungsfunktionen.
Training
Schulungen und Tutorials
Erkennen Sie Text in Bildern durch Verknüpfen von Functions, Storage, die Vision API, Pub/Sub und die Translation API.
Reagieren Sie auf Cloud Storage-Änderungen mit einer Funktion, die ein Bild mit der Vision API verarbeitet, um Text zu extrahieren und dann an andere Dienste zu übergeben.
Training
Schulungen und Tutorials
Automatische Klassifizierung von Daten, die mit der DLP API und Cloud Functions in Cloud Storage hochgeladen wurden
In Pub/Sub, Cloud Functions und der Data Loss Prevention API hochgeladene Daten können automatisch klassifiziert werden.
Codebeispiel
Codebeispiele
Mehrere Bilder in einer einzelnen Anfrage zusammenfassen und Ausgabe in Cloud Storage speichern
Führen Sie asynchrone Offline-Erkennungsdienste und -Annotationen großer Batches von Bilddateien über jeden Vision-Funktionstyp aus.
Java Node.js Python Ruby
Codebeispiel
Codebeispiele
Speicher- und Verarbeitungsstandort für OCR-Anfragen festlegen
Legen Sie eine bestimmte Region fest, um Ressourcen für eine Anfrage zur optischen Zeichenerkennung (Optical Character Recognition, OCR) zu speichern und zu verarbeiten.
C# Go Java Node.js PHP Python Ruby
Codebeispiel
Codebeispiele
Anstößige Bildinhalte erkennen und unkenntlich machen
Veranschaulicht die Verwendung der Google Cloud Vision API und ImageMagick, um anstößige Bilder zu erkennen und unkenntlich zu machen, die in einen Cloud Storage-Bucket hochgeladen werden.
Node.js Python Go Java
Codebeispiel
Codebeispiele
Text aus einem Foto mit Glossaren übersetzen und sprechen (Advanced)
Mit der Vision API, der Translation API und der Text-to-Speech API können Sie Text in einem Bild erkennen, Übersetzungen personalisieren und synthetische Sprache aus dem übersetzten Text generieren.
Python
Codebeispiel
Codebeispiele
Text in einem Bild (OCR) erkennen und einen Rahmen um den gefundenen Text zeichnen
Mithilfe der Vision API können Sie Text in einem Bild erkennen und das Bild dann anhand des erkannten Texts annotieren.
Python