Panduan untuk Visi Cloud Google

Sep 11, 2025

Bagaimana caranya

Pembelajaran mesin. Belajar mendalam. Pemrosesan bahasa alami. Visi komputer. Otomatisasi. Pengenalan suara. Anda mungkin telah mendengar semua ini dan banyak istilah lain baru-baru ini, semua di bawah payung kecerdasan buatan. Bahkan, bidang ini tumbuh begitu cepat, semakin sulit untuk menurunkan definisi definitif. AI menjadi bagian dari hampir setiap aspek kehidupan kita, dari Situs Web E-commerce dan mesin pencari untuk membuka kunci ponsel Anda.

Situs web dan aplikasi Anda dapat memanfaatkan API untuk mengetuk langsung ke daya AI. Tanpa harus 'melatih' agen AI, Anda dapat memanfaatkan sejumlah besar data yang sudah dianalisis. Google, Amazon, IBM dan banyak lainnya telah menciptakan titik akhir bagi pengembang untuk menghubungkan dan mulai menggunakan AI segera.

Di ujung depan, Anda dapat menghubungkan perintah suara, antarmuka chatbot atau elemen kreatif WebGL reaktif. Di bagian belakang, database menggunakan algoritma cerdas untuk memaksimalkan kecepatan dan analisis. API dapat memberikan lapisan abstraksi dari berbagai fungsi AI, dari prediksi hingga pelatihan kolektif.

Ingat, jika Anda membuat situs Anda lebih kompleks, sangat penting Anda menilai pilihan Anda hosting web. Layanan untuk memastikan itu dapat menanganinya. Membuat situs dari awal? Pertimbangkan untuk menyederhanakan proses dengan atas Pembangun Situs Web . Dan jika Anda membuat yang baru sistem desain , penting untuk tetap aman dan dapat diakses dengan layak penyimpanan awan .

Panduan untuk Alat Web Google

Apa itu Visi Komputer?

Visi komputer adalah studi dan penciptaan sistem buatan yang mengekstrak informasi dari gambar. Ini juga dapat mencakup sistem mekanis penglihatan itu sendiri. Dalam hal pengakuan, ini adalah proses menganalisis dan menentukan konten gambar atau serangkaian gambar (termasuk video). Ini dapat mencakup pemindaian medis, foto, video 360 derajat dan hampir semua jenis citra yang dapat Anda bayangkan.

Visi komputer yang bertenaga AI dapat:

Mengidentifikasi, memberi label, dan mengkategorikan konten
Mendeteksi wajah dan emosi
Kenali headwear seperti kacamata dan topi
Identifikasi landmark, bangunan dan struktur
Menilai informasi tingkat piksel seperti data warna, kualitas dan resolusi
Kenali logo populer
Identifikasi dan baca teks
Identifikasi gambar yang berpotensi tidak pantas

Visi Komputer dengan Google Vision Vision API

Ada banyak pilihan untuk vision API tetapi kami akan menggunakan Google's Cloud Vision API. Google Host banyak AI API, termasuk pemrosesan bahasa alami, pengenalan suara, pembelajaran dan visi mendalam.

Cloud Vision API memungkinkan situs dan aplikasi Anda untuk memahami apa yang ada dalam gambar. Ini akan mengklasifikasikan konten ke dalam kategori, memberi label semua yang dilihatnya. Ini juga memberikan skor kepercayaan, sehingga Anda tahu seberapa besar kemungkinan apa yang diyakini dalam gambar sebenarnya muncul di sana. Anda dapat menggunakan ini untuk berinteraksi dengan cerdas mengenai input kamera di AR atau aplikasi video. Anda dapat membuat alat untuk membantu mereka yang tunanetra. Anda dapat membuat asisten untuk membantu mengidentifikasi bangunan atau landmark untuk wisatawan. Kemungkinannya tidak terbatas.

01. Siapkan proyek cloud

Jika Anda pernah menggunakan API Google sebelumnya, beberapa langkah pertama ini akan terbiasa. Seperti layanan Google lainnya, Anda harus mengatur proyek cloud. Pergi ke Google cloud platform konsol dan buat proyek baru atau pilih yang sudah ada. Seperti kebanyakan layanan Google, API Cloud Vision bebas untuk digunakan sampai Anda mulai membuat banyak permintaan API. Anda mungkin perlu memasukkan info penagihan saat Anda mengaktifkan API tetapi ini tidak dikenakan biaya pada volume permintaan yang rendah dan Anda dapat menghapus layanan setelah Anda selesai pengujian.

02. Aktifkan Cloud Vision API

A guide to Google's Cloud Vision: Enable the Cloud Vision API — Jelajahi Perpustakaan API dan kemudian aktifkan Cloud Vision API

Jelajahi Perpustakaan API. dan pilih Cloud Vision API untuk proyek Anda.

Setelah diaktifkan Anda harus melihat sedikit cek hijau dan pesan 'API diaktifkan' di sampingnya.

03. Buat Akun Layanan

Selanjutnya Anda harus mengatur a akun layanan . Pikirkan API sebagai layanan web yang Anda buat. Karena kita akan mengatur penggunaan seperti layanan khas, ini adalah praktik terbaik. Ini juga berfungsi paling baik dengan aliran otentikasi.

04. Unduh Kunci Pribadi

A guide to Google's Cloud Vision: Create a service account — Dapatkan kunci pribadi Anda untuk akun layanan

Setelah Anda memiliki proyek dengan API diaktifkan dan akun layanan, Anda dapat mengunduh kunci pribadi Anda sebagai file JSON. Perhatikan lokasi file, sehingga Anda dapat menggunakannya di langkah selanjutnya.

Jika Anda memiliki masalah dengan beberapa langkah pertama ada Panduan Mulai Cepat Itu membantu dan mengakhiri dengan pengunduhan kunci JSON.

05. Tetapkan variabel lingkungan

Anda perlu mengatur Google_application_credentials. Variabel lingkungan, sehingga dapat diakses oleh panggilan API kami. Ini menunjuk pada file JSON yang baru saja Anda unduh dan simpan Anda harus mengetik jalur setiap saat. Buka jendela terminal baru dan gunakan ekspor perintah seperti itu:

export GOOGLE_APPLICATION_CREDENTIALS="/Users/[username]/Downloads/[file name].json"

Ganti [nama pengguna] dengan nama pengguna Anda. Pastikan jalur ke tempat Anda menyimpan file kunci pribadi sudah benar. Ganti [nama file] Dengan file kunci pribadi Anda dan gunakan path ke file Anda.

Pada Windows, Anda dapat melakukan hal yang sama melalui baris perintah, seperti ini:

$env:GOOGLE_APPLICATION_CREDENTIALS="C:\Users\[username]\Downloads\[FILE_NAME].json"

Catatan: Jika Anda menutup jendela terminal atau konsol Anda, Anda mungkin perlu menjalankannya lagi untuk mengatur variabel lagi. Kami akan menambahkan ini ke dalam kode PHP kami segera, jadi Anda tidak perlu khawatir lagi.

06. Panggilan ke API

Sekarang Anda siap untuk menggali API Cloud Vision. Anda akan menggunakan Curl untuk melakukan tes cepat API. Anda juga dapat menggunakan metode ini dari kode Anda juga.

Permintaan curl dapat dibuat dalam sebagian besar bahasa, apakah itu PHP, Python atau node. Dengan cara ini Anda dapat melakukan panggilan langsung di baris perintah atau menetapkan hasilnya ke variabel dalam bahasa pilihan Anda. Temukan beberapa tips singkat tentang menggunakan curl sini .

Buat file JSON sederhana untuk menahan detail permintaan. Sebut saja google_vision.json. . Simpan itu lokal ke tempat Anda ingin menjalankan perintah terminal.

 {
 "Permintaan": [
    {
      "gambar":{
      "sumber":{
      "Imageuri":
      "https://upload.wikimedia.org/wikipedia/commons/9/93/golden_retriever_carlos_%2810581910556%29.jpg"
         }
     },
       "fitur": [{
         "Jenis": "Type_unspecified",
         "MaxhResults": 50
     },
       {
         "Ketik": "landmark_detection",
         "MaxhResults": 50
     },
       {
         "Ketik": "face_detection",
         "MaxhResults": 50
     }
       {
         "Jenis": "label_detection",
         "MaxhResults": 50
     },
       {
         "Jenis": "Text_Detection",
         "MaxhResults": 50
     },
       {
         "Ketik": "safe_search_detection",
         "MaxhResults": 50
     },
       {
         "Tipe": "image_properties",
         "MaxhResults": 50
     }
    ]
   }
  ]
}

Dalam kode di atas, Anda telah mengindikasikan gambar untuk dianalisis, serta fitur API tertentu untuk digunakan, termasuk deteksi wajah dan deteksi tengara. Safe_search_detection. Sangat bagus untuk mengetahui apakah gambar aman dan dalam kategori apa itu milik, seperti konten dewasa atau kekerasan. Image_properties. memberi tahu Anda tentang warna dan detail level piksel.

Untuk menjalankan perintah Curl, di antarmuka terminal atau baris perintah Anda, masukkan yang berikut ini.

 Curl -x Post -H "Otorisasi: Bearer" $ Aplikasi Laporan-Auth-Default-Access-Token) -H "Jenis Konten: Aplikasi / JSON; Charset = UTF-8" --Data-binary @ google_vision.json "https://vision.googLeapis.com/v1/images:Annotate" & gt; HASIL

Dengan menggunakan & gt; HASIL Sintaks, Anda akan menyimpan hasilnya dalam file baru yang disebut hasil untuk Anda. Anda menunjukkan URL ke API ( "https://vision.googLeapis.com/v1/images:Annotate" ) dan termasuk data JSON Anda ke POS untuk itu.

Anda mungkin diminta pertama kali Anda menggunakan ini untuk mengaktifkan API atau mengizinkan akses. Jawab ya atau y untuk prompt itu dan itu harus mengembalikan JSON.

Jika Anda membuka file hasil, Anda akan mendapatkan hasil data JSON dari permintaan Vision API. Ini potongan:

{
  "Responses": [
    {
      "Labelnotations": [
        {
          "MID": "/ m / 0bt9lr",
          "Deskripsi": "Anjing",
          "Skor": 0.982986,
          "Topikal": 0.982986
        },
        {
          "pertengahan": "/ m / 01t032",
          "Deskripsi": "Golden Retriever",
          "Skor": 0.952482,
          "Topikal": 0.952482
        },
        {
...

Anda melihat beberapa hasil yang sangat berguna segera. Di bawah labelnotations. Node, Anda dapat melihat pertandingan 98 persen yang gambar berisi "anjing" dan pertandingan 95 persen yang berisi "Golden Retriever"! AI sudah mengidentifikasi konten gambar dan detail lainnya, termasuk "moncong" dan fakta itu kemungkinan "anjing olahraga".

Ini membutuhkan pelatihan di pihak Anda karena sistem Google Vision AI yang sudah terlatih. Memindai melalui hasil, Anda akan melihat semuanya dari wilayah panen yang direkomendasikan - untuk gambar pemangkasan otomatis ke subjek - hingga detail luar biasa dari apa yang ada dalam gambar, termasuk warna dan konten. Cobalah dengan gambar lain untuk melihat seberapa kuat API.

Anda dapat terus menggunakan metode ini untuk menguji panggilan yang akan kami gunakan. Anda juga dapat mengatur SDK lokal dalam bahasa yang Anda sukai dan mengintegrasikannya ke dalam aplikasi Anda.

07. Instal Perpustakaan Klien

Selanjutnya Anda akan membuat aplikasi berbasis web sederhana untuk menunjukkan cara mengintegrasikan API ke dalam proyek Anda.

Ada sejumlah SDK yang tersedia dalam berbagai bahasa untuk membuat integrasi mudah. Anda akan menggunakan PHP SDK untuk bagian ini berikutnya. Jika Anda ingin men-tweak kode yang mengikuti ke dalam bahasa yang berbeda, ada sumber daya SDK yang bagus sini .

Mulailah dengan memastikan Anda memiliki folder proyek di server lokal atau jarak jauh Anda. Jika Anda belum memilikinya, dapatkan komposer dan instal ke folder proyek Anda. Secara opsional, Anda mungkin sudah menginstal komposer secara global dan itu juga baik-baik saja.

Jalankan perintah komposer berikut untuk menginstal file vendor untuk Cloud Vision SDK.

 PHP -R "salin ('https://getcomposer.org/installer', 'komposer-setup.php');"
PHP -R "jika (hash_file ('SHA384', 'komposer-setup.php') === '93B54496392C0627746 70AC18B134C3B3A95E5C8E5C8
f1a9f115f203b75bf9a129d5daa8ba6a13e2cc8a1da080.
6388A8 ') {echo' installer diverifikasi '; } else {echo 'installer corrupt'; tautan tautan ('komposer-setup.php'); } echo php_eol; "
PHP Composer-Setup.php
php -r "tautan tautan ('komposer-setup.php');"
PHP Composer.phar memerlukan Google / Cloud-Vision

Komposer membuat folder vendor di folder proyek Anda dan menginstal semua dependensi untuk Anda. Jika Anda terjebak mengatur ini dan ingin menggunakan PHP, Anda dapat memeriksa ini Menginstal sumber daya komposer .

08. Buat file baru

Buat file PHP baru di folder proyek Anda. Atur namun Anda suka tetapi sertakan formulir HTML sederhana untuk mengunggah gambar untuk pengujian cepat. Berikut ini adalah contoh file PHP dengan formulir termasuk:

 & lt;! DOCTYPE HTML & GT;
& lt; html & gt;
& lt; head & gt;
& lt; judul & gt; net - tutorial visi komputer & lt; / judul & gt;
& lt; / head & gt;
& lt; tubuh & gt;
& lt; form action = "index.php" enctipe = "multipart / form-data" Metode = "post" & gt;
& lt; h1 & gt; pilih gambar & lt; / h1 & gt;
& lt; input type = "file" name = "file" & gt; & lt; br / & gt; & lt; br / & gt;
& lt; input type = "Kirim" nilai = "unggah gambar" nama = "kirim" & gt; & lt; br / & gt;
& lt; / form & gt;
& lt; div class = "Hasil" & gt;
& lt;? php
// kode PHP pergi di sini //
Jika (! ISSET ($ _ POST ['Kirim'])) {Die (); }
? & gt;
& lt; / div & gt;
& lt; / body & gt;
& lt; / html & gt;

Kode ini mencakup file HTML dasar dengan formulir dan placeholder untuk kode PHP. Kode mulai memeriksa keberadaan gambar, dikirim dari formulir. Jika belum diajukan, itu tidak ada.

09. Simpan gambar

Jika Anda lebih suka menunjuk ke gambar secara online atau di sistem Anda, lewati langkah ini. Jika Anda ingin memproses gambar yang Anda pilih, tambahkan kode ini untuk menyimpan gambar yang dipilih.

 // simpan gambar
$ filepath = $ _files ["file"] ["nama"];
if (move_uploaded_file ($ _ file ["file"] ["tmp_name"], $ filepath)) {
echo "& lt; p & gt; & lt; img src =". $ filepath. "gaya = 'lebar: 400px; tinggi: auto; / & gt; & lt; / p & gt; ";
} lain {
Echo "Kesalahan !!";
}

10. Tambahkan variabel lingkungan

Anda perlu mengatur Google_application_credentials. variabel untuk itu untuk mengautentikasi. Di PHP kami menggunakan Putenv. perintah untuk mengatur variabel lingkungan. Tambahkan kode ini selanjutnya dalam kode PHP Anda:

 putenv ('google_application_credentials = / pengguna / richardmattka / unduhan / visi tutorial 1-0F464A9A0F7B.JSON');

Ganti path dan nama file ke file kunci pribadi JSON Anda.

11. Sertakan perpustakaan

Tambahkan perpustakaan dan inisialisasi LanguAbligent. kelas dalam kode Anda. Tambahkan kode ini Berikutnya:

 Membutuhkan __dir__. '/vendor/autoload.php';
Gunakan Google \ cloud \ vision \ v1 \ imageannotatorclient;
$ ProjectID = 'Vision-tutorial-1';
$ imageannotator = BARU imageannotatorclient ([
    'ProjectID' = & gt; $ ProjectID.
]);

Mulailah dengan mengharuskan vendor autoload. Ini mirip dalam python atau node ketika Anda memerlukan dependensi Anda. Impor Imageannotatorclient. Selanjutnya, untuk memanfaatkan kelas. Tentukan .. proyektid . Jika Anda tidak yakin apa ini, cari di konsol proyek Google Cloud Anda. Akhirnya, buat yang baru Imageannotatorclient. objek menggunakan proyekID Anda dan tetapkan ke $ imajeannotator. variabel.

12. Menganalisis konten gambar

Mulai mengirimkan gambar ke API untuk analisis. Anda akan menampilkan hasilnya sebagai JSON ke layar untuk saat ini tetapi dalam praktiknya Anda dapat menilai hasilnya dan menggunakannya dengan cara apa pun yang Anda inginkan.

Tambahkan yang berikut untuk mengirimkan gambar ke API.

 $ gambar = file_get_contents ($ filepath);
$ respons = $ imajeannotator- & gt; labeldetection ($ gambar);
$ label = $ respons- & gt; getlabelnannotations ();

foreach ($ label sebagai $ label) {
echo "& lt; div class = 'Hasil' & gt;";
$ Hasil = $ label- & gt; DEKNASI ();
echo $ hasil. "(". $ label- & gt; GetScore (). ")";
echo "& lt; / div & gt;";
}

Ini mengirimkan konten dari formulir yang dikirim ke imageannotator. titik akhir dan menyimpan hasilnya di $ response. variabel. Ini menentukan labeldetection. fitur. Anda juga bisa menggunakan deteksi wajah , Logodeteksi , TextDetection. dan banyak fungsi lainnya. Untuk daftar lengkap, Periksa di sini .

Selanjutnya, beralih melalui daftar label. Ini hanya contoh untuk menunjukkan cara menggunakannya: Anda dapat memprosesnya dan bereaksi terhadap hasil namun yang Anda butuhkan.

13. Mendeteksi Faces.

A guide to Google's Cloud Vision: Face detection — Menggunakan fungsi eksprasi API visi, Anda dapat menemukan emosi dan kotak-kotak wajah di gambar

Contoh cepat lain dari seberapa kuat API terletak di deteksi wajah fungsi. Ini akan mengembalikan data emosi serta informasi lokasi di mana dalam gambar wajah. Cobalah kode ini untuk melihat cara kerjanya.

 $ respons = $ imajeannotator- & gt; menguntungkan ($ gambar);
$ FACES = $ Response- & gt; GetFaceancations ();

$ likelihoodname = ['tidak diketahui', 'sangat_unlikely', 'tidak mungkin',
    'Kemungkinan', 'Kemungkinan', 'sangat_likely'];
// var_dump ($ label);

foreach ($ wajah sebagai $ face) {
echo "& lt; div class = 'Hasil' & gt;";
$ kemarahan = $ face- & gt; getangerlikelihood ();
PrintF ("kemarahan:% s". php_eol, $ likelihoodname [$ kemarahan]);
$ Joy = $ face- & gt; getjoylikelihood ();
    printf ("Joy:% s". php_eol, $ likelihoodname [$ sukacita]);
$ simpul = $ face- & gt; getboundingpoly () - & gt; getvernes ();
    $ batas = [];
    foreach ($ simpul sebagai $ vertex) {
        $ batasan [] = sprintf ('(% d,% d)', $ vertex- & gt; getx (), $ vertex- & gt; gety ());
    }
    Cetak ('batasan:'. Bergabunglah (',', $ batas). php_eol);
echo "& lt; / div & gt;";
}

Anda mulai dengan menggunakan deteksi wajah fungsi anotator dan lulus pada gambar seperti contoh sebelumnya. Maka Anda mendapatkan faceannotiatons. . Anda menggunakan array bobot respons dalam bahasa yang lebih umum, sehingga Anda dapat melihat kemungkinan emosi tertentu. Setelah ini, Anda mengulangi respons seperti sebelumnya. Anda memeriksa dua dari beberapa kemungkinan emosi, kemarahan dan sukacita, mengembalikan hasilnya. Ini juga akan memberi Anda sudut-sudut kotak pembatas yang menentukan setiap wajah yang ditemukan.

Artikel ini awalnya diterbitkan dalam masalah 316 dari bersih , majalah terlaris di dunia untuk desainer dan pengembang web. Beli masalah 316 di sini atau berlangganan di sini .

Artikel terkait:

Alat AI yang luar biasa merekonstruksi foto seperti sihir
17 Alat Top di Google Analytics
Editor Kode Terbaik

Panduan untuk Visi Cloud Google

Apa itu Visi Komputer?

Visi Komputer dengan Google Vision Vision API

01. Siapkan proyek cloud

02. Aktifkan Cloud Vision API

03. Buat Akun Layanan

04. Unduh Kunci Pribadi

05. Tetapkan variabel lingkungan

06. Panggilan ke API

07. Instal Perpustakaan Klien

08. Buat file baru

09. Simpan gambar

10. Tambahkan variabel lingkungan

11. Sertakan perpustakaan

12. Menganalisis konten gambar

13. Mendeteksi Faces.

Bagaimana caranya - Artikel Terpopuler

Buat stylus Anda sendiri dengan hanya 4 item rumah tangga (Serius)

Cara Membangun Blog dengan Jekyll

Sihir Topeng Gambar Kerja dengan Houdini

Memahami pipa impor aset persatuan

Cara memproteksipe aplikasi seluler dengan Origami Studio

Cara membuat lampu lava dengan keyshot

Cara mengilustrasikan untuk suatu peristiwa

cat dikontrol dan stroke yang halus dengan cara yang luar biasa

Kategori