Un ghid pentru viziunea Cloud Google

Jan 31, 2026

să

Învățare automată. Invatare profunda. Prelucrarea limbajului natural. Viziunea computerului. Automatizare. Recunoaștere vocală. Probabil ați auzit toți acești și mulți alți termeni recent, toate sub umbrela inteligenței artificiale. De fapt, câmpul crește atât de rapid, devine din ce în ce mai dificil de a introduce o definiție definitivă. AI devine parte din aproape toate aspectele vieții noastre, de la Site-urile de eCommerce și motoarele de căutare pentru a debloca telefonul.

Site-urile și aplicațiile dvs. pot influența API-urile să atingă direct la puterea AI. Fără a fi nevoie să "pregătească" agenții AI, puteți profita de cantitățile masive de date deja analizate. Google, Amazon, IBM și multe altele au creat puncte finale pentru dezvoltatori să se conecteze și să înceapă să folosească imediat AI.

Pe capătul frontal, puteți conecta comenzi vocale, interfețe chatbot sau elemente creative WebGL reactive. Pe partea din spate, bazele de date utilizează algoritmi inteligenți pentru a maximiza viteza și analiza. API-urile pot oferi un strat de abstractizare dintr-o gamă largă de funcții AI, de la previziuni la formarea colectivă.

Amintiți-vă, dacă faceți site-ul dvs. mai complex, este vital să evaluați alegerea dvs. de web hosting serviciu pentru a vă asigura că se poate descurca. Efectuarea unui site de la zero? Luați în considerare simplificarea procesului cu un top Builder de site-uri web . Și dacă creați un nou sistem de proiectare , este important să îl păstrați în siguranță și accesibil la decent Stocare in cloud .

Un ghid pentru Google Web Tools

Ce este viziunea computerului?

Computer Vision este studiul și crearea sistemelor artificiale care extrag informații din imagini. De asemenea, poate cuprinde sistemul mecanic de viziune în sine. În ceea ce privește recunoașterea, este procesul de analiză și determinare a conținutului unei imagini sau a unei serii de imagini (inclusiv video). Acest lucru ar putea include scanări medicale, fotografii, video de 360 de grade și practic orice fel de imagini pe care le puteți imagina.

AI-Powered Computer Vision poate:

Identificați, etichetați și clasificați conținutul
Detectați fețele și emoțiile
Recunoașteți hainele de îmbrăcăminte, cum ar fi ochelarii și pălăriile
Identificați repere, clădiri și structuri
Evaluați informațiile la nivel de pixeli, cum ar fi datele de culoare, calitatea și rezoluția
Recunoașteți logo-urile populare
Identificați și citiți textul
Identificați imagini potențial inadecvate

Viziunea computerului cu API-ul Cloud Cloud Google

Există o mulțime de opțiuni pentru Vision API, dar vom folosi API-ul de Vision Google Vision API. Google găzduiește multe API API, inclusiv prelucrarea limbajului natural, recunoașterea vocii, învățarea profundă și viziunea.

Cloud Vision API permite site-urile și aplicațiile dvs. să înțeleagă ce este într-o imagine. Acesta va clasifica conținutul în categorii, etichetarea tot ceea ce vede. De asemenea, oferă un scor de încredere, astfel încât știi cât de probabil este că ceea ce crede este într-o imagine de fapt apare acolo. Puteți folosi acest lucru pentru a interacționa inteligent în ceea ce privește intrarea camerei în aplicații AR sau video. Ați putea crea instrumente pentru a ajuta pe cei care sunt afectați vizual. Puteți crea asistenți pentru a ajuta la identificarea clădirilor sau reperelor turiștilor. Posibilitățile sunt nesfârșite.

01. Configurați un proiect Cloud

Dacă ați folosit API-urile Google înainte, unii dintre acești primii pași vor fi familiarizați. Ca și în cazul altor servicii Google, va trebui să configurați un proiect cloud. Du-te la. Consola de platformă Google Cloud și creați un nou proiect sau selectați unul existent. La fel ca majoritatea serviciilor Google, API-ul Vision Cloud este liber să se utilizeze până când începeți să faceți o mulțime de cereri API. Este posibil să fie necesar să introduceți informații de facturare atunci când activați API, dar acest lucru nu este încărcat la un volum scăzut de solicitări și puteți elimina serviciile după ce ați terminat testul.

02. Activați API-ul Vision Cloud

A guide to Google's Cloud Vision: Enable the Cloud Vision API — Răsfoiți biblioteca API și apoi activați API-ul Vision Cloud

Răsfoiți. Biblioteca API și selectați Cloud Vision API pentru proiectul dvs.

Odată activată, ar trebui să vedeți un mic verificare verde și mesajul "API-ul a permis" de lângă el.

03. Creați un cont de servicii

Apoi, va trebui să configurați a Contul de serviciu . Gândiți-vă la API ca serviciu web pe care îl creați. Din moment ce vom configura o utilizare ca un serviciu tipic, aceasta este cea mai bună practică. De asemenea, funcționează cel mai bine cu fluxul de autentificare.

04. Descărcați cheia privată

A guide to Google's Cloud Vision: Create a service account — Obțineți cheia dvs. privată pentru contul de servicii

Odată ce aveți un proiect cu API activat și un cont de servicii, puteți descărca cheia dvs. privată ca fișier JSON. Luați notă de locația fișierului, astfel încât să o puteți utiliza în pașii următori.

Dacă aveți probleme cu primii pași, există Un ghid de pornire rapidă care ajută și se termină cu descărcarea cheii JSON.

05. Setați variabila de mediu

Trebuie să setați Google_application_redențiales. Variabila de mediu, astfel încât aceasta poate fi accesată prin apelurile noastre API. Acest lucru indică fișierul JSON pe care tocmai l-ați descărcat și vă salvează că trebuie să introduceți calea de fiecare dată. Deschideți o nouă fereastră terminală și utilizați export comandă ca așa:

export GOOGLE_APPLICATION_CREDENTIALS="/Users/[username]/Downloads/[file name].json"

Inlocuieste [nume de utilizator] cu numele dvs. de utilizator. Asigurați-vă că calea către locul pe care ați stocat fișierul cheie privat este corect. Inlocuieste [nume de fișier] Cu fișierul dvs. cheie privat și utilizați calea către fișierul dvs.

Pe Windows, puteți face același lucru prin linia de comandă, astfel:

$env:GOOGLE_APPLICATION_CREDENTIALS="C:\Users\[username]\Downloads\[FILE_NAME].json"

Notă: Dacă închideți fereastra terminalului sau a consolei, este posibil să fie necesar să rulați acest lucru din nou pentru a seta din nou variabila. Vom adăuga acest lucru în codul nostru PHP la scurt timp, deci nu trebuie să vă faceți griji din nou.

06. Faceți un apel către API

Acum sunteți gata să vă săpați în Vision API. Veți folosi curl pentru a efectua teste rapide ale API-ului. De asemenea, puteți utiliza această metodă de la codul dvs., de asemenea.

Cererile de curl pot fi făcute în cele mai multe limbi, indiferent dacă sunt PHP, Python sau Nod. În acest fel, puteți efectua apelurile direct în linia de comandă sau puteți atribui rezultatul unei variabile în limba de alegere. Găsiți câteva sfaturi rapide despre utilizarea curlului Aici .

Creați un fișier simplu JSON pentru a organiza detaliile cererii. Sunați-l google_vision.json. . Stocați-l local la locul în care doriți să rulați comenzile terminalelor de la.

 {{{{{
 "Solicitări":
    {
      "imagine":{
      "sursă":{
      "Imageuri":
      "https://upload.wikimedia.org/wikipedia/commons/9/93/golden_retrorever_carlos_%2810581910556%29.jpg"
         }
     },
       "Caracteristici": [{
         "Tip": "Type_unspecified",
         "Maxresults": 50
     },
       {
         "Tip": "Landmark_Detective",
         "Maxresults": 50
     },
       {
         "Tip": "fata_detection",
         "Maxresults": 50
     }
       {
         "Tip": "Label_detecție",
         "Maxresults": 50
     },
       {
         "Tip": "text_detecție",
         "Maxresults": 50
     },
       {
         "Tip": "SAFE_SEARCH_DETECTION",
         "Maxresults": 50
     },
       {
         "Tip": "image_properties",
         "Maxresults": 50
     }
    ]
   }
  ]
}

În codul de mai sus, ați indicat o imagine de analiză, precum și caracteristici specifice API pentru utilizare, inclusiv detectarea feței și detectarea reperului. SAFE_SEARCH_DETECTION. Este minunat pentru a ști dacă imaginea este în siguranță și în ce categorie aparține, cum ar fi conținutul adulților sau violența. Image_properties. vă spune despre culori și detalii la nivel de pixeli.

Pentru a executa comanda CURL, în interfața de linie terminală sau de comandă, introduceți următoarele.

 CURL -X Post-H "Autorizare: Purtător" $ (GCLOOD ACCEPT-Application-implicit Imprimare-token-token) -H "Content-Tip: Aplicație / JSON; CHARSET = UTF-8" --Data-binar @ google_vision.json "https://vision.googleapis.com/v1/images:annotate" & gt; Rezultate

Folosind. & gt; Rezultate Sintaxă, veți avea rezultatele stocate într-un fișier nou numit rezultate pentru dvs. Ați indicat adresa URL la API ( "https://vision.googleapis.com/v1/images:annotate" ) și a inclus datele dvs. JSON la POST la ea.

Puteți fi solicitat prima dată când utilizați acest lucru pentru a activa API-ul sau permite accesul. Răspundeți da sau y la acel prompt și ar trebui să returneze JSON.

Dacă deschideți fișierul de rezultate, veți obține rezultatele datelor JSON din cererea Vision API. Iată un fragment:

{
  "Răspunsuri":
    {
      "Labalantations": [
        {
          "MID": "/ m / 0BT9LR",
          "Descriere": "câine",
          "Scorul": 0.982986,
          "Topicalitate": 0.982986
        },
        {
          "MID": "/ m / 01T032",
          "Descriere": "Aur retriever",
          "Scorul": 0.952482,
          "Topicalitate": 0.952482
        },
        {
...

Vedeți imediat câteva rezultate utile. Sub Labalantații Nod, puteți vedea un meci de 98% că imaginea conține un "câine" și un meci de 95% că conține un "retriever de aur"! AI a identificat deja conținutul imaginii și al altor detalii, inclusiv un "bout" și faptul că este probabil un "câine sportiv".

Acest lucru nu a cerut nici o pregătire din partea dvs. din cauza sistemului deja instruit Google Vision AI. Scanarea prin rezultate, veți vedea totul din regiunile de recoltare recomandate - pentru imaginile automate la subiecți - la detalii incredibile ale ceea ce este în imagini, inclusiv culori și conținut. Încercați-l cu alte imagini pentru a vedea cât de puternic este API-ul.

Puteți continua să utilizați această metodă pentru a testa apelurile pe care le vom utiliza. De asemenea, puteți configura un SDK local într-un limbaj pe care îl preferați și îl integrați în aplicația dvs.

07. Instalați biblioteca clientului

Apoi, veți face o aplicație simplă bazată pe web pentru a arăta cum să integrați API-ul în proiectele dvs.

Există un număr de SDK-uri disponibile într-o varietate de limbi pentru a face integrarea ușoară. Veți folosi PHP SDK pentru această secțiune următoare. Dacă doriți să optimizați codul care urmează într-o altă limbă, există o mare resursă a SDKS Aici .

Începeți prin asigurarea că aveți un folder de proiect configurat pe serverul local sau la distanță. Dacă nu aveți deja, obțineți compozitor și instalați-l în dosarul proiectului dvs. Opțional, este posibil să aveți compozitor deja instalat la nivel global și și asta este bine.

Rulați următoarea comandă compozitor pentru a instala fișierele furnizorului pentru Vision SDK.

 PHP -R "Copiere (" https://getocposer.org/installer "," compozitor-setup.php ");"
PHP -R "dacă (Hash_file (" SHA384 ',' COMPOSER-SETUP.PHP ') ===' 93B54496392C0627746 70AC18B134C3B3A95E5A5E5C8
F1A9F115F203B75BF9A129D5DAA8BA6A13E2CC8A1DA080.
6388A8 ') {Echo' Installer verificat "; } altfel {Echo 'Installer corupt'; Unlink ("compozitor-setup.php"); } eco php_eol; "
PHP compozitor-setup.php
PHP -R "Unlink (" compozitor-setup.php ");"
PHP compozitor.phar necesită Google / Cloud-Vision

Compozitorul face un dosar furnizor în dosarul proiectului și instalează toate dependențele pentru dvs. Dacă vă blocați să setați acest lucru și doriți să utilizați PHP, puteți verifica acest lucru Instalarea resurselor compozitorului .

08. Creați un fișier nou

Creați un nou fișier PHP în dosarul proiectului. Setați-o cu toate acestea doriți, dar includeți un formular HTML simplu pentru a încărca imagini pentru testare rapidă. Iată un exemplu de fișier PHP cu formularul inclus:

 și lt;! Doctype HTML & GT;
& lt; html & gt;
& lt; head & gt;
& lt; titlu & gt; net - Computer Vision Tutorial & Lt; / Title & GT;
& lt; / head & gt;
& lt; corp & gt;
& Form Action = "index.php" enctype = "Multipart / Formați" Metoda = "Post" & GT;
& lt; h1 & gt; selectați imaginea

Codul include un fișier HTML de bază cu un formular și un substituent pentru codul PHP. Codul începe să verifice existența imaginii, trimisă din formular. Dacă nu se depune încă, nu face nimic.

09. Stocați imaginea

Dacă preferați să indicați imaginile online sau pe sistemul dvs., săriți acest pas. Dacă doriți să procesați imaginile pe care le selectați, adăugați acest cod pentru a salva imaginea selectată.

 // Salvați imaginea
$ FilePath = $ _files ["Fișier"] ["Nume"];
Dacă (muy_uploadd_file (fișiere $ _ ["Fișier"] ["tmp_name"], $ filepath)) {
Echo "& lt; img src =". $ FILEPATH. "STYLE =" Lățime: 400px; Înălțime: Auto; / & gt; / lt; / p & gt; ";
} altfel {
ECHO "ERROR !!";
}

10. Adăugați variabila de mediu

Trebuie să setați Google_application_redențiales. variabilă pentru a se autentifica. În PHP folosim putenv. pentru a seta o variabilă de mediu. Adăugați acest cod în continuare în codul PHP:

 Putenv ("Google_Application_Credentials = / Utilizatori / Richardttka / Downloads / Vision Tutorial 1-0F464A9A0F7B.JSON ');

Înlocuiți calea și numele fișierului în fișierul cheie privat JSON.

11. Includeți biblioteca

Adăugați biblioteca și inițializați Languagelient clasa din codul dvs. Adăugați acest cod următor:

 necesită __dir__. "/vendor/autolod.php";
Utilizați Google \ cloud \ viziune \ v1 \ imageannotatorClient;
$ proiectid = "Vision-tutorial-1 ';
$ imageannotator = New ImageannotatorClient ([
    "proiectid" = & gt; $ proiectid.
]);

Începeți prin solicitarea vânzătorului Autoload. Acest lucru este similar în python sau nod atunci când aveți nevoie de dependențele dvs. Importați. ImageannotatorClient Apoi, pentru a utiliza clasa. Definiți-vă proiectid . Dacă nu sunteți sigur ce este, uitați-vă în consola Google Cloud Project. În cele din urmă, creați un nou ImageannotatorClient obiect care utilizează proiectidul dvs. și alocați-l $ imageannotator. variabil.

12. Analizați conținutul imaginii

Începeți să trimiteți imaginea la API pentru analiză. Veți afișa rezultatul ca JSON pe ecran pentru moment, dar în practică ați putea evalua rezultatele și le puteți folosi în orice fel în care doriți.

Adăugați următoarele pentru a trimite imaginea la API.

 $ image = file_get_contents ($ filepath);
$ răspuns = $ imageannotator- & gt; etichete ($ image);
$ etichete = $ răspuns- & gt; getlabalantations ();

foreach ($ etichete ca etichetă $) {
ECHO "& LT; DIV CLASS = 'REZULTAT" & GT;
$ rezultat = $ etichetă- & gt; getDesscrie ();
rezultatul Echo $. "(" $ etichetă- & gt; getscore (). ")";
ECHO "& LT; / DIV & GT;";
}

Acest lucru depune conținutul din formularul trimis la ImageanNotator. punct final și stochează rezultatul în $ răspuns variabil. Specifică. Labeldetecție caracteristică. De asemenea, puteți utiliza detectare facială , Logodetecție , TextDetecție și multe alte funcții. Pentru o listă completă, Verificați aici .

Apoi, iterați pe lista de etichete. Acesta este doar un exemplu pentru a arăta cum să îl utilizați: ați putea procesa și să reacționați la rezultatele totuși aveți nevoie.

13. Detectați fețele

A guide to Google's Cloud Vision: Face detection — Folosind funcția de detecție a API-ului Vision, puteți găsi emoțiile și cutiile de legare ale fețelor din imagine

Un alt exemplu rapid de cât de puternic este API-ul minciuni în detectare facială funcţie. Acest lucru va returna datele emoționale, precum și informații despre locație despre locul în care în imagine sunt fețele. Încercați acest cod pentru a vedea cum funcționează.

 $ răspuns = $ imageannotator- & gt; Facedetecție ($ imagine);
$ fete = $ răspuns- & gt; getfaceanNoatatii ();

$ probabilitate = ["necunoscut", "foarte_unchelly", "puțin probabil",
    "Posibil", "probabil", "foarte");
// var_dump (etichete $);

foreach ($ fete ca $ fata) {
ECHO "& LT; DIV CLASS = 'REZULTAT" & GT;
$ anger = $ fata- & gt; get de baie ();
printf ("furie:% s". php_eol, $ lematnames [$ furie]);
$ bucurie = $ fata- & gt; getjoyLayHend ();
    printf ("bucurie:% s". php_eol, $ lemat exemplu [$ bucurie]);
$ nordices = $ fata- & gt; getboundpolingpolypolypoly () - și gt) ();
    $ limite = [];
    foreach ($ nordices ca $ vertex) {
        $ limite [] = sprintf ('(% d,% d)', $ vertex- & gt; getx (), $ vertex- & gt; gety ());
    }
    Imprimare ("limite:". Alăturați-vă ("," limitele $). php_eol);
ECHO "& LT; / DIV & GT;";
}

Începeți folosind utilizarea detectare facială Funcția annotatorului și treceți în imagine, cum ar fi exemplul anterior. Apoi obțineți Faceannotons. . Utilizați o serie de greutăți de răspuns în limbaj mai comun, astfel încât să puteți vedea probabilitatea unor emoții. Urmând acest lucru, iterați răspunsul ca înainte. Verificați două dintre mai multe emoții posibile, furie și bucurie, returnând rezultatele celor. Acest lucru vă va oferi, de asemenea, colțurile cutiilor delimitate care definesc fiecare față găsită.

Acest articol a fost inițial publicat în numărul 316 din net , cea mai bună revistă din lume pentru designeri și dezvoltatori web. Cumpărați problema 316 aici sau Abonați-vă aici .

Articole similare:

Uimitor instrument AI reconstruiește fotografiile ca magia
17 instrumente de top în Google Analytics
Cei mai buni editori de coduri

Un ghid pentru viziunea Cloud Google

Ce este viziunea computerului?

Viziunea computerului cu API-ul Cloud Cloud Google

01. Configurați un proiect Cloud

02. Activați API-ul Vision Cloud

03. Creați un cont de servicii

04. Descărcați cheia privată

05. Setați variabila de mediu

06. Faceți un apel către API

07. Instalați biblioteca clientului

08. Creați un fișier nou

09. Stocați imaginea

10. Adăugați variabila de mediu

11. Includeți biblioteca

12. Analizați conținutul imaginii

13. Detectați fețele

să - Cele mai populare articole

Cum să repostați pe Instagram

3 Tehnici esențiale de retopologie Zbrush

Construiți un UI controlat de voce

Folosiți butonul de instrumente MARMOSET pentru a prezenta modele în VR

Controlul versiunii master pentru echipele la distanță

Începeți cu platforma de animație cu Greensock

Cum se creează active digitale

Construiți un site de comerț electronic de la zero

Categorii