Průvodce pro službu Google Cloud Vision

Feb 2, 2026

jak

Strojové učení. Hluboké učení. Zpracování přirozeného jazyka. Počítačové vidění. Automatizace. Hlasové rozpoznávání. Pravděpodobně jste slyšeli všechny tyto a mnoho dalších termínů nedávno, všechny pod deštníkem umělé inteligence. Ve skutečnosti, pole roste tak rychle, je stále obtížnější zpívat definitivní definici. AI se stává součástí téměř každého aspektu našich životů, od webové stránky eCommerce a vyhledávače pro odemknutí telefonu.

Vaše webové stránky a aplikace mohou využít API, aby poklepali přímo do síle AI. Bez nutnosti "vlaku" AI agentů můžete využít masivní množství dat, které již analyzovány. Google, Amazon, IBM a mnoho dalších vytvořily koncové body pro vývojáře, aby se připojili a začali používat AI hned.

Na předním konci můžete připojit hlasové příkazy, chatbotová rozhraní nebo reaktivní prvky tvůrčích webggl. Na zadní straně, databáze používají inteligentní algoritmy pro maximalizaci rychlosti a analýzy. API může poskytnout vrstvu abstrakce ze široké škály funkcí AI, od předpovědí do kolektivního školení.

Pamatujte si, že pokud děláte své stránky složitější, je důležité, abyste zhodnotili svůj výběr web hosting Služba, aby se ujistila, že to zvládne. Dělat místo od nuly? Zvažte zjednodušení procesu s vrcholem Webové stránky Builder. . A pokud vytváříte nový Systém návrhu Je důležité, aby bylo bezpečné a přístupné ve slušném cloudové úložiště .

Průvodce webovým nástrojům Google

Co je to počítačové vidění?

Počítačové vidění je studium a tvorba umělých systémů, které extrahují informace z obrázků. Může také zahrnovat mechanický systém zraku sám. Z hlediska uznání je proces analyzování a určení obsahu obrazu nebo série snímků (včetně videa). To by mohlo zahrnovat lékařské skenování, fotky, video 360 stupňů a prakticky jakýkoliv druh snímků si dokážete představit.

Počítačové vidění AI může:

Identifikovat, štítek a kategorizovat obsah
Detekovat tváře a emoce
Rozpoznat pokrývky hlavy, jako jsou brýle a klobouky
Identifikovat orientační body, budovy a struktury
Posoudit informace o úrovni pixelů, jako jsou barevná data, kvalita a rozlišení
Rozpoznat populární loga
Identifikujte a přečtěte si text
Identifikujte potenciálně nevhodné obrázky

Počítačové vidění s aplikací Google Cloud Vision API

Existuje spousta možností pro API vidění, ale my budeme používat API služby Google Cloud Vision. Google hostí mnoho AI API, včetně zpracování přirozeného jazyka, rozpoznávání hlasu, hlubokého učení a vidění.

API Cloud Vision API umožňuje vašim stránkám a aplikacím pochopit, co je v obraze. Bude klasifikovat obsah do kategorií, označování všeho, co vidí. To také poskytuje skóre spolehlivosti, takže víte, jak je to pravděpodobné, že to, co je přesvědčeno, je v obraze vlastně se objevuje. Můžete to použít k interakci inteligentně o vstupu fotoaparátu v aplikacích AR nebo videa. Můžete vytvořit nástroje, které pomáhají těm, kteří jsou zrakově postiženi. Můžete vytvořit asistenty, které pomáhají identifikovat budovy nebo orientační body pro turisty. Možnosti jsou nekonečné.

01. Nastavte projekt Cloud

Pokud jste použili API Google dříve, některé z těchto prvních kroků budou obeznámeni. Stejně jako u jiných služeb Google, budete muset nastavit projekt Cloud. Jít do Konzola platformy Google Cloud A vytvořte nový projekt nebo vyberte existující. Stejně jako většina služeb Google, API Cloud Vision API je volný, dokud nezačnete dělat spoustu požadavků API. Možná budete muset zadat fakturační informace při aktivaci rozhraní API, ale to není účtováno při nízkém objemu požadavků a můžete služby odebrat po provedení testování.

02. Povolit API Cloud Vision

A guide to Google's Cloud Vision: Enable the Cloud Vision API — Prohlédněte si knihovnu API a pak povolte API Cloud Vision API

Prohlédněte si API knihovna a vyberte API Cloud Vision API pro váš projekt.

Po povolení byste měli vidět malou zelenou kontrolu a zprávu "API povoleno" vedle něj.

03. Vytvořit účet služby

Dále budete muset nastavit Servisní účet . Přemýšlejte o API jako webovou službu, kterou vytváříte. Vzhledem k tomu, že budeme nastavit používání jako typická služba, to je nejlepší praxe. Pracuje také nejlépe s průtokem autentizace.

04. Stáhnout soukromý klíč

A guide to Google's Cloud Vision: Create a service account — Získejte svůj soukromý klíč pro účet služby

Jakmile budete mít projekt s API povoleným a servisním účtem, můžete si stáhnout soukromý klíč jako soubor JSON. Vezměte na vědomí umístění souboru, takže jej můžete použít v dalších krocích.

Pokud máte nějaké problémy s prvním několika kroky Rychlý průvodce To pomáhá a končí ke stažení klávesy JSON.

05. Nastavte proměnnou prostředí

Musíte nastavit Google_Application_credentials. Environmentální proměnná, takže může být přístupná našimi voláními API. Toto body do souboru JSON, který jste si stáhli a uloží, musíte pokaždé zadat cestu. Otevřete nové svorkovnici a použijte vývozní Příkaz takový:

export GOOGLE_APPLICATION_CREDENTIALS="/Users/[username]/Downloads/[file name].json"

Nahradit [Uživatelské jméno] s vaším uživatelským jménem. Ujistěte se, že cesta k uloženému umístění, který jste uložili soukromý klíč, je správná. Nahradit [název souboru] S souboru soukromého klíče a pomocí cesty do souboru.

V systému Windows můžete udělat totéž prostřednictvím příkazového řádku, jako je tento:

$env:GOOGLE_APPLICATION_CREDENTIALS="C:\Users\[username]\Downloads\[FILE_NAME].json"

Poznámka: Pokud zavřete okno terminálu nebo konzoly, budete možná muset spustit znovu, abyste znovu nastavili proměnnou. Krátce také přidáme do našeho PHP kódu, takže se o to nemusíte obávat.

06. Uskutečněte volání API

Teď jste připraveni kopat do API Cloud Vision API. Budete používat Curl dělat rychlé testy API. Tuto metodu můžete také použít ze svého kódu.

Žádosti Curl mohou být vyrobeny ve většině jazyků, ať už je to PHP, Python nebo uzel. Tímto způsobem můžete zavolat přímo do příkazového řádku nebo přiřadit výsledek proměnné v jazyce dle Vašeho výběru. Najít některé rychlé tipy na použití CURL tady .

Vytvořte jednoduchý soubor JSON, abyste mohli držet podrobnosti o požadavku. Zavolej to Google_vision.json. . Uložte lokální místo, kam chcete spustit příkazy terminálu.

 {
 "Žádosti": [
    {
      "obraz":{
      "zdroj":{
      "Imageuri":
      "https://upload.wikimedia.org/wikipedia/commons/9/93/golden_retriever_carlos_%2810581910556%29.jpg"
         }
     },
       "funkce": [{
         "Typ": "type_unspecifiked",
         "MaxResults": 50
     },
       {
         "Typ": "Landmark_Detection",
         "MaxResults": 50
     },
       {
         "Typ": "face_detection",
         "MaxResults": 50
     }
       {
         "Typ": "Label_Detection",
         "MaxResults": 50
     },
       {
         "Typ": "text_detekce",
         "MaxResults": 50
     },
       {
         "Typ": "Safe_Search_detection",
         "MaxResults": 50
     },
       {
         "Typ": "image_properties",
         "MaxResults": 50
     }
    ]
   }
  ]
}

Ve výše uvedeném kódu jste uvedli obrázek pro analýzu, stejně jako specifické funkce API, které lze použít, včetně detekce obličeje a detekce mezník. Safe_search_detekce Je skvělé pro vědět, zda je obraz bezpečný a v jaké kategorii patří, jako je obsah pro dospělé nebo násilné. Image_properties. Říká vám o barvách a detailech na úrovni pixelů.

Chcete-li provést příkaz CURL, do rozhraní terminálu nebo příkazového řádku zadejte následující.

 Curl -X post -h "Autorizace: nositele" $ (Gcloud Auth Application-Default-Default-token) -h "Obsah typu: Aplikace / JSON; CharSet = UTF-8" --data-binární @ Google_vision.json "https://vision.googleeapis.com/v1/images:annote" & gt; Výsledky

\ t

Pomocí & gt; Výsledek Syntaxe, budete mít výsledky uložené v novém souboru s názvem výsledky pro vás. Určili jste adresu URL do API ( "https://vision.googleeapis.com/v1/images:annote" ) A zahrnuta data JSON POŠTA k tomu.

Můžete získat výzvu při prvním použití pro aktivaci API nebo povolit přístup. Odpověď Ano nebo Y k této výzvě a mělo by vrátit JSON.

Pokud otevřete soubor výsledků, dostanete data Data JSON z požadavku Vision API. Zde je úryvek:

{
  "Odpovědi": [
    {
      "labelananotations": [
        {
          "MID": "/ m / 0BT9LR",
          "Popis": "pes",
          "Skóre": 0.982986,
          "Aktivity": 0.982986
        },
        {
          "Mid": "/ m / 01T032",
          "Popis": "Zlatý retrívr",
          "Skóre": 0.952482,
          "Aktuality": 0.952482
        },
        {
...

Vidíte i velmi užitečné výsledky hned. Pod labelananotations. Uzel, můžete vidět 98% shodu, že obraz obsahuje "pes" a 95% shodu, že obsahuje "zlatý retrívr"! AI již identifikoval obsah obrazu a další detaily, včetně "čenichu" a skutečnost, že je pravděpodobné, že "sportovní pes".

To vyžadovalo žádné školení z vaší strany z důvodu již vyškoleného systému Google Vision AI. Skenování prostřednictvím výsledků, uvidíte vše od doporučených oblastí oříznutí - pro automatické oříznutí obrazů na subjekty - na neuvěřitelné detaily, co je v obrazech, včetně barev a obsahu. Vyzkoušejte to s jinými obrázky, abyste viděli, jak mocná API je.

Můžete pokračovat v používání této metody pro testování hovorů, které používáme. Můžete také nastavit místní SDK v jazyce, který dáváte přednost a integrujte jej do aplikace.

07. Nainstalujte klientskou knihovnu

Dále budete mít jednoduchou webovou aplikaci ukázat, jak integrovat API do svých projektů.

Existuje celá řada sdků dostupných v různých jazycích, aby se integrace snadná. Pro tuto další sekci použijete PHP SDK. Pokud si přejete vyladit kód, který následuje do jiného jazyka, existuje velký zdroj SDK tady .

Začněte tím, že jste ujistili, že máte složku projektu nastavenou na místním nebo vzdáleném serveru. Pokud to už nemáte, získejte skladatele a nainstalujte jej do složky projektu. Volitelně můžete mít skladatel již nainstalován globálně a to je v pořádku.

Spusťte následující příkaz Composer pro instalaci souborů dodavatele pro Cloud Vision SDK.

 PHP -R "Kopírovat ('https://getComposer.org/installer', 'composer-setup.php');
PHP -R "IF (HASH_FILE ('SHA384', 'COMPOSER-SETUP.php') === '93B54496392C0627746 70AC18B134C3B3A95E5A5E5C8
F1A9F115F203B75BF9A129D5DAA8BA6A13E2CC8A1DA080.
6388A8 ') {echo' Installer Ověřeno '; } else {echo 'instalační program poškozen'; un proposer-setup.php '); } echo php_eol; "
PHP COMPOSER-SETUP.PHP
php -r "un propos (" composer-setup.php ");"
php composer.phar vyžaduje Google / cloud-vidění

Skladatel provádí složku dodavatele ve složce projektu a nainstaluje všechny závislosti pro vás. Pokud se vám uvíznete nastavení a chcete použít PHP, můžete to zkontrolovat Instalace prostředku skladatele .

08. Vytvořte nový soubor

Vytvořit nový soubor PHP ve složce projektu. Nastavte jej však, ale uveďte jednoduchý formulář HTML pro nahrávání snímků pro rychlé testování. Zde je příklad souboru PHP s formulářem:

 Doctype html & gt;
& lt; html & gt;
& lt; hlava & gt;
& lt; Název & gt; net - počítačové vidění tutorial & lt; / titul & gt;
& lt; / hlava & gt;
& lt; tělo & gt;
& lt; formulář akce = "index.php" enctype = "Multipart / Form-data" metoda = "post" & gt;
& lt; h1 & gt; zvolte obrázek & lt; / h1 & gt;
& lt; vstup typu = "soubor" název = "soubor" & gt; & lt; br / gt; & lt; br / & gt;
& lt, vstup typu = "Odeslat" hodnota = "Nahrát obrázek" název = "odeslat" & gt; & lt; br / & gt;
& lt; / forma & gt;
& lt, divové třídy = "výsledky" & gt;
php
// PHP kód je zde //
Jestliže (! Isset ($ _ post ['Odeslat'])) {die (); }
? & gt;
& lt; / div & gt;
& lt; / tělo & gt;
& lt; / html & gt;

Kód obsahuje základní soubor HTML s formulářem a zástupným symbolem pro kód PHP. Kód začíná kontrolovat existenci obrazu, odeslaného z formuláře. Pokud ještě není předloženo, nedělá nic.

09. Obrazovka uložte

Pokud byste raději přejdete na obrázky online nebo ve vašem systému, přeskočte tento krok. Pokud si přejete zpracovávat obrázky, které vyberete, přidejte tento kód pro uložení vybraného snímku.

 // Uložit obrázek
$ FilePath = $ _files ["soubor"] ["Jméno"];
Pokud (Move_Uploaded_file ($ _ soubory ["soubor"] ["TMP_NAME"], $ Filepath)) {
echo "& lt; img src =". $ filePath. "Style = 'šířka: 400px; výška: auto;' / gt; & lt; / p & gt; ";
} else {
ECHO "ERROR !!";
}

10. Přidejte proměnnou prostředí

Musíte nastavit Google_Application_credentials. Proměnná pro ověření. V php používáme putenv. příkaz k nastavení proměnné prostředí. Přidat tento kód vedle položky PHP:

 PUTENV ("Google_Application_credentials = / Uživatelé / Richardmattka / Stahování / Výuka ke stažení / Vision Tutorial 1-0F464A9A0F7B.json ');

Nahradit cestu a název souboru do souboru Soubor Soukromý soubor JSON.

11. Zahrnout knihovnu

Přidejte knihovnu a inicializujte LanguageClient. třída ve vašem kódu. Přidat tento kód další:

 Vyžadovat __dir__. '/vendor/autoload.php';
Použijte Google Cloud Vision \ ImagesanNotatorClient;
$ Projectid = 'vize-tutorial-1';
$ imageannotator = nový imageannotatorClient ([
    "Projevid" = & gt; $ projektatel
]);

Začněte tím, že vyžaduje prodejce Autoload. To je podobné v Pythonu nebo uzlu, když požadujete závislosti. Importovat ImageannotatorClient. Dále využít třídu. Definujte svůj projektatel . Pokud si nejste jisti, co je to, podívejte se na konzolu projektu Google Cloud. Nakonec vytvořit nový ImageannotatorClient. objekt pomocí projektového systému a přiřadit jej $ ImageanNotator. proměnná.

12. Analyzujte obsah obrazu

Začněte předkládat obrázek do API pro analýzu. Vykazujete výsledek jako JSON na obrazovku, ale v praxi byste mohli vyhodnotit výsledky a používat je jakýmkoliv způsobem.

Chcete-li odeslat obrázek na API, přidejte následující postup.

 $ Image = File_Get_Contents ($ Filepath);
$ Response = $ ImageanNotator- & gt; Labeldetection ($ Obrázek);
$ Labels = $ Response- & Gt; GetLabelannotations ();

foreach ($ etikety jako $ label) {
echo "& lt; divá třída = 'výsledek' & gt;";
$ výsledek = $ label- & gt; getdescription ();
echo $ výsledek. "(". $ label- & gt; getscore (). ")";
echo "& lt; / div & gt;";
}

To předloží obsah z předloženého formuláře imageannotator. koncový bod a ukládá výsledek v $ Response. proměnná. Určuje to. labeldetekce Vlastnosti. Můžete také použít facedetection. , logodetekce , textDetekce a mnoho dalších funkcí. Pro úplný seznam, Zkontrolujte zde .

Další, iterovat v seznamu štítků. To je jen příklad pro zobrazení, jak jej používat: mohli byste ho zpracovat a reagovat na výsledky, které však potřebujete.

13. Detekce tváří

A guide to Google's Cloud Vision: Face detection — Pomocí funkce Facedetection funkce Vision API můžete najít emoce a ohraničující boxy tváří v obraze

Dalším rychlým příkladem toho, jak mocné API je lženo facedetection. funkce. To vrátí údaje o emocí, stejně jako informace o umístění, kde jsou v obraze obličeje. Vyzkoušejte tento kód, abyste zjistili, jak to funguje.

 $ Response = $ imageannotator- & gt; facedetection ($ image);
$ face = $ reakce- & gt; getfaceeannotations ();

$ laselihoodName = ['neznámý', 'velmi_unlikely', 'nepravděpodobný',
    "Možné", "pravděpodobně", "velmi"];
// var_dump ($ etikety);

foreach ($ tváří jako $ tvář) {
echo "& lt; divá třída = 'výsledek' & gt;";
$ anger = $ face- & gt; getangeanglihood ();
Printf ("hněv:% s". php_eol, $ pravděpodobnostName [$ hněv]);
$ Joy = $ face- & gt; getjoyLikelihood ();
    Printf ("JOY:% S". PHP_EOL, $ STUDELIOSTNAME [$ JOY]);
$ vrcholy = $ face- & gt; getboundingpoly () - & gt; getherices ();
    $ Bounds = [];
    foreach ($ vrcholy jako vertex $) {
        $ Bounds [] = Sprintf ('(% d,% d)', $ vertex- & gt; getx (), $ vertex- & gt; gety ());
    }
    Tisk ('Bounds:'. Zapojte se (',', $ Bounds). PHP_EOL);
echo "& lt; / div & gt;";
}

Začnete pomocí pomocí facedetection. Funkce anotátoru a projít obrazem jako předchozí příklad. Pak dostanete faceannotiatons. . Používáte řadu závaží odezvy ve více společném jazyce, takže můžete vidět pravděpodobnost určitých emocí. V návaznosti na to tjatete odpověď jako dříve. Zkontrolujte dva z několika možných emocí, hněvu a radosti, což vracet výsledky těch. To vám také poskytne rohy ohraničujících boxů, které definují každou tvář.

Tento článek byl původně zveřejněn v čísle 316 z síť Časopis nejprodávanějšího světa pro webové designéry a vývojáře. Koupit problém 316 zde nebo Přihlásit se zde .

Související články:

Úžasný nástroj AI rekonstruuje fotografie jako kouzlo
17 Horní nástroje ve službě Google Analytics
Nejlepší editory kódu

Průvodce pro službu Google Cloud Vision

Co je to počítačové vidění?

Počítačové vidění s aplikací Google Cloud Vision API

01. Nastavte projekt Cloud

02. Povolit API Cloud Vision

03. Vytvořit účet služby

04. Stáhnout soukromý klíč

05. Nastavte proměnnou prostředí

06. Uskutečněte volání API

07. Nainstalujte klientskou knihovnu

08. Vytvořte nový soubor

09. Obrazovka uložte

10. Přidejte proměnnou prostředí

11. Zahrnout knihovnu

12. Analyzujte obsah obrazu

13. Detekce tváří

jak - Nejoblíbenější články

Jak kitbash na cestách se shapr3d

Jak změnit velikost obrázku ve Photoshopu

Jak vytvořit aplikaci s Vue.js

Jak čerpat realističtější obrázky

Jak používat inteligentní vrstvy ve Photoshopu

Jak přinést 2D charakter k životu ve VR

Vytvoření organických textur v inkoustu

Jak vytvořit masivní výbuchy s v-ray

Kategorie