En guide till Googles molnsyn

Jan 27, 2026
Hur
A guide to Google's Cloud Vision

Maskininlärning. Djup lärning. Naturlig språkbehandling. Datorsyn. Automatisering. Röstigenkänning. Du har nog hört alla dessa och många andra villkor, alla under paraplyet av artificiell intelligens. Faktum är att fältet växer så snabbt, det blir allt svårare att spika ner en slutgiltig definition. Ai blir en del av nästan alla aspekter av våra liv, från E-handel webbplatser och sökmotorer för att låsa upp telefonen.

Dina webbplatser och appar kan utnyttja API: erna att knacka direkt in i AI. Utan att behöva "träna" AI-agenter kan du utnyttja massiva mängder data som redan analyserats. Google, Amazon, IBM och många andra har skapat slutpunkter för utvecklare att koppla in och börja använda AI genast.

På framsidan kan du ansluta röstkommandon, Chatbot-gränssnitt eller reaktiva WebGL-kreativa element. På baksidan använder databaser intelligenta algoritmer för att maximera hastighet och analys. API kan ge ett lager av abstraktion från ett brett utbud av AI-funktioner, från förutsägelser till kollektiv utbildning.

Kom ihåg, om du gör din webbplats mer komplex, är det viktigt att du bedömer ditt val av webbhotell service för att se till att det kan hantera det. Gör en webbplats från början? Överväga att förenkla processen med en topp Website Builder . Och om du skapar en ny designsystem Det är viktigt att hålla det säkert och tillgängligt i anständigt molnlagring .

  • En guide till Googles webbverktyg

Vad är datorvision?

Datorvision är studien och skapandet av konstgjorda system som extraherar information från bilder. Det kan också omfatta det mekaniska systemet för synen själv. När det gäller erkännande är det processen att analysera och bestämma innehållet i en bild eller en serie bilder (inklusive video). Detta kan innefatta medicinska skanningar, bilder, 360-graders video och praktiskt taget alla slags bilder du kan tänka dig.

AI-driven datorvision kan:

  • Identifiera, etikettera och kategorisera innehållet
  • Detektera ansikten och känslor
  • Känna igen huvudbonader som glasögon och hattar
  • Identifiera landmärken, byggnader och strukturer
  • Bedöm pixelnivåinformation som färgdata, kvalitet och upplösning
  • Känna igen populära logotyper
  • Identifiera och läsa text
  • Identifiera potentiellt olämpliga bilder

Datorvision med Googles Cloud Vision API

Det finns massor av val för Vision Apis men vi använder Googles Cloud Vision API. Google är värd många AI API, inklusive naturlig språkbehandling, röstigenkänning, djup inlärning och vision.

Cloud Vision API möjliggör att dina webbplatser och appar förstår vad som finns i en bild. Det kommer att klassificera innehållet i kategorier, märkning allt det ser. Det ger också ett konfidenspoäng, så du vet hur troligt det är att det som det tror är i en bild som faktiskt visas där. Du kan använda det här för att interagera intelligent angående kameraingång i AR eller videoapplikationer. Du kan skapa verktyg för att hjälpa de som är synskadade. Du kan skapa assistenter för att identifiera byggnader eller landmärken för turister. Möjligheterna är oändliga.

01. Ställ in ett molnprojekt

Om du har använt Googles API: er innan, kommer några av dessa första steg att vara bekanta. Som med andra Google-tjänster måste du konfigurera ett molnprojekt. Gå till Google Cloud Platform Console och skapa ett nytt projekt eller välja en befintlig. Liksom de flesta av Googles tjänster är Cloud Vision API fri att använda tills du börjar göra massor av API-förfrågningar. Du kan behöva ange faktureringsinformation när du aktiverar API men det är inte laddat med en låg volym önskemål och du kan ta bort tjänsterna efter att du är klar.

02. Aktivera Cloud Vision API

A guide to Google's Cloud Vision: Enable the Cloud Vision API

Bläddra i API-biblioteket och aktivera sedan Cloud Vision API

Bläddra i API-bibliotek och välj Cloud Vision API för ditt projekt.

När du är aktiverad bör du se en liten grön check och meddelandet "API aktiverat" bredvid det.

03. Skapa ett servicekonto

Nästa måste du ställa in en servicekonto . Tänk på API som en webbtjänst du skapar. Eftersom vi ska ställa in användningen som en typisk tjänst, är det den bästa praxisen. Det fungerar också bäst med autentiseringsflöde.

04. Ladda ner privat nyckel

A guide to Google's Cloud Vision: Create a service account

Få din privata nyckel för servicekontot

När du har ett projekt med API-aktiverat och ett servicekonto kan du ladda ner din privata nyckel som en JSON-fil. Notera platsen för filen, så du kan använda den i nästa steg.

Om du har några problem med de första stegen finns det En snabbstartguide som hjälper och slutar med nedladdningen av JSON-tangenten.

05. Ange miljövariabel

Du måste ställa in Google_application_credentials Miljövariabel, så det kan nås av våra API-samtal. Detta pekar på den JSON-fil du bara laddat ner och sparar du måste skriva vägen varje gång. Öppna ett nytt terminalfönster och använd exportera Kommando som så:

export GOOGLE_APPLICATION_CREDENTIALS="/Users/[username]/Downloads/[file name].json"

Ersätt [Användarnamn] med ditt användarnamn. Var noga med att sökvägen till den plats du lagrade den privata nyckelfilen är korrekt. Ersätt [filnamn] Med din privata nyckelfil och använd sökvägen till din fil.

På Windows kan du göra samma sak via kommandoraden, så här:

$env:GOOGLE_APPLICATION_CREDENTIALS="C:\Users\[username]\Downloads\[FILE_NAME].json"

Obs! Om du stänger ditt terminal- eller konsolfönster kan du behöva köra det igen för att ställa in variabeln igen. Vi lägger till det här i vår PHP-kod, så bra, så du behöver inte oroa dig för det igen.

06. Ringa ett samtal till API

Nu är du redo att gräva in i Cloud Vision API. Du använder Curl för att göra snabba tester av API. Du kan också använda den här metoden från din kod också.

Curl-förfrågningarna kan göras på de flesta språk, oavsett om det är PHP, Python eller Node. På så sätt kan du ringa samtalet direkt i kommandoraden eller tilldela resultatet till en variabel på det språk du vill ha. Hitta några snabba tips om att använda curl här .

Skapa en enkel JSON-fil för att hålla detaljerna i begäran. Kalla det google_vision.json . Förvara den lokal till var du vill köra terminalkommandon från.

 {
 "Förfrågningar": [
    {
      "bild":{
      "källa":{
      "Imageuri":
      "https://upload.wikimedia.org/wikipedia/commons/9/93/golden_retriever_carlos_%2810581910556%29.jpg"
         }
     },
       "funktioner": [{
         "Typ": "TYPE_UNSPECIFIED",
         "Maxresults": 50
     },
       {
         "Typ": "Landmark_Detection",
         "Maxresults": 50
     },
       {
         "Typ": "Face_Detection",
         "Maxresults": 50
     }
       {
         "Typ": "Label_Detection",
         "Maxresults": 50
     },
       {
         "Typ": "Text_Detection",
         "Maxresults": 50
     },
       {
         "Typ": "Safe_Search_Detection",
         "Maxresults": 50
     },
       {
         "Typ": "Image_properties",
         "Maxresults": 50
     }
    Anklagelse
   }
  Anklagelse
} 

I ovanstående kod har du angett en bild att analysera, såväl som specifika API-funktioner som ska användas, inklusive ansiktsdetektering och landmärkesdetektering. Safe_Search_Detection är bra för att veta om bilden är säker och i vilken kategori den tillhör, som vuxeninnehåll eller våldsam. Image_properties berättar om färger och pixelnivå detaljer.

För att utföra CURL-kommandot, i ditt terminal- eller kommandoradsgränssnitt, ange följande.

 Curl -X Post -H "Authorization: Bearer" $ (GCloud Auth Application-Standard Print-Access-Token) -H "Innehållstyp: Applikation / JSON; Charset = UTF-8" --Data-Binary @ google_vision.json "https://vision.googleapis.com/v1/images:Antotate" & GT; resultat 

Genom att använda & gt; resultat Syntax, du har resultaten som är lagrade i en ny fil som heter resultat för dig. Du angav webbadressen till API ( "https://vision.googleapis.com/v1/images:Antotate" ) och inkluderade dina JSON-data till POSTA till det.

Du kan få uppmanad första gången du använder det här för att aktivera API eller tillåta åtkomst. Svar Ja eller Y till den snabba och det ska returnera JSON.

Om du öppnar resultatfilen får du JSON-data från den vision API-begäran. Här är ett snippet:

{
  "svar": [
    {
      "Labelannotations": [
        {
          "MID": "/ M / 0BT9LR",
          "Beskrivning": "Hund",
          "poäng": 0,982986,
          "Topicality": 0.982986
        },
        {
          "MID": "/ M / 01T032",
          "Beskrivning": "Golden Retriever",
          "Poäng": 0.952482,
          "Topicality": 0.952482
        },
        {
... 

Du ser några mycket användbara resultat direkt. Under Labelannotations Node, du kan se en 98 procent match som bilden innehåller en "hund" och en 95 procent match som den innehåller en "Golden Retriever"! AI identifierade redan innehållet i bilden och andra detaljer, inklusive en "snout" och det faktum att det är troligt en "sporthund".

Detta krävde ingen träning på din sida på grund av det redan utbildade Google Vision AI-systemet. Skanna igenom resultaten, du får se allt från rekommenderade grödoregioner - för automatisk beskärning av bilder till ämnen - till otroliga detaljer om vad som finns i bilderna, inklusive färger och innehåll. Prova med andra bilder för att se hur kraftfull API är.

Du kan fortsätta använda den här metoden för att testa de samtal vi använder. Du kan också skapa en lokal SDK på ett språk som du föredrar och integrera det i din app.

07. Installera klientbiblioteket

Därefter kommer du att göra en enkel webbaserad app för att visa hur du integrerar API i dina projekt.

Det finns ett antal SDK tillgängliga på olika språk för att göra integrationen enkelt. Du använder PHP SDK för den här nästa avsnittet. Om du vill tweak koden som följer på ett annat språk, finns det en stor resurs av SDK här .

Börja med att du har en projektmapp som är inställd på din lokala eller fjärrserver. Om du inte redan har det, får du kompositören och installera den i din projektmapp. Eventuellt kan du ha kompositör redan installerad globalt och det är också bra.

Kör följande kompositörskommando för att installera leverantörsfilerna för Cloud Vision SDK.

 PHP -R "COPY ('https://getcomposer.org/installer', 'Composer-Setup.php');"
php -r "om (hash_file ('sha384', 'composer-setup.php') === '93b54496392c0627746 70ac18b134c3b3a95e5a5e5c8
F1A9F115F203B75BF9A129D5DA8BA6A13E2CC8A1DA080
6388A8 ') {Echo' Installer Verifierad '; } annars {echo 'installer korrupt'; Unlink ("Composer-Setup.php"); } echo php_eol; "
PHP Composer-Setup.php
PHP -R "Unlink (" Composer-Setup.php ");"
PHP Composer.phar kräver Google / Cloud-Vision 

Kompositören gör en leverantörsmapp i din projektmapp och installerar alla beroenden för dig. Om du fastnar med att ställa in det här och vill använda PHP, kan du kolla in det här Installera kompositörsresurs .

08. Skapa en ny fil

Skapa en ny PHP-fil i din projektmapp. Ställ upp det men du gillar men inkluderar en enkel HTML-formulär för att ladda upp bilder för snabb testning. Här är ett exempel på PHP-fil med den som ingår:

 & lt; doctype html & gt;
& lt; html & gt;
& lt; huvud & gt;
& LT; Titel & GT; NET - Datorvyn Tutorial & LT; / Titel & GT;
& LT; / Head & GT;
& lt; kropp & gt;
& lt; form action = "index.php" enctype = "Multipart / form-data" metod = "post" & gt;
& lt; H1 & GT; välj bild och lt; / h1 & gt;
& LT; Input Type = "File" Namn = "Fil" & LT; BR / & GT;
& lt; Input Type = "Skicka" värde = "Ladda upp bild" Namn = "Skicka" & GT; & lt; BR / & GT;
& LT; / Form & GT;
& lt; div class = "resultat" & gt;
& lt;? php
// PHP-kod går här //
Om (! ISSET ($ _ Post ['Submit'])) {DIE (); }
? & gt;
& lt; / div & gt;
& LT; / Body & GT;
& lt; / html & gt; 

Koden innehåller en grundläggande HTML-fil med ett formulär och en platshållare för PHP-kod. Koden börjar kontrollera efter förekomsten av bilden, inlämnad från formuläret. Om det inte skickas ännu, gör det ingenting.

09. Förvara bilden

Om du föredrar att peka på bilder online eller på ditt system, hoppa över det här steget. Om du vill bearbeta bilder du väljer, lägg till den här koden för att spara den valda bilden.

 // spara bild
$ FILEPATH = $ _FILES ["FILE"] ["NAME"];
Om (Flytta_Uploaded_File ($ _ filer ["fil"] ["TMP_NAME"], $ FILEPATH)) {
echo "och lt; img src =". $ filepath. "Style = 'Bredd: 400px; Höjd: Auto;' / & gt; & lt; / p & gt; ";
} annars {
echo "fel !!";
} 

10. Lägg till miljövariabel

Du måste ställa in Google_application_credentials variabel för att den ska verifiera. I PHP använder vi putenv kommandot för att ställa in en miljövariabel. Lägg till den här koden bredvid din PHP-kod:

 Putenv ('google_application_credentials = / användare / Richardmattka / Nedladdningar / Vision Tutorial 1-0f464A9A0F7B.json'); 

Byt ut sökvägen och filnamnet till din JSON Private Key-fil.

11. Inkludera biblioteket

Lägg till biblioteket och initiera LanguageClient klass i din kod. Lägg till den här koden nästa:

 Kräv __dir__. '/Vendor/autoload.php';
Använd Google \ Cloud \ Vision \ v1 \ imageAnnotatorclient;
$ projectID = 'Vision-Tutorial-1';
$ imageAnnotator = ny bildanNotatorclient ([
    'projectid' = & gt; $ projectID
]); 

Börja med att kräva leverantören AutoLoad. Detta är liknande i python eller nod när du behöver dina beroenden. Importera ImageAnnotatorClient Därefter, för att utnyttja klassen. Definiera din projektor . Om du inte är säker på vad det här är, se upp det i din Google Cloud-projektkonsol. Slutligen skapa en ny ImageAnnotatorClient objekt med din projektor och tilldela den till $ imageAnnotator variabel.

12. Analysera bildinnehåll

Börja skicka in bilden till API för analys. Du visar resultatet som JSON till skärmen för nu men i praktiken kan du bedöma resultaten och använda dem som helst du önskar.

Lägg till följande för att skicka in bilden till API.

 $ image = file_get_contents ($ filepath);
$ Response = $ imageAnnotator- & gt; LabelDetection ($ bild);
$ Etiketter = $ Response- & GT; GetlaBelannotations ();

foreach ($ etiketter som $ label) {
echo "& lt; div klass = 'Resultat' & GT;
$ resultat = $ label-& g g getdescription ();
Echo $ resultat. "(". $ Label- & GT; Getsscore (). ")";
echo "& lt; / div & gt;";
} 

Detta skickar innehållet från den inlämnade formuläret till bildanvändare slutpunkt och lagrar resultatet i $ respons variabel. Det specificerar etikett funktion. Du kan också använda ansiktsigenkänning , logodetektion , textdetektion och många andra funktioner. För en fullständig lista, kolla här .

Därefter iterera över listan över etiketter. Det här är bara ett exempel för att visa hur du använder det: du kan bearbeta det och reagera på de resultat du behöver.

13. Detektera ansikten

A guide to Google's Cloud Vision: Face detection

Med hjälp av Facedetection-funktionen hos Vision API kan du hitta de känslor och avgränsande lådor av ansikten i bilden

Ett annat snabbt exempel på hur kraftfull API ligger i ansiktsigenkänning fungera. Detta kommer att returnera känslopatalogen såväl som platsinformation om var i bilden är ansikten. Prova den här koden för att se hur det fungerar.

 $ Response = $ imageAnnotator- & gt; facedetection ($ bild);
$ ansikten = $ respons-& gt; getfaceannotations ();

$ LIKELIODENAME = ['Okänt', 'very_Unliky', 'osannolikt',
    "Möjlig", "sannolikt", "very_likely"];
// Var_dump ($ etiketter);

foreach ($ ansikten som $ face) {
echo "& lt; div klass = 'Resultat' & GT;
$ ilska = $ face- & g getangerLiveelihood ();
Printf ("Anger:% s". php_eol, $ sannolikhetsnamn [$ ilska]);
$ JOY = $ FACE-& GT; GetJoylyelyihood ();
    Printf ("Glädje:% s". PHP_EOL, $ LIKELIBODENAME [$ JOY]);
$ vertices = $ face- och get; getBoundingpoly () - & gt; gardvertices ();
    $ gränser = [];
    foreach ($ vertices som $ vertex) {
        $ gränser [] = Sprintf ('(% d,% d)', $ vertex- och get; getx (), $ vertex- och gety ());
    }
    Skriv ut ('Bounds:'. Gå med (',', $ gränser). php_eol);
echo "& lt; / div & gt;";
} 

Du börjar med att använda ansiktsigenkänning Annotatorns funktion och passera i bilden som föregående exempel. Då får du FaceAnnotiatons . Du använder en rad svarvikter på mer vanligt språk, så du kan se sannolikheten för vissa känslor. Efter detta itererar du svaret som tidigare. Du kontrollerar två av flera möjliga känslor, ilska och glädje som återvänder resultaten av dem. Detta kommer också att ge dig hörnen av de avgränsande rutorna som definierar varje ansikte som hittats.

Denna artikel publicerades ursprungligen i utgåva 316 av netto , världens bästsäljande tidning för webbdesigners och utvecklare. Köp nummer 316 här eller prenumerera här .

Relaterade artiklar:

  • Fantastiskt AI-verktyg rekonstruerar bilder som magi
  • 17 Toppverktyg i Google Analytics
  • De bästa kodredaktörerna

Hur - Mest populära artiklar

Skapa en scen med Renderman för Maya

Hur Jan 27, 2026

(Bildkredit: Jeremy Heintz) I denna Renderman för Maya Tutorial täcker vi en rad olika ämnen som börjar från att..


Hur man målar färgglada animationskonst i Photoshop

Hur Jan 27, 2026

Under den här Photoshop-handledningen går jag över flera viktiga koncept som jag använder som illustratör. Jag pratar om gro..


Hur man vänder dag till natt i Photoshop

Hur Jan 27, 2026

Dag-till-natt-omvandlingar har funnits så länge som Photoshop har haft justeringsskikt, men mastering av effekten tar mycket tr..


Hur man skapar digitala tillgångar

Hur Jan 27, 2026

Förbereda tillgångar för digital användning är en kärnuppgift för Junior designers idag - och distinkt frå..


Hur man ritar metalliska reflektioner

Hur Jan 27, 2026

När Light slår ett metallobjekt kan det reflektera tillbaka på ett närliggande objekt på ett ovanligt sätt. Normalt ger lju..


Hur man målar en zombie i klippstudiofärg

Hur Jan 27, 2026

I denna ritning handledning lär du dig Hur man ritar och målar en zombie med Clip Studio Paint , ..


Skärpa dina skissförmåga

Hur Jan 27, 2026

Sketching är ett enkelt men kraftfullt verktyg för alla som är involverade i att göra digitala produkter. Pennor, papper och whiteboards är lättillgängliga på varje kontor..


Skapa spel-färdiga texturer med hjälp av substansmålare

Hur Jan 27, 2026

Det senaste året har varit en spelväxlare för videospelindustrin och för oss konstnärer som har tur att tjäna sig från att..


Kategorier