Посібник з хмарного зору Google

Sep 13, 2025

Як

Машинобудування. Глибоке навчання. Обробка природної мови. Комп'ютерне бачення. Автоматизація. Розпізнавання голосу. Ви, напевно, почули всі ці та багато інших термінів нещодавно, всі під парасолькою штучного інтелекту. Насправді, поле стає настільки швидко, це стає все більш важко, щоб забити остаточне визначення. Ai стає частиною майже кожного аспекту нашого життя, від веб-сайти електронної комерції і пошукові системи, щоб розблокувати телефон.

Ваші веб-сайти та програми можуть використовувати API, щоб торкнутися безпосередньо в силу AI. Без необхідності "тренувати агенти AI, ви можете скористатися масовими кількостями даних, які вже проаналізовані. Google, Amazon, IBM та багато інших створили кінцеві точки для розробників, щоб зачепити і почати використовувати AI відразу.

На передньому кінці ви можете підключити голосові команди, інтерфейси ChatBot або креативні елементи реактивного WebGL. На задній частині, бази даних використовують інтелектуальні алгоритми, щоб максимально збільшити швидкість та аналіз. API може забезпечити шар абстракції з широкого кола функцій АІ, від прогнозів до колективного навчання.

Пам'ятайте, якщо ви створюєте свій сайт більш складним, це важливо, ви оцінюєте свій вибір веб хостинг Сервіс, щоб переконатися, що він може впоратися з ним. Зробити сайт з нуля? Розглянемо спрощення процесу з вершиною Веб-будівельник . І якщо ви створюєте нове Система дизайну , важливо зберегти його безпечним і доступним у пристойному хмара зберігання .

Керівництво до веб-інструментів Google

Що таке комп'ютерне бачення?

Комп'ютерне бачення - це дослідження та створення штучних систем, що витягують інформацію з зображень. Він також може охоплювати механічну систему самого бачення. З точки зору визнання, це процес аналізу та визначення вмісту зображення або серії зображень (включаючи відео). Це може включати медичні сканування, фотографії, 360-градусні відео та практично будь-які образи, які ви можете собі уявити.

AI-Powered Computer Vision може:

Визначте, етикетку та класифікуйте вміст
Виявлення обличчя та емоцій
Визнати головні убори, такі як окуляри та капелюхи
Визначте орієнтири, будівлі та споруди
Оцініть інформацію про рівень пікселів, таких як кольорові дані, якість та роздільна здатність
Визнати популярні логотипи
Визначте та читати текст
Визначити потенційно невідповідні зображення

Комп'ютерне бачення з API Cloud Vision Google

Існує безліч вибору для Apis Vision, але ми будемо використовувати API Cloud Vision Google. Google розміщує багато AIS API, включаючи обробку природної мови, розпізнавання голосу, глибоке навчання та бачення.

API Cloud Vision дозволяє вам зрозуміти, що це зображення. Він класифікує вміст на категорії, маркування все, що він бачить. Він також надає довірчу оцінку, тому ви знаєте, наскільки ймовірно, що те, що він вважає, знаходиться в зображенні, насправді з'являється. Ви можете використовувати це, щоб взаємодіяти розумно стосовно введення камери в AR або відео додаток. Ви можете створювати інструменти, щоб допомогти тим, хто порушується візуально. Ви можете створити помічники, щоб допомогти ідентифікувати будівлі або орієнтири для туристів. Можливості нескінченні.

01. Налаштуйте хмарний проект

Якщо ви раніше використовували API Google, деякі з цих перших кроків будуть знайомі. Як і інші служби Google, вам потрібно буде встановити хмарний проект. Йти до Консоль платформи Cloud Cloud Cloud і створіть новий проект або виберіть існуючий. Як і більшість послуг Google, API Cloud Vision є безкоштовним, доки не почнете робити багато запитів API. Вам може знадобитися ввести інформацію про платіжну інформацію, коли ви активуєте API, але це не стягується за низьким обсягом запитів, і ви можете видалити послуги після закінчення тестування.

02. Увімкніть API Cloud Vision

A guide to Google's Cloud Vision: Enable the Cloud Vision API — Перегляньте бібліотеку API, а потім увімкніть API Cloud Vision

Переглядати Бібліотека API і виберіть API Cloud Vision для вашого проекту.

Одного разу увімкнено, ви повинні побачити невелику зелену перевірку, а повідомлення "API увімкнено" поруч з ним.

03. Створіть обліковий запис служби

Далі вам потрібно буде встановити Сервісний рахунок . Подумайте про API як веб-службу, яку ви створюєте. Оскільки ми збираємося налаштувати використання, як типова служба, це найкраща практика. Він також найкраще працює з потоком автентифікації.

04. Завантажте приватний ключ

A guide to Google's Cloud Vision: Create a service account — Отримайте свій приватний ключ для облікового запису служби

Після того, як ви маєте проект із включеним API та облікового запису служби, ви можете завантажити ваш приватний ключ як файл JSON. Візьміть до уваги місця розташування файлу, щоб ви могли використовувати його на наступних кроках.

Якщо у вас виникли проблеми з першими кількома кроками Посібник із швидкого запуску Це допомагає і закінчується завантаженням ключа JSON.

05. Встановіть змінну середовища

Вам потрібно встановити Google_application_credentals Екологічна змінна, тому її можна отримати доступ до наших дзвінків API. Це вказує на файл JSON, який ви просто завантажили, і заощаджує, що потрібно ввести шлях кожного разу. Відкрийте нове термінальне вікно і використовуйте експортувати командувати так:

export GOOGLE_APPLICATION_CREDENTIALS="/Users/[username]/Downloads/[file name].json"

Замінити [Ім'я користувача] з вашим ім'ям користувача. Переконайтеся, що шлях до місця, який ви зберігаєте, правильний ключ. Замінити [ім'я файлу] За допомогою вашого приватного ключа та використання шляху до вашого файлу.

У Windows ви можете зробити те ж саме через командну лінію, як це:

$env:GOOGLE_APPLICATION_CREDENTIALS="C:\Users\[username]\Downloads\[FILE_NAME].json"

Примітка. Якщо ви закриваєте свій термінал або консоль, вам може знадобитися запустити це ще раз, щоб знову встановити змінну. Незабаром ми додамо це в наш PHP-код, тому вам не доведеться турбуватися про це знову.

06. Зробіть дзвінок на API

Тепер ви готові копати в API Cloud Vision. Ви будете використовувати Curl, щоб зробити швидкі випробування API. Ви також можете використовувати цей метод з вашого коду.

Запитання Curl можна зробити в більшості мов, незалежно від того, чи це PHP, Python або вузол. Таким чином, ви можете зробити дзвінки безпосередньо в командному рядку або призначити результат змінної на мові за вашим вибором. Знайдіть деякі швидкі поради щодо використання Curl тут .

Створіть простий файл JSON, щоб утримувати деталі запиту. Назви це google_vision.json . Зберігайте його місцевим, де ви хочете запустити команди терміналу з.

 {
 "Запити": [
    {
      "Зображення": {
      "Джерело": {
      "Imageuri":
      "https://upload.wikimedia.org/wikipedia/commons/9/93/golden_retriever_carlos_%2810581910556%29.jpg"
         }
     },
       "Особливості": [{{
         "Тип": "type_unppecified",
         "MaxResults": 50
     },
       {
         "Тип": "Landmark_Detection",
         "MaxResults": 50
     },
       {
         "Тип": "face_detection",
         "MaxResults": 50
     }
       {
         "Тип": "Label_detection",
         "MaxResults": 50
     },
       {
         "Введіть": "text_detection",
         "MaxResults": 50
     },
       {
         "Тип": "safe_search_detection",
         "MaxResults": 50
     },
       {
         "Тип": "image_properties",
         "MaxResults": 50
     }
    ]
   }
  ]
}

У наведеному вище коді ви вказали зображення для аналізу, а також специфічних функцій API для використання, включаючи виявлення обличчя та виявлення пам'яті. Safe_search_detection Відмінно підходить для знання, якщо зображення безпечне, і в якій категорії вона належить, наприклад, вміст дорослих або насильницьких. Image_properties Розповідає вам про кольори та деталі пікселів.

Щоб виконати команду Curl, у інтерфейсі вашого термінала або командного рядка введіть наступне.

 Curl -x post -h "Авторизація: носій" $ (gcloud aupplication-default print-applic-token) -H "Тип вмісту: застосування / json; charset = utf-8" - data-binary @ google_vision.json "https://vision.googleas.com/v1/images:antotate" & gt; Результати

За допомогою & gt; результат Syntax, ви матимете результати, що зберігаються в новому файлі, називається для вас. Ви вказали URL-адресу API ( "https://vision.googleas.com/v1/images:antotate" ) і включали ваші дані JSON Пост до цього.

Ви можете переглянути перший раз, коли ви використовуєте, щоб активувати API або дозволити доступ. Відповідь YES або Y до цього запиту, і він повинен повернути JSON.

Якщо ви відкриваєте файл результатів, ви отримаєте результати JSON дані з запиту API Vision. Ось фрагмент:

{
  "Відповіді": [
    {
      "Labelannotations": [
        {
          "Середина": "/ м / 0BT9LR",
          "Опис": "Собака",
          "Оцінка": 0.982986,
          "Актуальність": 0.982986
        },
        {
          "Середина": "/ м / 01Т032",
          "Опис": "Золотий ретривер",
          "Оцінка": 0.952482,
          "Актуальність": 0.952482
        },
        {
...

Ви бачите деякі дуже корисні результати відразу. Під лебіделяння Вузол, ви можете побачити 98% матчу, що зображення містить "собаку" та 95 відсотків матчу, що він містить "золотий ретривер"! AI вже визначив вміст зображення та іншої деталізації, включаючи "морду", і факт, ймовірно, "спортивна собака".

Це вимагало жодного навчання з вашої частини через вже підготовлену систему Google Vision AI. Сканування через результати, ви побачите все, починаючи від рекомендованих областей для обрізання - для автоматичних обрізання зображень для суб'єктів - до неймовірної деталізації того, що знаходиться у зображенні, включаючи кольори та вміст. Спробуйте з іншими зображеннями, щоб побачити, наскільки потужний API є.

Ви можете продовжувати використовувати цей метод для перевірки дзвінків, які ми будемо використовувати. Ви також можете налаштувати місцевий SDK на мові, який ви віддаєте перевагу та інтегрувати його у додаток.

07. Встановіть клієнтську бібліотеку

Далі ви зробите простий веб-додаток, щоб показати, як інтегрувати API у свої проекти.

Існує декілька SDKS, доступних у різних мовах, щоб зробити інтеграцію. Ви будете використовувати PHP SDK для цього наступного розділу. Якщо ви хочете налаштувати код, який випливає на іншу мову, є великий ресурс SDKS тут .

Почніть, переконавшись, що у вашому локальному або віддаленому сервері встановлено папку проекту. Якщо у вас вже немає, отримайте композитор та встановіть його у папку проекту. Необов'язково, ви можете мати композитор, який вже встановлений у всьому світі, і це добре.

Запустіть наступну команду композитора, щоб встановити файли постачальника для SDK Cloud Vision.

 PHP -R "Копіювати (" https://getcomposer.org/installer "," композитор-setup.php ");"
php -r "IF (hash_file ('sha384', 'composer-setup.php') === '93b54496392c0627746 70AC18B134C3B3A95E5A5E5C8
f1a9f115f203b75bf9a129d5daa8ba6a13e2cc8a1da080
6388A8 ') {echo' installer перевірив '; } else {echo 'інсталятор корумпований'; від'єднати ("композитор-setup.php"); } echo php_eol; "
php composer-setup.php
php -r "від'єднати (" композитор-setup.php ");"
PHP Composer.Phar вимагає Google / Cloud-Vision

Композитор робить папку постачальника у папці проекту та встановлює всі залежності для вас. Якщо ви застрягли налаштування цього, і хочете використовувати PHP, ви можете перевірити це Встановлення ресурсу композитора .

08. Створіть новий файл

Створіть новий файл PHP у папці проекту. Встановіть це, але ви хочете, але включати просту HTML-форму для завантаження зображень для швидкого тестування. Ось приклад PHP-файлу з укою, включений:

 & lt;! DOCTYPE HTML & GT;
& lt; html & gt;
& lt; head & gt;
& lt; title & gt; net - підручник з комп'ютером & lt; / title & gt;
& lt; / head & gt;
& lt; body & gt;
& lt; форма дії = "index.php" Enctype = "multipart / form-data" = "post" & gt;
& lt; h1 & gt; Виберіть зображення & lt; / h1 & gt;
& lt; Вхідний тип = "файл" name = "file" & gt; & lt; br / & gt; & lt; br / & gt;
& lt; Вхідний тип = "Надіслати" value = "Завантажити зображення" name = "Надіслати" & gt; & lt; br / & gt;
& lt; / form & gt;
& lt; div class = "результати" & gt;
& lt;? PHP
// PHP-код іде тут //
якщо (! ISSET ($ _ post ['submit'])) {die (); }
? & gt;
& lt; / div & gt;
& lt; / body & gt;
& lt; / html & gt;

Код включає в себе основний файл HTML з формою та заповнювачем для PHP-коду. Код починає перевіряти наявність зображення, поданого з форми. Якщо це ще не подано, це нічого не робить.

09. Зберігайте зображення

Якщо ви вважаєте за краще вказати на зображення в Інтернеті або у вашій системі, пропустіть цей крок. Якщо ви хочете обробити вибрати зображення, додайте цей код, щоб зберегти вибране зображення.

 // зберегти зображення
$ filepath = $ _files ["Файл"] ["Назва"];
if (move_uploaded_file ($ _ файли ["file"] ["tmp_name"], $ filepath)) {
echo "& lt; p & gt; & lt; img src =". $ filepath. "Стиль =" ширина: 400px; висота: auto; ' / & gt; & lt; / p & gt; ";
} else {
echo "Помилка !!";
}

10. Додайте змінну середовища

Вам потрібно встановити Google_application_credentals змінну для автентифікації. У PHP ми використовуємо путень команду встановити змінну середовища. Додайте цей код далі у вашому PHP-коді:

 Putenv ('google_application_credentals = / Користувачі / richardmattka / Завантаження / Підручник з бачення 1-0F464A9A0F7B.json');

Замініть ім'я шляху та файлу до вашого приватного ключа JSON.

11. Включіть бібліотеку

Додайте бібліотеку та ініціалізувати Млявий клас у вашому коді. Додайте цей код далі:

 вимагає __dir__. '/vendor/autoload.php';
Використовуйте Google Cloud \ VISION V1
$ project = 'Vision-tutorial-1';
$ imageanynotator = новий imageannotatorclient ([
    'projectid' = & gt; $ projectid
]);

Почати, вимагаючи автозавантаження постачальника. Це схоже на Python або вузол, коли вам потрібні ваші залежності. Імпортувати Imageannotatorclient Далі, щоб скористатися класом. Визначте свій проектний . Якщо ви не впевнені, що це, перегляньте його в консолі проекту Google Cloud. Нарешті, створіть новий Imageannotatorclient Об'єкт за допомогою проекту і призначити його до $ imageantator змінна.

12. Аналіз вмісту зображення

Почніть подавати зображення до API для аналізу. Ви покажете результат як JSON на екран, але на практиці ви можете оцінити результати та використовувати їх будь-яким способом.

Додайте наступне, щоб подати зображення до API.

 $ image = file_get_contents ($ filepath);
$ reception = $ imageannotator- & gt; labeldetection ($ image);
$ labels = $ reception- & gt; getlabelannotations ();

foreach ($ labels як $ label) {
echo "& lt; div class =" результат "& gt;";
$ result = $ label- & gt; getdescription ();
Echo $ result. "(". $ Label- & GT; GetScore (). ")";
echo "& lt; / div & gt;";
}

Це подає вміст з поданої форми до imageantator кінцева точка і зберігає результат у $ Відповідь змінна. Він вказує лабчастий функція. Ви також можете використовувати факретний , логотип , textdetection і багато інших функцій. Для повного списку, перевірити тут .

Далі, повторіть список етикеток. Це лише приклад, який показати, як його використовувати: ви можете обробити його та реагувати на результати, однак вам потрібно.

13. Виявлення обличчя

A guide to Google's Cloud Vision: Face detection — Використовуючи функцію FaceDetection of Vision API, ви можете знайти емоції та обмежувальні коробки обличчя на зображенні

Інший швидкий приклад того, наскільки потужний API лежить в факретний функція. Це поверне дані емоцій, а також інформацію про місцезнаходження, де знаходиться зображення. Спробуйте цей код, щоб побачити, як це працює.

 $ відповідь = $ imageantator- & gt; facedetection ($ image);
$ faces = $ reception- & gt; getfaceantationations ();

$ LikelihathingName = ["невідомий", "дуже_unlikely", "малоймовірно",
    "Можливий", ", ймовірно,", "дуже_likely";
// var_dump ($ labels);

foreach ($ faces як $ face) {
echo "& lt; div class =" результат "& gt;";
$ anger = $ face- & gt; getangerlikeliсть ();
PRINTF ("Гнів:% s". PHP_EOL, $ LikelihathingName [$ anger]);
$ радість = $ face- & gt; getjoylikelioodwordhood ();
    printf ("JOY:% s". PHP_EOL, $ LikelihathenceName [$ Joy]);
$ вершини = $ face- & gt; getboundpoly () - & gt; витягання ();
    $ bounds = [];
    foreach ($ вершини, як $ Vertex) {
        $ bounds [] = sprintf ('(% d,% d)', $ vertex- & gt; getx (), $ vertex- & gt; gety ());
    }
    Друк ("межі:". Приєднуйтесь (",", $ межі). php_eol);
echo "& lt; / div & gt;";
}

Ви починаєте за допомогою факретний Функція анотатора та переходять у зображення, як і попередній приклад. Тоді ви отримуєте подолати . Ви використовуєте масив відповіді ваг у більш поширеній мові, тому ви можете побачити ймовірність певних емоцій. Слідуючи за цим, ви ігноруєте відповідь, як раніше. Ви перевіряєте на два з декількох можливих емоцій, гніву та радості, повертаючи результати цих. Це також дасть вам кути обмежувальних коробок, які визначають кожне обличчя.

Ця стаття була опублікована у випуску 316 сітка , журнал найкращого у світі для веб-дизайнерів та розробників. Купити проблему 316 тут або Підписатися тут .

Пов'язані статті:

Дивовижний інструмент AI відновлює фотографії, як магія
17 Топ інструментів у Google Analytics
Кращі редактори коду

Посібник з хмарного зору Google

Що таке комп'ютерне бачення?

Комп'ютерне бачення з API Cloud Vision Google

01. Налаштуйте хмарний проект

02. Увімкніть API Cloud Vision

03. Створіть обліковий запис служби

04. Завантажте приватний ключ

05. Встановіть змінну середовища

06. Зробіть дзвінок на API

07. Встановіть клієнтську бібліотеку

08. Створіть новий файл

09. Зберігайте зображення

10. Додайте змінну середовища

11. Включіть бібліотеку

12. Аналіз вмісту зображення

13. Виявлення обличчя

Як - Найпопулярніші статті

Cinema 4D Підручники: 13 з кращих

21 кроки до Super Speedy JavaScript

10 способів побудови кращих 3D-світових середовищ

Анімація SVG з JavaScript

Дизайнер афінності: Як використовувати інструмент для пера

Як принести 2D-характер до життя в VR

Зробити реалістичні рослини в кіно 4D

Відкрийте під дію underfainting і як максимально використовувати його

Категорії