Google의 클라우드 비전 안내

Sep 15, 2025
어떻게
A guide to Google's Cloud Vision

기계 학습. 깊은 학습. 자연 언어 가공. 컴퓨터 시각 인식. 오토메이션. 음성 인식. 당신은 아마 이들을 모두 들었을 것입니다. 최근에는 인공 지능의 우산 아래에 있습니다. 사실, 분야가 너무 빠르게 성장하고 있으므로 확실하게 결정이 점점 어려워지고 있습니다. AI는 우리 삶의 거의 모든 측면의 일부가되고 있습니다. 전자 상거래 웹 사이트 그리고 검색 엔진을 통해 휴대 전화를 해제하십시오.

귀하의 웹 사이트 및 앱은 API를 활용하여 AI의 힘으로 직접 탭할 수 있습니다. AI 요원을 '훈련'하지 않고도 이미 분석 된 대량의 데이터를 활용할 수 있습니다. Google, Amazon, IBM 및 다른 많은 다른 사람들은 개발자가 AI를 즉시 사용하여 연결하고 시작하기위한 엔드 포인트를 만들었습니다.

프런트 엔드에서 음성 명령, Chatbot 인터페이스 또는 Reactive WebGL Creative Elements를 연결할 수 있습니다. 백엔드에서 데이터베이스는 지능형 알고리즘을 사용하여 속도와 분석을 극대화합니다. API는 예측에서부터 집단 교육에 이르기까지 다양한 AI 기능에서 추상화 층을 제공 할 수 있습니다.

당신이 당신의 사이트를 더 복잡하게 만드는 경우, 당신은 당신의 선택을 평가하는 것이 중요합니다. 웹 호스팅 서비스를 처리 할 수 ​​있는지 확인하십시오. 처음부터 사이트를 만드는거야? 프로세스를 맨 위로 단순화하는 것을 고려하십시오 웹 사이트 빌더 ...에 그리고 당신이 새로 만들어지는 경우 디자인 시스템 괜찮은 상태에서 안전하고 접근 할 수있는 것이 중요합니다. 클라우드 스토리지 ...에

  • Google 웹 도구에 대한 안내서

컴퓨터 비전이란 무엇입니까?

컴퓨터 비전은 이미지에서 정보를 추출하는 인공 시스템의 연구와 생성입니다. 비전 자체의 기계 시스템을 포함 할 수도 있습니다. 인식의 관점에서, 이미지의 내용을 분석하고 결정하는 프로세스 (비디오 포함). 여기에는 의료 검사, 사진, 360도 비디오 및 상상할 수있는 모든 종류의 이미지가 포함될 수 있습니다.

AI-Powered 컴퓨터 비전은 다음을 수행 할 수 있습니다.

  • 콘텐츠를 식별, 레이블 및 분류하십시오
  • 얼굴과 감정을 탐지합니다
  • 안경 및 모자와 같은 모자를 인식하십시오
  • 랜드 마크, 건물 및 구조를 식별하십시오
  • 색 데이터, 품질 및 해상도와 같은 픽셀 수준 정보 평가
  • 인기있는 로고를 인식하십시오
  • 텍스트를 식별하고 읽으십시오
  • 잠재적으로 부적절한 이미지를 식별하십시오

Google의 클라우드 비전 API와 컴퓨터 비전

비전 API에 대한 선택이 많이 있지만 Google의 클라우드 비전 API를 사용할 것입니다. Google은 자연 언어 처리, 음성 인식, 깊은 학습 및 시력을 포함하여 많은 AI API를 호스팅합니다.

클라우드 Vision API를 사용하면 사이트 및 앱이 이미지에 무엇이 있는지 이해할 수 있습니다. 그것은 콘텐츠를 카테고리로 분류하여 보이는 모든 것을 표시합니다. 또한 신뢰 점수를 제공하므로 실제로 이미지에 믿는 것이 믿는 것이 얼마나 믿는지 알 수 있습니다. 이 옵션을 사용하여 AR 또는 비디오 응용 프로그램의 카메라 입력에 대해 지능적으로 상호 작용할 수 있습니다. 시각적으로 손상된 사람들을 돕기 위해 도구를 만들 수 있습니다. 관광객들을위한 건물이나 랜드 마크를 식별하는 데 도움이되는 보조원을 만들 수 있습니다. 가능성은 무한합니다.

01. 클라우드 프로젝트를 설정하십시오

이전에 Google의 API를 사용한 경우이 첫 번째 단계 중 일부는 익숙합니다. 다른 Google 서비스와 마찬가지로 클라우드 프로젝트를 설정해야합니다. 그 일에 가라 Google 클라우드 플랫폼 콘솔 새 프로젝트를 만들거나 기존 프로젝트를 선택하십시오. 대부분의 Google 서비스와 마찬가지로 Cloud Vision API는 많은 API 요청을 시작할 때까지 무료로 사용할 수 있습니다. API를 활성화 할 때 청구 정보를 입력해야 할 수도 있지만 부족한 양의 요청에 따라 청구되지 않으므로 테스트를 완료 한 후 서비스를 제거 할 수 있습니다.

02. 클라우드 비전 API를 활성화합니다

A guide to Google's Cloud Vision: Enable the Cloud Vision API

API 라이브러리를 검색 한 다음 클라우드 Vision API를 활성화하십시오.

그를 탐색하십시오 API 라이브러리 프로젝트의 클라우드 비전 API를 선택하십시오.

일단 활성화되면 작은 녹색 검사와 메시지 'API가 활성화 된 메시지가 표시되어야합니다.

03. 서비스 계정을 만듭니다

다음에 A.를 설정해야합니다 서비스 계정 ...에 API를 작성한 웹 서비스로 생각하십시오. 전형적인 서비스와 같은 사용법을 설정하려고하기 때문에 이것은 모범 사례입니다. 또한 인증 흐름에서 가장 잘 작동합니다.

04. 개인 키를 다운로드하십시오

A guide to Google's Cloud Vision: Create a service account

서비스 계정에 대한 개인 키를 가져옵니다

API를 사용하고 서비스 계정이있는 프로젝트가 있으면 개인 키를 JSON 파일로 다운로드 할 수 있습니다. 파일 위치를 기록하므로 다음 단계에서 사용할 수 있습니다.

처음 몇 단계에 문제가있는 경우 빠른 시작 안내서 JSON 키의 다운로드를 도와줍니다.

05. 환경 변수를 설정합니다

당신은 그를 설정해야합니다 google_application_credentials. 환경 변수, 그래서 우리의 API 호출에 의해 액세스 할 수 있습니다. 이것은 방금 다운로드 한 JSON 파일을 가리키고 매번 경로를 입력 해야하는 것을 저장합니다. 새 터미널 창을 열고 그를 사용하십시오 수출 그렇게 명령 :

export GOOGLE_APPLICATION_CREDENTIALS="/Users/[username]/Downloads/[file name].json"

교체 [사용자 이름] 사용자 이름으로. 개인 키 파일을 저장 한 장소의 경로가 올바른지 확인하십시오. 교체 [파일 이름] 개인 키 파일을 사용하여 파일 경로를 사용하십시오.

Windows에서는 명령 줄을 통해 동일한 작업을 수행 할 수 있습니다.

$env:GOOGLE_APPLICATION_CREDENTIALS="C:\Users\[username]\Downloads\[FILE_NAME].json"

참고 : 터미널이나 콘솔 창을 닫으면 다시 실행하여 변수를 다시 설정해야 할 수 있습니다. 우리는 이것을 PHP 코드에 곧 추가 할 것입니다. 따라서 다시 걱정할 필요가 없습니다.

06. API를 호출하십시오

이제 클라우드 비전 API를 파기 할 준비가되었습니다. CURL을 사용하여 API를 빠르게 테스트 할 수 있습니다. 이 방법을 코드에서 사용할 수도 있습니다.

CURL 요청은 PHP, Python 또는 노드 인 대부분의 언어로 할 수 있습니다. 이렇게하면 명령 줄에서 전화를 직접 만드거나 선택한 언어로 변수에 결과를 지정할 수 있습니다. 컬 사용에 대한 빠른 팁을 찾으십시오 여기 ...에

요청의 세부 정보를 보관할 간단한 JSON 파일을 만듭니다. 불러라 google_vision.json. ...에 터미널 명령을 실행하려는 위치에 로컬에 저장하십시오.

 {
 "요청": [
    {
      "영상":{
      "출처":{
      "ImageRi":
      "https://upload.wikimedia.org/wikipedia/commons/9/93/golden_retriever_carlos_%2810581910556%29.jpg"
         }
     },
       "특징": [{
         "type": "type_unspecified",
         "MaxResults": 50.
     },
       {
         "type": "landmark_detection",
         "MaxResults": 50.
     },
       {
         "유형": "face_detection",
         "MaxResults": 50.
     }
       {
         "유형": "label_detection",
         "MaxResults": 50.
     },
       {
         "유형": "text_detection",
         "MaxResults": 50.
     },
       {
         "type": "safe_search_detection",
         "MaxResults": 50.
     },
       {
         "type": "image_properties",
         "MaxResults": 50.
     }
    ...에]
   }
  ...에]
} 

위의 코드에서는 얼굴 탐지 및 랜드 마크 탐지를 포함하여 사용할 특정 API 기능뿐만 아니라 분석 할 이미지를 표시했습니다. safe_search_detection. 이미지가 안전하고 성인용 콘텐츠 또는 폭력과 같은 카테고리에있는 경우 알고있는 것에 좋습니다. image_properties. 색상과 픽셀 수준의 세부 정보에 대해 알려줍니다.

curl 명령을 실행하려면 터미널 또는 명령 줄 인터페이스에서 다음을 입력하십시오.

 CURL -X POST -H "Authorization : Bearer"$ (Gcloud Auth Application-Default Print-Access-Token) -H "Content-Type : Application / JSON; Charset = UTF-8"--Data-Binary @ google_vision.json "https://vision.googleapis.com/v1/mages:annotate"& gt; 결과 

그를 사용하여 & gt; 결과 구문을 사용하면 결과가 결과라는 새 파일에 저장됩니다. URL을 API에 표시했습니다 ( "https://vision.googleapis.com/v1/mages:annotate" )와 JSON 데이터를 포함했습니다 게시하다 그것에.

이 옵션을 사용하여 API를 활성화하거나 액세스를 허용하려면이 옵션을 표시 할 수 있습니다. 해당 프롬프트에 예 또는 y에 답하십시오. JSON을 반환해야합니다.

결과 파일을 열면 Vision API 요청에서 JSON 데이터 결과가 나타납니다. 여기 스 니펫이 있습니다.

{
  "응답": [
    {
      "Labelannotations": [
        {
          "mid": "/ m / 0bt9lr",
          "설명": "개",
          "점수": 0.982986,
          "Topicality": 0.982986.
        },
        {
          "mid": "/ m / 01t032",
          "설명": "골든 리트리버",
          "점수": 0.952482,
          "Topicality": 0.952482.
        },
        {
... 

매우 유용한 결과를 즉시 볼 수 있습니다. 아래의 LabelAnnotations. 노드, 이미지가 "개"가 포함 된 98 %와 일치하는 98 %와 95 %가 포함되어 있으며 "Golden Retriever"가 포함되어 있습니다! AI는 이미 이미지의 내용과 "주둥이"와 사실을 포함하여 "스포츠 개"를 포함하여 다른 세부 사항을 확인했습니다.

이미 훈련 된 Google Vision AI 시스템으로 인해 귀하의 파트에 대한 훈련이 필요하지 않습니다. 결과를 통해 스캔하면 장래의 자르기 영역 - 주제에 대한 자동 자르기의 모든 것을 볼 수 있습니다. 색상 및 내용을 포함한 이미지에있는 이미지에 무엇이 있습니까? API가 얼마나 강력한지를 확인하기 위해 다른 이미지와 함께 사용해보십시오.

이 메소드를 계속 사용하여 사용할 호출을 테스트 할 수 있습니다. 선호하는 언어로 로컬 SDK를 설정하고 응용 프로그램에 통합 할 수도 있습니다.

07. 클라이언트 라이브러리를 설치합니다

다음으로 API를 프로젝트에 통합하는 방법을 보여주는 간단한 웹 기반 앱을 만들 수 있습니다.

통합을 쉽게하기 위해 다양한 언어로 사용할 수있는 많은 SDK가 있습니다. 이 다음 섹션에서 PHP SDK를 사용할 수 있습니다. 다른 언어로 뒤 따르는 코드를 조정하려면 SDK의 훌륭한 자원이 있습니다. 여기 ...에

로컬 또는 원격 서버에 프로젝트 폴더가 설정되어 있는지 확인하십시오. 이미 사용하지 않으면 작곡가를 가져 와서 프로젝트 폴더에 설치하십시오. 선택적으로 작곡가가 전 세계적으로 이미 설치되어 있고 괜찮습니다.

다음 composer 명령을 실행하여 Cloud Vision SDK 용 공급 업체 파일을 설치하십시오.

 PHP -R "복사 ( 'https://getcomposer.org/installer', 'composer-setup.php');"
php -r "if (hash_file ( 'sha384', 'composer-setup.php') === '93b54496392c0627746 70AC18B134C3B3A95E5A5E5C8
F1A9F115F203B75BF9A129D5DAA8BA6A13E2CC8A1DA080.
6388A8 ') {echo'설치 프로그램이 확인되었습니다. '; } else {echo '설치 프로그램이 손상됨'; 링크 ( 'composer-setup.php'); } echo php_eol; "
php composer-setup.php.
PHP -R "링크 ( 'composer-setup.php')"
PHP Composer.phar는 Google / Cloud-Vision 필요합니다 

Composer는 프로젝트 폴더에 공급 업체 폴더를 만들고 모든 종속성을 설치합니다. 당신이 이것을 찔러 넣고 PHP를 사용하고 싶다면 이것을 확인할 수 있습니다. 작곡가 자원 설치 ...에

08. 새 파일을 만듭니다

프로젝트 폴더에 새 PHP 파일을 만듭니다. up을 설정하지만 빠른 테스트를 위해 이미지를 업로드하는 간단한 HTML 양식을 포함하십시오. 여기에 폼이 포함 된 PHP 파일 예제가 있습니다.

& lt; doctype html & gt; & lt; html & gt; & lt; head & gt; & lt; Title & gt; 네트 - 컴퓨터 비전 자습서 & lt; / title & gt; & lt; / head & gt; & lt; body & gt; & lt; 폼 action = "index.php"enctype = "multipart / form-data"method = "post"& gt; & lt; h1 & gt; 선택 이미지를 선택하십시오 & lt; / h1 & gt; & lt; 입력 유형 = "파일"이름 = "파일"& gt; & lt; br / gt; & lt; 입력 유형 = "제출"값 = "이미지 업로드"이름 = "제출"& gt; & lt; br / gt; & lt; / form & gt; & lt; div class = "결과"& gt; & lt; php. // PHP 코드가 여기에 있습니다 // if (! isset ($ _ post [ '제출')) {die (); } & gt; & lt; / div & gt; & lt; / body & gt; & lt; / html & gt;

이 코드에는 Form 및 PHP 코드의 자리 표시자가 포함 된 기본 HTML 파일이 포함됩니다. 코드는 양식에서 제출 된 이미지의 존재 여부를 확인하기 시작합니다. 아직 제출되지 않으면 아무 것도하지 않습니다.

09. 이미지를 저장하십시오

온라인 또는 시스템에서 이미지를 가리키는 것을 선호하는 경우이 단계를 건너 뜁니다. 선택한 이미지를 처리하려면이 코드를 추가하여 선택한 이미지를 저장하십시오.

 // 이미지 저장
$ filepath = $ _files [ "file"] [ "name"];
if (move_uploaded_file ($ _ 파일 "[" ""[ "tmp_name"], $ filepath)) {
echo "& lt; & lt; img src =". $ filepath. "스타일 = '너비 : 400px, 높이 : 자동;' / & gt; & lt; / p & gt; ";
} else {
에코 "오류 !!";
} 

10. 환경 변수를 추가하십시오

당신은 그를 설정해야합니다 google_application_credentials. 인증을위한 변수. PHP에서 우리는 그를 사용합니다 Putenv. 명령 환경 변수를 설정하십시오. PHP 코드 에이 코드를 추가하십시오.

 PUTENV ( 'Google_Application_Credentials = / 사용자 / Richardmattka / Downloads / Vision Tutorial 1-0F464A9A0F7B.JSON') 

경로와 파일 이름을 JSON 개인 키 파일로 바꿉니다.

11. 라이브러리를 포함하십시오

라이브러리를 추가하고 초기화하십시오 랑그래브 성 코드의 클래스. 이 코드 추가 다음에 :

 __dir__이 필요합니다. '/vendor/autoload.php';
Google \ Cloud \ Vision \ V1 \ ImageAnnotatorClient를 사용하십시오.
$ ProjectID = 'Vision-Tutorial-1';
$ ImageAnnotator = 새로운 ImageAnnotatorClient ([
    'protectID'= & gt; $ protucid.
]); 

공급 업체 자동로드를 요구하여 시작하십시오. 이는 종속성이 필요할 때 Python 또는 노드에서 비슷합니다. 그를 가져오다 ImageAnotatorClient. 다음으로, 클래스를 사용하기 위해. 당신을 정의하십시오 투사 ...에 이것이 무엇인지 확실하지 않은 경우 Google 클라우드 프로젝트 콘솔에서 찾아보십시오. 마지막으로 새로 만들기를 만드십시오 ImageAnotatorClient. 프로젝트를 사용하여 객체를 사용하여 $ ImageAnnotator. 변하기 쉬운.

12. 이미지 컨텐츠 분석

분석을 위해 이미지를 API에 제출하십시오. JSON으로 결과를 화면에 표시 할 수 있지만 실제로 실제로 결과를 평가하고 원하는 어떤 방법 으로든 사용할 수 있습니다.

이미지를 API에 제출하려면 다음을 추가하십시오.

 $ image = file_get_contents ($ filepath);
$ 응답 = $ ImageAnnotator- & gt; Labeldetection ($ 이미지);
$ labels = $ 응답 - & gt; getLabelannotations ();

foreach ($ labels $ label) {
echo "& lt; div class = '결과'& gt;";
$ result = $ label- & gt; getDescription ();
에코 $ result. "(". $ label- & gt; getscore () ";)";
에코 "& lt; / div & gt;";
} 

이렇게하면 제출 된 양식의 콘텐츠를 상상 의자 엔드 포인트 및 결과를 저장합니다 $ 응답 변하기 쉬운. 그것은 그를 지정합니다 Labeldetection. 특색. 당신은 또한 사용할 수 있습니다 얼굴 인식 , Logodetection. , TextDetection. 그리고 다른 많은 함수. 전체 목록을 위해, 여기에서 확인하십시오 ...에

다음으로 레이블 목록을 반복합니다. 이것은 사용 방법을 보여주는 예일뿐입니다. 당신은 그것을 처리하고 결과에 반응 할 수 있지만 필요합니다.

13. 얼굴을 탐지합니다

A guide to Google's Cloud Vision: Face detection

Vision API의 Facedetection 기능을 사용하여 이미지에서 얼굴의 감정 및 경계 상자를 찾을 수 있습니다.

API가 얼마나 강력한 지에 대한 또 다른 빠른 예제 얼굴 인식 함수. 이렇게하면 얼굴이있는 이미지의 위치 정보뿐만 아니라 감정 데이터를 반환합니다. 이 코드를 사용해보십시오.

 $ 답변 = $ ImageAnnotator- & Gt; Facedetection ($ 이미지);
$ faces = $ 응답 - & gt; getFaceAnnotations ();

$ likelihoodname = [ '알 수 없음', 'very_unlikely', 'unikely',
    '가능성', '가능성있는', 'rikely']];
// var_dump ($ labels);

foreach ($ face로 $ 얼굴로) {
echo "& lt; div class = '결과'& gt;";
$ angger = $ face-& gt; getangerlikelihood ();
PRINTF ( "분노 : % s". PHP_EOL, $ LIKELIODNAME [$ NOGE]);
$ Joy = $ Face- & Gt; GetJoyLikelihood ();
    printf ( "기쁨 : % s", php_eol, $ likelihoodname [$ JOY]);
$ vertices = $ Face- & gt; getBoundingPoly () - & gt; getvertices ();
    $ bounds = [];
    foreach ($ vertices로 $ vertex) {
        $ bounds [] = sprintf ( '(% d, % d)', $ vertex- & gt; getx (), $ vertex- & gt; gety ());
    }
    인쇄 ( '경계 :'. 가입 ( ',', $ BIGHT)). PHP_EOL);
에코 "& lt; / div & gt;";
} 

이를 사용하여 시작합니다 얼굴 인식 주석 자의 기능과 앞의 예제와 같은 이미지에서 통과합니다. 그럼 당신은 그를 얻습니다 FaceAnotiatons. ...에 더 일반적인 언어로 응답 가중치 배열을 사용하므로 특정 감정의 가능성을 볼 수 있습니다. 이를 따르면 이전처럼 응답을 반복합니다. 여러 가지 감정, 분노 및 기쁨의 두 가지를 확인하여 결과를 반환합니다. 이것은 발견 된 각 얼굴을 정의하는 경계 상자의 모서리를 제공합니다.

이 기사는 원래 316 호에서 출판되었습니다 그물 웹 디자이너 및 개발자를위한 세계 최고의 잡지. 여기 문제를 구입하십시오 또는 여기를 구독하십시오 ...에

관련 기사:

  • 놀라운 AI ​​도구는 마술처럼 사진을 재구성합니다
  • Google 애널리틱스의 17 상위 도구
  • 최고의 코드 편집자

어떻게 - 가장 인기있는 기사

22 베스트 UI 디자인 도구

어떻게 Sep 15, 2025

(이미지 크레디트 : 인챈트) 최고의 UI 디자인 도구를 선택하면 거의 모든 디자인 프로세�..


Facebook 개인 정보 설정 : 프로필 개인을 유지하는 방법

어떻게 Sep 15, 2025

(이미지 크레디트 : Alex Blake / Facebook) Facebook 개인 정보 보호 설정은 약간의 역설처럼 보�..


Mac에서 스크린 샷을 찍는 방법

어떻게 Sep 15, 2025

(이미지 크레디트 : 크리에이티브 블로크) 전체 화면, 창 또는 바탕 화면의 선택된 부분�..


Zbrush의 생물 속도 조각

어떻게 Sep 15, 2025

Zbrush의 생물을 개념화 할 때, 당신의 아이디어를 그리니어, 무언가 조각으로 제시하십시오. ..


터미네이터 라인이란 무엇입니까?

어떻게 Sep 15, 2025

양식을 전달하기 위해 고려해야 할 점이 많은 측면이 있습니다. 매우 유용한 기본 기본은 터미네�..


chatbot 인터페이스를 만드는 방법

어떻게 Sep 15, 2025

2000 년대 중반, 가상 에이전트 및 고객 서비스 chatbots는 대화 예정이 아니며 두건 밑에도 웹 서버�..


C4D에서 낮은 폴리 벽지 만들기

어떻게 Sep 15, 2025

페이지 1 / 2 : C4D에서 낮은 폴리 벽지 만들기 : 단계 01-06 ..


단 4 색으로 자화상을 만듭니다

어떻게 Sep 15, 2025

자기 초상화는 예술가가 시도 할 수있는 가장 보람있는 과제 중 하나입니다. 우리는 우리 자신의 ..


카테고리