Lesson Progress
0% Complete

컴퓨터 비전 API

클라우드 기반 Computer Vision API는 개발자에게 이미지 처리 및 정보 반환을 위한 고급 알고리즘에 대한 액세스를 제공합니다. 이미지를 업로드하거나 이미지 URL을 지정하면 Microsoft 컴퓨터 비전 알고리즘이 입력 및 사용자 선택에 따라 시각적 콘텐츠를 다르게 분석할 수 있습니다.

컴퓨터 비전

컴퓨터 비전은 인간이 먼저 시작한다는 점을 제외하면 인간의 비전과 거의 동일하게 작동합니다. 인간의 시각은 사물을 구별하는 방법, 사물이 얼마나 멀리 떨어져 있는지, 사물이 움직이고 있는지, 이미지에 문제가 있는지 등을 구분하는 방법을 훈련하는 평생 동안의 컨텍스트라는 이점이 있습니다.

컴퓨터 비전은 기계가 이러한 기능을 수행하도록 훈련하지만 망막, 시신경 및 시각 피질이 아닌 카메라, 데이터 및 알고리즘을 사용하여 훨씬 짧은 시간에 수행해야 합니다. 제품을 검사하거나 생산 자산을 감시하도록 훈련된 시스템은 분당 수천 개의 제품 또는 프로세스를 분석하여 눈에 띄지 않는 결함이나 문제를 발견할 수 있으므로 인간의 능력을 빠르게 능가할 수 있습니다.

종이 훈련

 

컴퓨터 비전 기능

소개

PictoBlox의 Computer Vision 클래스/확장 기능을 사용하면 PictoBlox에서 AI 프로젝트를 만들 수 있습니다. 이 클래스를 사용하여 이미지에서 유명인, 브랜드, 랜드마크 및 개체를 식별하는 프로젝트를 만들 수 있습니다.

이미지 특징에 대한 이미지를 분석하면 다음 사항을 인식할 수 있습니다.

  1. 브랜드: 브랜드 감지는 수천 개의 글로벌 로고 데이터베이스를 사용하여 이미지에서 상업용 브랜드를 식별합니다. 컴퓨터 비전 서비스는 지정된 이미지에 브랜드 로고가 있는지 감지합니다. 그렇다면 브랜드 이름을 반환합니다. 그렇지 않으면 NULL을 반환합니다.
    브랜드
  2. 유명인: 유명인 감지는 데이터베이스를 사용하여 이미지에서 유명인을 식별합니다. 컴퓨터 비전 서비스는 지정된 이미지에 유명인이 있는지 감지합니다. 그렇다면 이름을 반환합니다. 그렇지 않으면 NULL을 반환합니다.
    유명 인사
  3. 개체: 컴퓨터 비전은 주어진 이미지에 개체가 있는지 감지합니다. 그렇다면 이름을 반환합니다. 그렇지 않으면 NULL을 반환합니다.
    객체 감지
  4. 랜드마크: 랜드마크 감지는 타지 마할과 같은 이미지에서 이를 식별하기 위해 수천 개의 글로벌 랜드마크 데이터베이스를 사용합니다.
    타지 마할 2
  5. 이미지 태그: 컴퓨터 비전은 이미지에서 감지된 분류 기반 범주를 반환합니다. 컴퓨터 비전은 다음 다이어그램에 제공된 86개 범주에 따라 이미지를 광범위하게 또는 구체적으로 분류할 수 있습니다.
    카테고리 태그
  6. 이미지 설명: 이미지의 내용을 설명하는 사람이 읽을 수 있는 문장입니다.

기능

  1. video(): 이 함수는 정의된 투명도 수준으로 무대에서 비디오를 켜고 끄는 데 도움이 됩니다.
    1. 구문: video(video_state = “on”, transparency = 1)
    2. 매개변수:
      1. video_state = {“on”, “off”, “on flipped”}
      2. transparency = 0 ~ 100, 백분율(%)
  2. analysecamera(): 이 함수는 카메라에서 입력으로 받은 이미지를 해당 기능에 대해 분석하는 데 사용됩니다.
    1. 구문: analysecamera()
  3. analysestage(): 이 함수는 해당 기능에 대해 스테이지에서 입력으로 받은 이미지를 분석하는 데 사용됩니다.
    1. 구문: analysestage()
  4. analysebackdrop(): 해당 기능에 대해 현재 배경 이미지에서 입력으로 받은 이미지를 분석하는 데 사용되는 함수입니다.
    1. 구문: analysebackdrop()
  5. analysecostume(): 해당 기능에 대해 현재 의상에서 입력으로 받은 이미지를 분석하기 위해 사용하는 함수입니다.
    1. 구문: analysecostume()
  6. analyseURL(): 이 기능은 이미지의 지정된 URL에서 입력으로 받은 이미지를 해당 기능에 대해 분석하는 데 사용됩니다. 이 기능을 사용하면 브랜드, 유명인, 사물, 랜드마크, 이미지 태그, 이미지 설명과 같은 이미지에서 많은 것을 분석할 수 있습니다.
    1. 구문: analyseURL(url = “https://ql.reallyai.net/wp-content/uploads/2022/02/Robert-and-Chris.jpg”)
    2. 매개변수:
      1. url = 모든 URL
  7. imagefeaturecount(): 이 함수는 이미지에서 계산할 지정된 기능의 수를 보고합니다. 옵션으로는 유명인, 브랜드, 사물, 이미지 태그를 하나의 이미지로 신고할 수 있습니다.
    1. 구문: imagefeaturecount(feature_type = “object”)
    2. 매개변수:
      1. feature_type = {“celebrity”, “brand”, “object”, “image tag”}
  8. imagefeatureinfo(): 이 함수는 인식된 유명인/브랜드/개체/이미지 태그의 이름/ x-위치/ y-위치/ 너비/ 높이 또는 신뢰도를 보고합니다.
    숫자가 범위를 벗어나면 함수는 NULL을 반환합니다.

    1. 구문: imagefeatureinfo(feature_type = “object”, number = 1, information = “name”)
    2. 매개변수:
      1. feature_type = {“celebrity”, “brand”, “object”, “image tag”}
      2. number = 1에서 100
      3. information = {“name”, “xPos”, “yPos”, “width”, “height”, “confidence”}
        참고: “name”은 기본 매개변수이므로 매개변수로 전달할 필요가 없습니다. 매개변수로 “name”을 입력하면 작동하지 않습니다.
  9. Landmark(): 이 함수는 분석 시 이미지에서 식별된 랜드마크를 보고합니다.
    1. 구문: landmark()
  10. imagedescription(): 이 함수는 분석 시 이미지에서 식별된 이미지 설명(이미지의 내용을 설명하는 사람이 읽을 수 있는 문장)을 보고합니다.

이러한 기능을 사용하여 이제 우리는 일상 생활에서 매우 유용할 수 있는 매우 흥미로운 컴퓨터 비전 프로그램 및 응용 프로그램을 구축할 수 있습니다.