이 항목에서는 PctoBlox가 컴퓨터 비전을 위해 어떤 블록을 보유하고 있는지 살펴보겠습니다.
컴퓨터 비전 블록
인공 지능 확장에는 이미지를 입력으로 사용하여 이미지 기능을 분석하는 다음 세 가지 블록이 있습니다.
- recognize () in camera image after () seconds : 이 블록은 카메라를 시작하고 지정된 시간 이후에 이미지를 촬영하고 분석합니다. 그런 다음 이미지 기능을 PictoBlox에 저장합니다.
- recognize () in image from URL () : 이 블록은 지정된 URL에서 이미지를 추출하고 분석하여 PictoBlox에 정보를 저장합니다.
- recognize () in image from () : PictoBlox의 무대, 의상 또는 배경에서 이미지를 추출하고 분석하여 PictoBlox에 정보를 저장하는 블록입니다.
이미지에서 다음을 인식할 수 있습니다.
- 이미지 기능 – 컴퓨터 비전
- 손으로 쓴 텍스트
- 인쇄된 텍스트
- 얼굴 디테일
이 단원에서는 이미지 기능 에만 관심이 있습니다.
이미지 기능 결과
이미지 특징에 대한 이미지를 분석하면 다음 사항을 인식할 수 있습니다.
- 브랜드: 브랜드 감지는 수천 개의 글로벌 로고 데이터베이스를 사용하여 이미지에서 상업용 브랜드를 식별합니다. 컴퓨터 비전 서비스는 지정된 이미지에 브랜드 로고가 있는지 감지합니다. 그렇다면 브랜드 이름을 반환합니다. 그렇지 않으면 NULL을 반환합니다.
- 유명인: 유명인 감지는 데이터베이스를 사용하여 이미지에서 유명인을 식별합니다. 컴퓨터 비전 서비스는 지정된 이미지에 유명인이 있는지 감지합니다. 그렇다면 이름을 반환합니다. 그렇지 않으면 NULL을 반환합니다.
- 개체: 컴퓨터 비전은 주어진 이미지에 개체가 있는지 감지합니다. 그렇다면 이름을 반환합니다. 그렇지 않으면 NULL을 반환합니다.
- 랜드마크: 랜드마크 감지는 타지 마할과 같은 이미지에서 이를 식별하기 위해 수천 개의 글로벌 랜드마크 데이터베이스를 사용합니다.
- 이미지 태그: 컴퓨터 비전은 이미지에서 감지된 분류 기반 범주를 반환합니다. 컴퓨터 비전은 다음 다이어그램에 제공된 86개 범주에 따라 이미지를 광범위하게 또는 구체적으로 분류할 수 있습니다.
- 이미지 설명: 이미지의 내용을 설명하는 사람이 읽을 수 있는 문장입니다.
이제 PictoBlox 프로젝트에서 컴퓨터 비전을 사용하는 방법을 살펴보겠습니다. 그러나 먼저 컴퓨터 비전에 사용할 수 있는 블록을 살펴보겠습니다.
recognized () count
recognized () count 블록은 이미지에서 셀 선택한 항목의 수를 보고합니다. 하나의 이미지에서 여러 유명인, 브랜드, 사물 및 이미지 태그를 볼 수 있습니다.
이 이미지를 알아보자:
여기( https://ql.reallyai.net/wp-content/uploads/2022/02/Robert-and-Chris.jpg )에서 이미지를 복사하고 URL을 사용하여 이미지를 분석합니다.
이 이미지에서 인식되는 개수는 다음과 같습니다.
recognized () () name
recognized () () name 블록은 인식된 유명인/브랜드/오브젝트/이미지 태그의 이름을 보고합니다. 블록에는 두 가지 입력이 있습니다.
- 유형: 유명인, 브랜드, 개체 또는 이미지 태그
- 번호: 분석하려는 항목의 #입니다. 예를 들어 유명인이 2명일 경우 이 입력을 변경하면 유명인은 1명, 유명인은 2명의 이름을 얻을 수 있습니다.
숫자가 범위를 벗어나면 블록은 NULL을 반환합니다.
예를 들어. 위에 주어진 이미지의 경우 다음을 얻을 수 있습니다.
다음 항목에서 프로그램에서 이 블록을 사용하는 방법을 살펴보겠습니다.
() recognition result
() recognition result 블록은 이미지에서 식별된 랜드마크와 이미지 설명을 보고합니다.
이 이미지를 분석해 보겠습니다.
여기에 이미지 URL 복사: https://ql.reallyai.net/wp-content/uploads/2022/02/Taj-Mahal-2.jpg
블록에서 다음 결과가 나옵니다.
결론
이미지를 인식하는 블록을 살펴보고 이 주제에 대한 브랜드, 유명인, 사물, 랜드마크, 이미지 태그 및 이미지 설명을 보고합니다. 다음 강의에서는 CV 프로젝트에서 이러한 블록을 사용하여 이해하는 프로그램을 만들어 보겠습니다.