Lesson Progress
0% Complete

휴먼 비전은 어떻게 작동합니까?

컴퓨터 비전을 이해하려면 먼저 인간의 눈이 어떻게 작동하는지 살펴봐야 합니다.

인간의 시각

  1. 이미지 캡처 : 인간은 눈을 사용하여 이미지를 캡처합니다. 캡처된 이미지는 카메라가 이미지를 캡처하는 방식과 유사하지만 매우 원시 형식으로 망막에 형성됩니다.
    눈 구조
  2. 물체와 그 특징 식별 : 원시 이미지는 처리를 위해 시신경을 통해 뇌로 전송됩니다. 뇌는 크기, 색상, 모양 등과 같은 특징과 함께 양초, 사람, 의자 등과 같은 다양한 물체를 식별하기 시작합니다.
  3. 정보 추출 : 이 단계에서 우리의 뇌는 객체의 특징을 과거 지식과 비교하여 정보를 수집합니다. 예를 들어, 시각적 특징을 구별할 수 있기 때문에 아버지와 어머니를 구별할 수 있습니다.
  4. 행동 : 상위 수준 정보를 얻으면 그에 따라 행동을 시작할 수 있습니다. 예를 들어, 공이 얼굴에 오는 것을 확인할 수 있으면 공을 치지 않도록 옆으로 이동할 수 있습니다.

인간의 눈과 뇌의 협응력이 완벽하기 때문에 이 모든 단계가 빠르게 진행됩니다.

컴퓨터 비전

컴퓨터 비전도 인간의 비전과 유사한 접근 방식을 따릅니다.

컴퓨터 비전은 디지털 이미지나 비디오에서 높은 수준의 이해를 얻기 위해 컴퓨터를 만드는 방법을 다룹니다. 공학적인 관점에서 보면 인간의 시각으로 할 수 있는 작업을 자동화하는 것을 추구합니다.

컴퓨터 비전

컴퓨터 비전 작업에는 디지털 이미지를 획득, 처리, 분석 및 이해하는 방법이 포함됩니다.

컴퓨터 비전

예: 비전을 사용하는 자율 주행 자동차

자율주행차는 사람의 개입이 거의 또는 전혀 없이 환경을 감지하고 안전하게 이동할 수 있는 차량입니다.

이 예에서는 자율주행차가 전진, 좌회전, 우회전 또는 정지할 수 있다고 가정해 보겠습니다. 다음으로 보행자가 자동차에 접근하면 자동차가 어떻게 반응하는지 봅시다.

  1. 획득 : 자율주행차는 카메라를 사용하여 이미지를 획득합니다. 그들은 매우 빠른 속도로 이미지를 수신하고 처리합니다. 예를 들어, 카메라가 다음 이미지를 수신했다고 가정해 보겠습니다.
    길을 건너는 소녀
  2. 처리 : 컴퓨터는 이미지의 모든 개체를 식별하기 시작하고 위치와 함께 개체를 나열합니다. 이 경우 도로에 무언가가 있습니다. 그러나 컴퓨터는 여전히 그것이 어떤 개체인지에 대한 정보가 없습니다.
  3. 분석 : 그런 다음 컴퓨터는 각 개체를 다른 범주로 분류합니다. 이 경우 개체를 소녀로 식별합니다. 또한 개체에 대한 일부 정보에 유해성, 거리 및 기타 매개변수로 태그를 지정합니다. 이러한 태그는 결정을 내리는 데 사용되는 상위 수준 정보입니다.
    소녀 분석
  4. 행위 : 상위 정보를 기반으로 컴퓨터가 행동할 수 있습니다. 이 경우 자동차가 정지합니다.

결론

이번 주제에서는 자율주행차를 예로 들어 컴퓨터 비전이 무엇인지, 그 과정을 알아보았습니다. 다음 항목에서는 다양한 AI 프로젝트를 만드는 데 사용되는 PictoBlox의 인공 지능 확장에 대해 알아봅니다.