Lesson Progress
0% Complete

텍스트 인식 소개

  • 텍스트 인식은 이미지, 스캔 문서, 비디오(실시간 포함) 등과 같은 다양한 종류의 디지털 형식으로 된 파일에서 텍스트를 인식하는 데 사용되는 광범위한 기술입니다.
  • OCR(광학 문자 인식)은 텍스트 이미지를 기계가 읽을 수 있는 형식으로 변환하는 프로세스입니다. 이 기계 판독 가능 형식으로 저장된 텍스트는 광범위한 응용 프로그램을 위해 분석, 처리 및 저장될 수 있습니다.
  • OCR의 분석 및 처리 부분은 기계 학습 알고리즘의 원리에 따라 작동하는 컴퓨터 비전 시스템을 사용하여 수행됩니다.

 

  • 이 외에도 OCR을 사용하여 프로세스/시스템에서 일부 작업을 트리거할 수도 있습니다. 예를 들어 PictoBlox 환경에서 구축할 수 있는 자동 우편 시스템인 ‘Postman’이라는 활동이 있습니다.
    이 활동에서는 사람의 이름이 포함된 필기 텍스트를 OCR을 사용하여 읽은 다음 감지된 이름에 따라 선물 스프라이트를 적절한 수신자에게 보냅니다.

텍스트 인식 기능

PictoBlox의 텍스트 인식 확장 기능은 AI를 활용하여 이미지나 비디오와 같은 미디어 파일을 분석하고 해당 파일에서 텍스트를 인식합니다. 텍스트 인식 확장 프로그램은 손으로 쓴 텍스트와 인쇄된 텍스트를 모두 분석할 수 있습니다.

기능

  1. video(): 이 함수는 정의된 투명도 수준으로 무대에서 비디오를 켜고 끄는 데 도움이 됩니다.
    1. 구문: video(video_state = “on”, transparency = 1)
    2. 매개변수:
      1. video_state = {“on”, “off”, “on flipped”}
      2. transparency = 0 ~ 100, 백분율(%)
  2. analysecamera(): 이 함수는 카메라에서 입력으로 받은 이미지를 해당 기능에 대해 분석하는 데 사용됩니다.
    1. Syntax: analysecamera(text_type, time)
    2. 매개변수:
      1. text_type = {“handWrittenText”, “printedText”}
      2. time = 모든 양의 정수
  3. analysestage(): 이 함수는 해당 기능에 대해 스테이지에서 입력으로 받은 이미지를 분석하는 데 사용됩니다.
    1. 구문: analysestage(text_type, time)
    2. 매개변수:
      1. text_type = {“handWrittenText”, “printedText”}
  4. analysebackdrop(): 해당 기능에 대해 현재 배경 이미지에서 입력으로 받은 이미지를 분석하는 데 사용되는 함수입니다.
    1. 구문: analysebackdrop()
  5. analysecostume(): 해당 기능에 대해 현재 의상에서 입력으로 받은 이미지를 분석하기 위해 사용하는 함수입니다.
    1. 구문: analysecostume()
  6. analyseURL(): 이 기능은 이미지의 지정된 URL에서 입력으로 받은 이미지를 해당 기능에 대해 분석하는 데 사용됩니다. 이 기능을 사용하면 브랜드, 유명인, 사물, 랜드마크, 이미지 태그, 이미지 설명과 같은 이미지에서 많은 것을 분석할 수 있습니다.
    1. 구문: analyseURL(url = “https://ql.reallyai.net/wp-content/uploads/2022/02/Robert-and-Chris.jpg”)
    2. 매개변수:
      1. url = “모든 URL”
  7. handwrittentextresult(): 이 함수는 분석에서 식별된 필기 텍스트를 보고합니다.
    1. 구문: handwrittentextresult()
  8. printedtextresult(): 이 함수는 분석에서 식별된 인쇄된 텍스트를 보고합니다.
    1. 구문: printtextresult()

이러한 기능을 사용하여 이제 포트폴리오에서 모범이 될 수 있는 매우 흥미로운 텍스트 인식 프로그램 및 애플리케이션을 구축할 수 있습니다.