Lesson Progress
0% Complete

이 세션에서는 다음 두 확장을 사용합니다.

  1. 음성 인식
  2. 텍스트 음성 변환

다음 두 확장의 기능을 이해해 보겠습니다.

음성 인식

음성 인식은 구어의 단어와 구를 식별하고 기계가 읽을 수 있는 형식으로 변환하는 기계의 기능입니다.

음성 인식을 위한 객체 선언:

  • sr = SpeechRecognition()

기능

  1. sethreshold(): 이 함수는 분석 중인 오디오 파일에서 배경 소음을 제거하기 위해 라우드니스 필터 임계값을 설정합니다.
    1. 구문: setthreshold(loudness = 30)
    2. 매개변수:
      1. loudness = 1 ~ 100
  2. analysepeech(): 기능이 실행되면 인식 창이 열리고 PictoBlox가 말하는 내용을 녹음하는 동안 지정된 시간을 받게 됩니다. 녹음이 완료되면 음성은 사용자가 말한 언어의 텍스트로 변환되어 로컬에 저장됩니다.
    1. 구문: analysespeech(time = 2, language = “en-US”)
    2. 매개변수:
      1. time = 모든 양의 정수
      2. language = {“ar-AE”, “ca-ES”, “da-DK”, “da-de”, “en-GB”, “en-US”, “es-ES”, “fi-FI” , “fr-FR”, “gu-IN”, “hi-IN”, “it-IT”, “ja-JP”, “ko-KR”, “mr-IN”, “nb-NO”, ” nl-NL”, “pl-PL”, “pt-PT”, “ru-RU”, “sv-SE”, “ta-IN”, “te-IN”, “th-TH”, “tr- TR”, “zh-CN”, “zh-HK”}이 매개변수는 다음 언어에 해당합니다.
        {아랍어, 중국어(북경어), 덴마크어, 네덜란드어, 영어, 프랑스어, 독일어, 힌디어, 아이슬란드어, 이탈리아어, 일본어, 한국어, 노르웨이어, 폴란드어, 포르투갈어(브라질), 포르투갈어(유럽), 루마니아어, 러시아어, 스페인어(유럽) , 스페인어(라틴 아메리카), 스웨덴어, 터키어, 웨일스어}
  3. speechresult(): 이 함수는 음성에서 감지된 마지막 텍스트를 보고합니다.
    1. 구문: speechresult():

텍스트 음성 변환

Text to Speech 확장은 텍스트를 음성으로 변환할 수 있는 확장 프로그램입니다. 합성된 음성을 출력하려는 프로젝트에 유용합니다. 이 서비스는 Amazon Web Services에서 제공합니다.

텍스트 음성 변환을 위한 객체 선언:

  • ts = TexttoSpeech()

기능

  1. speak(): 이 함수는 인수로 입력된 텍스트를 말합니다.
    이 기능의 사용은 128자로 제한됩니다. 128자보다 긴 문자열이 제공되면 처음 128자만 음성으로 전달됩니다.

    1. 구문: speak(time = 2, language = “en-US”)
    2. 매개변수:
      1. time = 모든 양의 정수
  2. setlanguageto(): 이 함수는 주어진 언어의 발음을 사용하여 텍스트를 말하게 합니다. 그러나 텍스트를 번역하지는 않습니다.
    1. 구문: setlanguageto(language = “en-US”)
    2. 매개변수:
      1. language = {“ar-AE”, “ca-ES”, “da-DK”, “da-de”, “en-GB”, “en-US”, “es-ES”, “fi-FI” , “fr-FR”, “gu-IN”, “hi-IN”, “it-IT”, “ja-JP”, “ko-KR”, “mr-IN”, “nb-NO”, ” nl-NL”, “pl-PL”, “pt-PT”, “ru-RU”, “sv-SE”, “ta-IN”, “te-IN”, “th-TH”, “tr- TR”, “zh-CN”, “zh-HK”}이 매개변수는 다음 언어에 해당합니다.
        {아랍어, 중국어(북경어), 덴마크어, 네덜란드어, 영어, 프랑스어, 독일어, 힌디어, 아이슬란드어, 이탈리아어, 일본어, 한국어, 노르웨이어, 폴란드어, 포르투갈어(브라질), 포르투갈어(유럽), 루마니아어, 러시아어, 스페인어(유럽) , 스페인어(라틴 아메리카), 스웨덴어, 터키어, 웨일스어}
  3. setvoiceto(): 이 함수는 Text to Speech에서 사용되는 음성의 종류를 변경합니다.
    1. 구문: setvoiceto(voice = “alto”)
    2. 매개변수:
      1. voice = {“alto”, “tenor”, “squeak”, “giant”, “kitten”}