Lesson Progress
0% Complete
이 세션에서는 다음 두 확장을 사용합니다.
- 음성 인식
- 텍스트 음성 변환
다음 두 확장의 기능을 이해해 보겠습니다.
음성 인식
음성 인식은 구어의 단어와 구를 식별하고 기계가 읽을 수 있는 형식으로 변환하는 기계의 기능입니다.
음성 인식을 위한 객체 선언:
- sr = SpeechRecognition()
기능
- sethreshold(): 이 함수는 분석 중인 오디오 파일에서 배경 소음을 제거하기 위해 라우드니스 필터 임계값을 설정합니다.
- 구문: setthreshold(loudness = 30)
- 매개변수:
- loudness = 1 ~ 100
- analysepeech(): 기능이 실행되면 인식 창이 열리고 PictoBlox가 말하는 내용을 녹음하는 동안 지정된 시간을 받게 됩니다. 녹음이 완료되면 음성은 사용자가 말한 언어의 텍스트로 변환되어 로컬에 저장됩니다.
- 구문: analysespeech(time = 2, language = “en-US”)
- 매개변수:
- time = 모든 양의 정수
- language = {“ar-AE”, “ca-ES”, “da-DK”, “da-de”, “en-GB”, “en-US”, “es-ES”, “fi-FI” , “fr-FR”, “gu-IN”, “hi-IN”, “it-IT”, “ja-JP”, “ko-KR”, “mr-IN”, “nb-NO”, ” nl-NL”, “pl-PL”, “pt-PT”, “ru-RU”, “sv-SE”, “ta-IN”, “te-IN”, “th-TH”, “tr- TR”, “zh-CN”, “zh-HK”}이 매개변수는 다음 언어에 해당합니다.
{아랍어, 중국어(북경어), 덴마크어, 네덜란드어, 영어, 프랑스어, 독일어, 힌디어, 아이슬란드어, 이탈리아어, 일본어, 한국어, 노르웨이어, 폴란드어, 포르투갈어(브라질), 포르투갈어(유럽), 루마니아어, 러시아어, 스페인어(유럽) , 스페인어(라틴 아메리카), 스웨덴어, 터키어, 웨일스어}
- speechresult(): 이 함수는 음성에서 감지된 마지막 텍스트를 보고합니다.
- 구문: speechresult():
텍스트 음성 변환
Text to Speech 확장은 텍스트를 음성으로 변환할 수 있는 확장 프로그램입니다. 합성된 음성을 출력하려는 프로젝트에 유용합니다. 이 서비스는 Amazon Web Services에서 제공합니다.
텍스트 음성 변환을 위한 객체 선언:
- ts = TexttoSpeech()
기능
- speak(): 이 함수는 인수로 입력된 텍스트를 말합니다.
이 기능의 사용은 128자로 제한됩니다. 128자보다 긴 문자열이 제공되면 처음 128자만 음성으로 전달됩니다.- 구문: speak(time = 2, language = “en-US”)
- 매개변수:
- time = 모든 양의 정수
- setlanguageto(): 이 함수는 주어진 언어의 발음을 사용하여 텍스트를 말하게 합니다. 그러나 텍스트를 번역하지는 않습니다.
- 구문: setlanguageto(language = “en-US”)
- 매개변수:
- language = {“ar-AE”, “ca-ES”, “da-DK”, “da-de”, “en-GB”, “en-US”, “es-ES”, “fi-FI” , “fr-FR”, “gu-IN”, “hi-IN”, “it-IT”, “ja-JP”, “ko-KR”, “mr-IN”, “nb-NO”, ” nl-NL”, “pl-PL”, “pt-PT”, “ru-RU”, “sv-SE”, “ta-IN”, “te-IN”, “th-TH”, “tr- TR”, “zh-CN”, “zh-HK”}이 매개변수는 다음 언어에 해당합니다.
{아랍어, 중국어(북경어), 덴마크어, 네덜란드어, 영어, 프랑스어, 독일어, 힌디어, 아이슬란드어, 이탈리아어, 일본어, 한국어, 노르웨이어, 폴란드어, 포르투갈어(브라질), 포르투갈어(유럽), 루마니아어, 러시아어, 스페인어(유럽) , 스페인어(라틴 아메리카), 스웨덴어, 터키어, 웨일스어}
- language = {“ar-AE”, “ca-ES”, “da-DK”, “da-de”, “en-GB”, “en-US”, “es-ES”, “fi-FI” , “fr-FR”, “gu-IN”, “hi-IN”, “it-IT”, “ja-JP”, “ko-KR”, “mr-IN”, “nb-NO”, ” nl-NL”, “pl-PL”, “pt-PT”, “ru-RU”, “sv-SE”, “ta-IN”, “te-IN”, “th-TH”, “tr- TR”, “zh-CN”, “zh-HK”}이 매개변수는 다음 언어에 해당합니다.
- setvoiceto(): 이 함수는 Text to Speech에서 사용되는 음성의 종류를 변경합니다.
- 구문: setvoiceto(voice = “alto”)
- 매개변수:
- voice = {“alto”, “tenor”, “squeak”, “giant”, “kitten”}