요약
ESP32를 사용해서 ChatGPT + Google Translate TTS로 말하는 비서 프로젝트입니다.
시리얼 모니터에 입력한 값을 프롬프트로 GPT에 전송하고,
GPT가 생성한 응답을 수신하여 구글 TTS로 전송한 후,
ESP32가 구글 TTS 음성 데이터를 수신하여 I2S 스피커로 출력하는 내용입니다.
ChatGPT안에 TTS API(/v1/audio/speech)로 사용해서 테스트한 영상입니다.
회로는 테스트 용도로 간단하게 구성했습니다.
ChatGPT안에 TTS API(/v1/audio/speech)로 사용하면,
인풋, 아웃풋(소리) 양이 많아서 비용이 프롬프트 질문보다는 많이 책정됐습니다.
결과적으로 구글 TTS는 영문 기준 200자 내외는 무료라서 구글 TTS를 사용했습니다.
아래는 구글 TTS로 사용한 영상입니다.
한번에 요청하는 게 아니어서 중간에 좀 끊겨 스트리밍 부분을 조금 개선해야 될 것 같습니다.
아두이노, 라즈베리파이 시제품 제작, 믿을 수 있는 전문 업체를 찾고 계신가요?
시제품 제작이 필요한데, 어디에 맡겨야 할지 고민되시나요?
최신트렌드를 빠르게 접하고 시도하는 아두맨에게 무료 상담 해보세요!
https://open.kakao.com/o/si6GDhth
오늘도 긴 글 읽어주셔서 감사합니다!