Я покажу вам процесс создания полнофункционального приложения Amazon Transcribe.

Что мы собираемся построить?

Мы создадим приложение, которое облегчит общение между двумя людьми, говорящими на разных языках. Пользователь может:

  • Запишите их голос на английском языке
  • Приложение транскрибирует запись в текст.
  • Текст будет переведен на испанский язык.
  • Переведенный текст будет отображен и прочитан вслух.

Содержание этой серии

Этот проект разделен на следующие части:

  1. Как получить ключи доступа к AWS
  2. Создание веб-приложения Amazon Transcribe с помощью JavaScript — чисто интерфейсная реализация с использованием клиентской библиотеки на JavaScript.
  3. Создание веб-приложения Amazon Transcribe с предварительно подписанным URL-адресом AWS — полнофункциональная реализация с использованием сокетов AWS в NestJS.
  4. Создание веб-приложения Amazon Transcribe с помощью NestJS — еще один вариант полнофункциональной реализации с использованием шлюзов NestJS.

Готовый код вы найдете в моих репозиториях на GitHub, которые разделены на front-end и back-end.

Интерфейс будет представлять собой простой ванильный JavaScript, просто чтобы проиллюстрировать, как взаимодействовать с серверной частью. Серверная часть будет написана на NestJS и будет использовать библиотеку Client Transcribe Streaming от AWS.

Хотя библиотека AWS Transcribe довольно мощная, мне не удалось найти для нее полноценных учебных пособий. Итак, эта статья поможет вам разобраться во всех тонкостях потоковой передачи звука с внешнего интерфейса на серверную, а затем его потоковой передачи с серверной части на AWS.

Давайте начнем!

Следующая часть будет посвящена подготовке ваших учетных данных для доступа к AWS. Прочтите это здесь.

Если вы нашли это полезным, нажмите кнопку «хлопнуть» 👏. Также не стесняйтесь комментировать! Буду рад помочь :)