POCKETSPHINX PYTHON РАСПОЗНАВАНИЕ РЕЧИ

PocketSphinx - это библиотека для распознавания речи, которая может быть использована в Python. Библиотека может использоваться для перевода сказанного слова в текст, позволяя использовать голосовой ввод в Python-приложениях. Она может использоваться как для простых команд, так и для сложных задач, таких как распознавание речи на других языках.

PocketSphinx можно установить через pip, используя команду:

pip install pocketsphinx

Для распознавания речи с помощью библиотеки необходимо определить конфигурационный файл и обученный языковой модуль. Например, если мы хотим определить, что было сказано на английском языке, то можно использовать следующий код:

import pocketsphinx
import os
modeldir = "/usr/local/share/pocketsphinx/model"
# Create a decoder with specified model
config = pocketsphinx.Decoder.default_config()
config.set_string('-hmm', os.path.join(modeldir, 'en-us/en-us'))
config.set_string('-dict', os.path.join(modeldir, 'en-us/cmudict-en-us.dict'))
config.set_string('-lm', os.path.join(modeldir, 'en-us/en-us.lm.bin'))
decoder = pocketsphinx.Decoder(config)
# Decode streaming data.
buf = bytes() # Внимание: это работает только в Python 3.
decoder.start_utt()
while True:
buf += stream.read(1024)
if not buf:
break
# This searches for the end-of-utterance marker.
if decoder.process_raw(buf, False, False) == pocketsphinx.Decoder.NO_SEARCH_YET:
continue
else:
# Это is_final=True, когда utterance завершена.
if decoder.hyp().hypstr != '':
print('Utterance:', decoder.hyp().hypstr)
decoder.end_utt()
decoder.start_utt()

В этом примере мы настраиваем декодер, указывая путь к конфигурационным файлам и обученным языковым модулям на английском языке. Затем мы работаем с исходными аудио-данными в режиме потока и выводим результаты. Важно помнить, что библиотека может занимать некоторое время на обработку аудио-данных, и производительность библиотеки может отличаться в зависимости от используемого оборудования.

Вживил чип! Тестируем ЛЮСЮ - первый нейронный ассистент…

Распознавание речи на Python

Преобразование голоса в текст - PYTHON

Простой искусственный интеллект на Python. Распознавание голоса на Python

САМОЕ БЫСТРОЕ РАСПОЗНАВАНИЕ РЕЧИ БЕЗ ИНТЕРНЕТА НА PYTHON

Сравнение систем распознавания голоса. Google vs Yandex vs Vosk vs Sphinx vs WebSpeech

Речь в текст python - Текст в речь в python

BLGPG-BE68456494FD-24-09-20-01

Новые материалы: