Комментарии:
Axaxa Бойцовский Клуб, а ИИ хороша прям с козырей зашла😅
Ответитьа как поделючить чат к старому асистенту крендель?
ОтветитьШикардос, спасибо!
Ответитьнемогу код на озвучку в програме без ошибки но кодга пишу чтобы проверить пишу слово привет и запускаю код тишина и все, что делать
Ответитья не понимаю как установить силеро модель? подскажите что находиться в папке силеро модель?
Ответитьпочему у меня при попытке запустить код голос запускается через 15 сек
Ответитьбудут ли какие то обновления или ваш проект заброшен?
ОтветитьОтзыв о проекте после его реализации
Автор этого отзыва - программист PHP и JS, знакомство с Python - на уровне начинающего, но не с нуля:)
Итак, можно сказать, что именно этот проект, который я увидел летом прошлого года, подвиг меня к изучению Python.
После трехмесячного интенсивного изучения языка, я решил, что уже созрел для его реализации.
Однако все время находились причины, которые мешали началу работы над этим проектом.
И только в новогодние каникулы я создал себе виртуального ассистента.
По горячим следам хочу описать свои впечатления от разработки. Перед тем, как начать программную реализацию
я познакомился с библиотекам, используемыми в проекте и примерами иъ реализации на сайте разработчиков
и повторил многие из них, детально документированные. Когда же я приступил к программированию ассистента, то не
встретил никаких сложностей, так как код проекта содержит с незначительными изменениями те примеры которые приведены
на сайтах разработчиков библиотек. И это очень хорошо, потому что гарантирует работоспособность кода.
Мой первый вариант был точной копией авторского кода, но заработал не сразу, так как Windows уорно не хотела передавать
микрофон и динамик моему проекту, выдавая ошибку 9999. Но это я победил, зайдя в настройки конфиденциальности.
И проект заработал точно так как задумал автор. Но никакого толка от использования таких монстров, как scikit_learn
и torch я не увидел. Как бы вы не писали запросы о погоде, ключевое слово "погода" должно там присутствовать.
Поэтому scikit_learn была отправлена на отдых в ожидании более сложных проектов, а необходимые в повседневной работе
за компьютером ключевые слова, были собраны в массив, где находились и сами слова и комментарии ассистента и действия которые
нужно было выполнить. Всего таких командных слов набралось 18, они были связаны с открытием редакторов кода, запуске локального сервера
открытием фотошопа и корела, мессенджеров, включение плейера и так далее. Получилось весьма компактно.
То же произошло с torch и selero. Selero глючит на длинных текстах, работает медленно.
Поэтому был оставлен pyttsx3, поскольку у меня в windows установлен достаточно приятный голос. Работает мгновенно, читает тексты неограниченной длины.
Но у него есть особенность. Начав чтение, pyttsx3 не остановится, пока не дочитает до конца. Поиск средств в Инете не дал результатов.
В дополнение был отправлен на отдых sounddevice. У меня он отпадал по неизвестной причине? Переустановка с префиксом --upgrade не помогла.
Вместо него была использована последняя версия pyaudio, работающая стабильно.
Связь с ChatGPT работает стабильно, но и тут есть один нюанс. Учитывая что распознавание малой модели vosk оставляет желать лучшего, очень легко отправить
ChatGPT словесную "кашу" вместо запроса ну и получить соответствующий ответ.
Поэтому виджет был дополнен текстовым полем Entry куда помещался запрос к ChatGPT и кнопкой, при нажатии на которую запрос отправлялся.
В этом поле текст запроса можно было отредактировать, или увидев "галиматью" создать новый запрос. При этом если вы хотите задать не абстрактный
запрос о декораторе, а конкретный вопрос о какой-либо фиче, лучше ручками вбить текст в это поле.
Идем дальше. Если микрофон и динамик расположены в корпусе компьютера, то ответ ChatGPT, который может быть достаточно объемным начинает преобразовываться микрофоном в текст, что не есть хорошо. Поэтому я ввел задержку, блокирующую микрофон на максимальное время ответа ChatGPT, составляющую около 30 сек.
Это не мало, в случае короткого ответа ChatGPT, но и не так много, можно не спеша обдумать следующий вопрос.
В виджете я заменил картинки на стандартны кнопочки ttk, и добавил изменение цвета в зависимости от ситуации, например при блокировке микрофона соответствующая кнопка
имела красный фон.
Итак друзья, я поделился своим опытом реализации данного проекта.
Внесенные изменения отражают мои личные пристрастия и никак не уменьшают достоинства автора, который не только сделал хорошую работу, но и сумел доходчиво о ней рассказать
Отправь этот текст, Крендель!
А можно такое прикрутить к GIGA CHAT
ОтветитьПривет. Увидел твои наработки только сейчас, а своего голосового помощника написал чуть раньше. В целом почти всё, что тобой озвучено я уже проходил, но есть вопрос, у меня используется библиотека pyaudio, в твоем случае sounddevice, не пробовал ли ты собирать готовый проект в .exe? Дело в том, что с упаковкой pyaudio у меня возникла проблема, она упорно не хочет в него залазить, хотя такая проблема не только у меня, есть одно или два упоминания в интернете, как её запихать в сборку. Соответственно, на тех ПК, где установлен Python, упакованный пакет .exe работает, на тех ПК, где нет Python'а получаю ошибку. Не возникнет ли подобная проблема с библиотекой SounndDevice? Не хочется все перелопачивать впустую.
ОтветитьБлагодарю! Пишу своего ассистента (Джессика), очень помогают некоторый фишки из твоих проектов!
ОтветитьДобрый день. у меня при запуске требует api ключ. хотя я в конфиге его вставил. не могу понять почему так
ОтветитьСупер! На мобилке это можно?
Ответитьзапустил програму вроде все норм но она молчит ничего не происходит
ОтветитьПривет, можешь подсказать, как добавить возможность голосовых поисковых запросов
ОтветитьБлагодарствую, было бы интересно видеть еще больше подобных роликов с подобными технологиями в вашем исполнении. Хотелось бы увидеть третью версию вашего проекта, приятно что вы довольно хорошо и понятно объясняете так, а не по другому и с возникшеми трудностями и их решениями. Удачи в ваших начинаниях.
Ответитьпривет можешь со мной связаться есть пара вопросов по поводу функционала асистента
ОтветитьНе могу понять, настроил все топ. Все запускается гуи работает, микро работает, модули работают, библиотеки установлены...,но когда говоришь что угодно, ничего не происходит...
ОтветитьЯ НИЧЕГО НЕ ПОНИМАЮ!!! У МЕНЯ НИЧЕГО НЕ РАБОТАЕТ!!!
ОтветитьПравильно ли я понимаю, что с помощью python и такой методы делают моды, например как на Skyrim (на канале @iamcrysty)? Просто и нуб в питоне, и модинге. Или это невозможно сделать и там просто монтаж?
ОтветитьМожно ли эти библиотеки использовать локально. Очень часто надолго падает интернет?
ОтветитьПривет, запиши пожалуйста видос, как этому ассистенту внедрить собственную модель голоса
Ответитькак дать возможность ассистенту что бы по какой либо голосовой команде открывать браузер или какой либо сайт?
ОтветитьРеально ли замутить приложение на телефон где жжп говорит и понимает на нескольких языках .в общем типа алисы но мозги жжп и спец для изучения языков. И говорит и понимает одновременно пару языков на выбор. Чтобы типа включить функцию .авто. и больше ничего не нажимая понеслась. Здаров.здаров.давай поговорим по английски.давай.ток давай попроще .ок.hi.hi.how are you? Нипонял.я спросил как дела.а теперь понял i am fine.
В общем типо того.чтобы он попрвлял твой английский.говорил примеры и тд. Я уже весь интернет перерыл ненашёл . Вопрос . Это технически уже возможно? Или нужно ещё пару лет подождать?
👍🔥
ОтветитьНичего не понятно, но очень интересно. Сколько бьюсь никак не могу Настроитьуже столько видео пересмотрел. То какие-то ошибки выдаёт то ещё что-то. Когда уже эти технологии доведут до ума. Я понимаю интересно посмотреть, как это всё работает, но, где бы найти Готовое решение. Что-то типа Laitis Но с возможностью работы оффлайн и до обучения. Или Старые добрые exe файлы уже ушли в прошлое И теперь как и раньше необходимо всё прописывать ручками в консоли или терминале. Поразительно с одной стороны я сейчас говорю эти строки А с другой зерокодинг ещё очень далеко.
ОтветитьЯ не пойму, зачем pyttsx и gtts. Неужели нельзя подключить нормальную голосовую модель которой плевать на язык?
+ Ты не указал немало важный факт - это лимиты API Openai. Там вообще понты даются, и если вот так поиграться активно пару дней, то лимит закончиться.
Привет!
А что если присоединить к ассистенту возможность управления умным домом?
Какие вообще для этого существуют библиотеки?
Круто)
Ответитьпривет Учитл изў узбекистан
ОтветитьМожно для натуральности научить ассистента распознавать слова вопросительных предложений чтобы отвечать на вопрос не команда не распознана, а более человечно.
Например " Я не знаю что ответить", или
"Не знаю"...
Классный проект.
ОтветитьМожно чтобы женские имена не использовали ослова с окончагиями в мужском роде?
А мужские имена не использовали женкий род?
Можно записать свой голос для библиотеки?
ОтветитьКак всегда Круто 😎
ОтветитьВозможно ли заказать у вас подобную программу с "небольшими " дополнениями
ОтветитьКак Всегда ахрененно
ОтветитьОна как под хмурым 😂😂😂
ОтветитьРеализация интересная. Пытаюсь сделать что то похожее. Сейчас в поисках того как обучить голосовую модель на своих данных, что бы использовать ее в последствии. Если кто то знает такие проекты, подскажите пожалуйста
ОтветитьПодскажите пожалуйста вы изучили пайтон с помощью курсов или сами ?
ОтветитьВот это я понимаю хороший программист
ОтветитьКруто! А можно ей как-то увеличить скорость речи, что бы её разговор воспринимался более естественно?
ОтветитьОтлично
ОтветитьПро окна и рассвет анекдот отличный 😂
ОтветитьКак всегда - крутяк!!! 👍
Ответить