PCCar.ru - Ваш автомобильный компьютер

PCCar.ru - Ваш автомобильный компьютер (http://pccar.ru/index.php)
-   iCarDS (http://pccar.ru/forumdisplay.php?f=121)
-   -   iCarVoiceCommander - управляем икаром голосом (http://pccar.ru/showthread.php?t=19766)

sirota 01.04.2015 12:46

Цитата:

Сообщение от Tygra (Сообщение 324750)
По мне штука интересная, но бесполезная из-за не стабильного распознавания речи, сильно зависит от "погоды на марсе". То работает, то не работает. Есть определенные пороги срабатывания, логика глупая, он не слушает все время, он ждет некий "порог" срабатывания по шуму, как сработает в захваченной звуковой дорожке ищет "знакомые" слова. Если все время шум или музыка, то реально поймать момент срабатывания не возможно и начинает работать сильно через раз. Если уровни шума согласовать с порогом срабатывания и подключить не плохой микрофон, то работает хорошо, но на практике в машине ничерта не работает. + (как я понял) не возможно передавать адреса навигатору т.е. не получится голосом набрать нужный адрес.

Да все по делу написал...думаю вся проблема в наших допотопных микрофонах.
Вот если поставить правильный микрофон, то думаю проблема изменится в корне в лучшею сторону.

Цитата:

+ (как я понял) не возможно передавать адреса навигатору т.е. не получится голосом набрать нужный адрес
Как не получается?

Я только и голосом набираю адрес в яндекс навигаторе.

gorlanovmax 01.04.2015 12:53

Цитата:

Сообщение от sirota (Сообщение 324751)
Да все по делу написал...думаю вся проблема в наших допотопных микрофонах.
Вот если поставить правильный микрофон, то думаю проблема изменится в корне в лучшею сторону.



Как не получается?

Я только и голосом набираю адрес в яндекс навигаторе.

Он пишет про передачу данных во встроенную навигашку, которая не поддерживает голосовой поиск (например СитиГид, о котором я и писал)

Tygra 01.04.2015 13:03

Цитата:

Сообщение от sirota (Сообщение 324751)
Да все по делу написал...думаю вся проблема в наших допотопных микрофонах.
Вот если поставить правильный микрофон, то думаю проблема изменится в корне в лучшею сторону.

Я пробовал простые десктопные говняненькие микрофоны, пробовал не плохой микрофон от скайп телефона с ситемой ару, так же отдельно самим собранный микрофонный усил с компрессором, ограничителем и фильтром на голос, который значительно повышает "читаемость" речи. Но разницы особой нет из-за логики работы распознавания. Даже в гугл взяли за порог "ок гугл" после которого идет команда. Здесь же или делать кнопку или глушить звук, просить всех замолчать и только потом "командовать", что согласитесь глупо. Я так понимаю что логику работы изменить будет не возможно т.к. это штатные средства распознавания майкрософт, естественно с закрытой системой.
P\S Кнопку можно сделать на отключение входа на "командный" микрофон. Т.е. на кнопку нажал "mute" со входа микрофона снялся, отпустил, снова в блоке. Косяк в этом в том что будут траблы с блютуз солейлом. Или использовать два микрофона, один в стандартный порт, второй через линейный вход. не знаю правда как потом разделить в винде что кому слушать, думаю что без второй звуковой карты никак.

Bersenev 08.04.2015 07:28

Цитата:

Сообщение от gorlanovmax (Сообщение 324748)
1. У меня с компа не выводится музыка, работает штатная аудиосистема. Как будет себя вести при этом микрофон? Звуковая карта же не сможет отфильтровывать музыку и слова идущие из аудиосистемы.

А что мешает попробовать? Подключаешь микрофон и смотришь как работает.

Цитата:

Сообщение от gorlanovmax (Сообщение 324748)
2. Вроде предложения были, но реализации не нашел: Сделать запуск голосового управления на определенное время с внешней кнопки в машине. Тем самым можно не заклеивать рот пассажирам:zipped:

http://www.pccar.ru/showpost.php?p=279064&postcount=280

Цитата:

Сообщение от gorlanovmax (Сообщение 324748)
3. Я ОЧЕНЬ часто пользуюсь СитиГидом (рекламировать не буду, но для Питера считаю его лучшим). Управление сдвигом карты и масштабом это конечно хорошо, но необходимо управление поиском места назначения, выбором точки из избранного. Карту пальцем двигаю может раз в месяц, может реже. Возможно ли это реализовать?

Используемая технология не позволяет этого делать. Точнее сделать можно, но для этого надо задать грамматику содержащую базу всех возможных адресов, а это как понимаешь не реально.

Bersenev 08.04.2015 07:39

Цитата:

Сообщение от Tygra (Сообщение 324750)
По мне штука интересная, но бесполезная из-за не стабильного распознавания речи, сильно зависит от "погоды на марсе". То работает, то не работает. Есть определенные пороги срабатывания, логика глупая, он не слушает все время, он ждет некий "порог" срабатывания по шуму, как сработает в захваченной звуковой дорожке ищет "знакомые" слова. Если все время шум или музыка, то реально поймать момент срабатывания не возможно и начинает работать сильно через раз. Если уровни шума согласовать с порогом срабатывания и подключить не плохой микрофон, то работает хорошо, но на практике в машине ничерта не работает. + (как я понял) не возможно передавать адреса навигатору т.е. не получится голосом набрать нужный адрес.

Все зависит от конкретной системы, а точнее от связки микрофон+звуковая карта. Я уже описывал это. Лично у меня работает даже на самой максимальной громкости, я даже не слышу свой голос. При этом использую самый дешевый микрофон за 100р и встроенную звуковую карту. Хуже всего распознавание работает при открытых окнах на скоростях выше 80 км/ч, вот здесь никакие фильтрации не помогают

Bersenev 08.04.2015 07:48

Цитата:

Сообщение от Tygra (Сообщение 324754)
Даже в гугл взяли за порог "ок гугл" после которого идет команда.

"ок гугл" это обычная команда-триггер, как настраивать команды-триггеры я описывал. Также можешь сделать чтобы команды всегда выполнялись только после "ок гугл" , при первом варианте после команды
"ок гугл" система переходит в режим ожидания команды, то есть это две отдельные команды , а при втором варианте это одна команда
"ок гугл команда". Для этого надо поправит файл грамматики iCarDSVoiceCommander.xml

Tygra 08.04.2015 08:09

Я не говорю что оно совсем не работает, я говорю что работает плохо. Нужно "попасть" в начало срабатывания порога иначе не распознает нифига, я долго экспериментировал. Четкого срабатывания, хотя бы со второго разу, не удалось добиться. Если все время менять громкость музыки так вообще процент "попаданий" стремиться к нулю.
P\S Опишите нужные требования к сигналу, просто выражение "микрофон+звуковая карта" совершенно не описывает технические характеристики и не возможно "заточить" сигнал под нужные параметры. При помощи внешнего микрофонного усилителя, подключенного к линейному входу звучки можно "выправить" под нужную форму любой кривой микрофон, но нужно знать что требуется. Стандартный диапазон для связи до 3кгц работает не очень. Согласитесь что не вариант подбирать связку "микрофон+звуковая карта" методом тупого перебора микрофонов и звуковых карт.

Bersenev 08.04.2015 08:47

Цитата:

Сообщение от Tygra (Сообщение 325293)
P\S Опишите нужные требования к сигналу, просто выражение "микрофон+звуковая карта" совершенно не описывает технические характеристики и не возможно "заточить" сигнал под нужные параметры. При помощи внешнего микрофонного усилителя, подключенного к линейному входу звучки можно "выправить" под нужную форму любой кривой микрофон, но нужно знать что требуется. Стандартный диапазон для связи до 3кгц работает не очень. Согласитесь что не вариант подбирать связку "микрофон+звуковая карта" методом тупого перебора микрофонов и звуковых карт.

Никаких требований к сигналу нет, система полностью закрытая, все что можно делать, это задавать свою грамматику и получать результаты распознавания, других настроек в этой системе нет. Из практики могу сказать, что лучшие результаты получаются с самыми дешёвыми микрофонами, подключенными к той же звуковой карте, через которую воспроизводится музыка, с включенными режимами шумоподавления и подавления эха. Так же желательно выбрать разрядность и частоту дискретизации микрофона пониже. Ещё большую роль играет место размещения микрофона в салоне, причём не столько по отношению к говорящему, сколько по отношению к внешним шумам. У меня понимает команды и с пассажирского места и с задних сидений, сам микрофон размещён на торпеде руля, но лучше всего вёл себя на козырьке, но тянуть туда микрофон было лень.

Tygra 08.04.2015 08:56

Ммм проверялось на встроенной звучке ( играется музыка на отдельной карте). При громкой музыке, хоть что делай срабатываний ноль. Даже если в микрофон в упор говорить. Так понимаю громкую музыку тоже можно отнести к шумам : ). Собственно внешним усилом и так сигнал был обрезан до плохого микрофона т.е. настроен на максимальную разборчивость речи, помогло как то не очень.

gorlanovmax 08.04.2015 11:54

Цитата:

Сообщение от Bersenev (Сообщение 325290)
А что мешает попробовать? Подключаешь микрофон и смотришь как работает.



http://www.pccar.ru/showpost.php?p=279064&postcount=280



Используемая технология не позволяет этого делать. Точнее сделать можно, но для этого надо задать грамматику содержащую базу всех возможных адресов, а это как понимаешь не реально.

А если у меня есть 5-6 часто используемых адресов?
Которые забиты в избранном.
Могу я как-то их настроить?


Часовой пояс GMT +4, время: 19:47.

Работает на vBulletin® версия 3.8.4.
Copyright ©2000 - 2024, Jelsoft Enterprises Ltd.
Перевод: zCarot