<div dir="ltr"><div>Buenas,</div><div><br></div><div>Te contesto sobre el mensaje<br></div><br><div class="gmail_quote"><div dir="ltr" class="gmail_attr">El dom., 7 jul. 2019 a las 1:23, Turriano (<<a href="mailto:turriano@gmail.com">turriano@gmail.com</a>>) escribió:<br></div><blockquote class="gmail_quote" style="margin:0px 0px 0px 0.8ex;border-left:1px solid rgb(204,204,204);padding-left:1ex"><br>
Estoy buscando soluciones para poder meter algunas palabras por audio <br>
("adelante", "atrás", "derecha", "izquierda", "claxon" o "alarma". Por <br>
ejemplo) y cada una de éstas manejen una salida de los gpios.<br>
Mi intención es hacer una varsión de un carrito de la compra eléctrico, <br>
con el que suelo experimentar con varios sistemas de control.<br>
He probado por infrarrojos (por cierto, que no funcionó) :-( y con mejor <br>
éxito mediante rc y con una botonera y cables directamente conectada a <br>
los motores.<br>
Vosotros que sabéis mucho más que yo:<br>
¿Qué librerías o qué sistemas podría usar para esto?<br>
<br></blockquote><div><br></div><div>Siempre que he buscado librerías para hacer eso que tu comentas acabo un poco desesperado. Por ejemplo en este post <a href="https://realpython.com/python-speech-recognition/">https://realpython.com/python-speech-recognition/</a> comentan 7 librerias de las cuales solo pocketsphinx permite reconocer voces sin conectarse a internet. SpeechRecognition es un frontend de este último entre otros. El resto carecen de toda utilidad para hacer cosas de robótica sin conexión a internet (que es lo suyo).</div><div><br></div><div>Mirando pocketsphinx le he visto que tiene como lenguajes ingles, frances, italiano y chino. Español no. También viene con una suite para entrenar idiomas que no me he mirado porque siempre me entra la pereza para hacer lo que quiero hacer, pero tiene pinta de que es lo suyo para tu caso concreto (entrenar un número reducido de hotwords o palabras clave):</div><div><a href="https://cmusphinx.github.io/wiki/tutoriallm/">https://cmusphinx.github.io/wiki/tutoriallm/</a></div><div><br></div><div>En la descripción del paquete SpeechRecognition habla de otra librería que permite trabajar offline:</div><div><a href="https://pypi.org/project/SpeechRecognition/">https://pypi.org/project/SpeechRecognition/</a></div><div><br></div><div>Se trata de snowboy. Y parece* que con esta librería también valdría para lo que quieres. En la documentación incluso vienen ejemplos para hacer cosas con la raspberry pi:</div><div><a href="http://docs.kitt.ai/snowboy/#running-on-raspberry-pi">http://docs.kitt.ai/snowboy/#running-on-raspberry-pi</a></div><div><br></div><div>*Aunque no me queda claro de si puede trabajar con más de una hotword (una para cada dirección del carrito, avance y parada) o solo sabe reconocer el siri, ok google, alexa,... correspondiente.</div><div><br></div><div>Uno de los problemas habituales para poder avanzar en este campo es la ausencia de bancos de datos públicos con los que trabajar. Hay una iniciativa de mozilla para solucionar esto, así que ¡guay si salen de esta lista colaboradores! y ¡más aún si salen colaboradoras!<br></div><div><a href="https://voice.mozilla.org/">https://voice.mozilla.org/</a></div><div> </div><blockquote class="gmail_quote" style="margin:0px 0px 0px 0.8ex;border-left:1px solid rgb(204,204,204);padding-left:1ex">
Otros sistema que había pensado (aunque por ahora preferiría usar el <br>
primero que he comentado, que me detecte desde ambos lados del carrito, <br>
esquinas derecha e izquierda) y que cuando yo gire, una de las esquinas <br>
deje de detectarme y pare el motor contrario, obligando al carrito a <br>
girar (pues funciona con dos motores y gira parando uno de ellos).<br></blockquote><div><br></div><div>Que te detecte a ti va a ser mucho más fácil que el reconocimiento de voz, pero que no detecte a troyano igual no es tan fácil :-)<br></div><div> </div><div>Un saludo,</div><div><br></div><div>Javi<br></div></div></div>