Quelques semaines sans écrire de news … Car, nous avons eu un départ de feu à la maison (pas de blessés et très de peu de dégats). Et je me suis transformé en nettoyeur de suie, il y en avait partout. Au bout de 4 pièces entièrement reprises, des montagnes de cartons et des heures de ménage, nous en voyons enfin le bout. Et le moral revient 🙂
Au passage, il y a eu un changement de direction dans la solution technique envisagée pour la détection de pics de colère chez les parents. J’étais parti sur une écoute audio basée sur les assistants personnels, mais je me suis heurté au fait que je ne pouvais pas récupérer directement la voix, juste les mots analysés. Et cela que ce soit Amazon ou Google (les deux testés). Du coup, plutôt que d’enchainer sur une deuxième étape de détection des émotions (à base d’IA aussi, comme l’outil Tone Analyzer d’IBM – https://tone-analyzer-demo.ng.bluemix.net/), je suis parti sur un outil embarqué sur un smartphone. Cela règle deux points durs : pas besoin de serveurs distants de mon côté, et surtout pas de transferts de données personnelles. En effet, tout se passe en local et en direct sur le smartphone : du coup il n’y a pas besoin de stocker les échantillons audio.
Tout cela fut possible car 2 librairies open source existent pour analyser les émotions dans la voix. Le premier prototype est basé sur OpenVokaturi et m’a permis d’obtenir enfin un produit testable :
- phase de capture audio
- gestion d’un volume seuil
- analyse des émotions, dont la colère
- notification en cas de pic de colère
J’envisage de refaire la même chose avec OpenSmile pour pouvoir comparer les performances des deux moteurs. Le reste de la chaine de traitement devant rester similaire (enfin, je l’espère).
Sources
- https://tone-analyzer-demo.ng.bluemix.net/
- https://developers.vokaturi.com/getting-started/overview
- https://www.audeering.com/opensmile/
- https://nordicapis.com/20-emotion-recognition-apis-that-will-leave-you-impressed-and-concerned/