France

Orange recrute 01 Ingénieur de recherche – Adaptation au domaine de la localisation de sources par deep learning

Orange recrute 01 Ingénieur de recherche – Adaptation au domaine de la localisation de sources par deep learning, dans le respect de la vie privée F/H

orange

CESSON SEVIGNE,France
Informatiques, Télécommunications

Stage – Ingénieur de recherche – Adaptation au domaine de la localisation de sources par deep learning, dans le respect de la vie privée F/H
Ref : 0030125 | 02 nov. 2020
Date limite de candidature : 30 nov. 2020
3 avenue de Belle Fontaine 35510 CESSON SEVIGNE – France
Votre rôleLes méthodes traditionnelles de localisation souffrent grandement de la présence de bruit et/ou de réverbération. Récemment, les approches par réseaux de neurones profonds (alias « deep neural networks »), bien qu’entraînés sur des données synthétiques, ont montré une grande robustesse à des conditions acoustiques adverses. Pourtant, la précision des modèles dans des conditions acoustiques jamais rencontrées (c’est-à-dire celles trouvées chez l’utilisateur final) est bien inférieure à la performance dans les conditions d’entraînement du modèle.
Dans le but d’améliorer ces performances, les modèles pourraient être réentraînés en rapprochant la distribution de l’ensemble d’entraînement avec la distribution des données du domaine cible, comme cela est souvent proposé dans la littérature de l’adaptation de domaine. Malheureusement, de telles approches ne sont pas faisables dans le contexte considéré ici. D’une part, opter pour un entraînement local à l’appareil de l’utilisateur en lui envoyant de grande quantité de données labéllisées n’est généralement pas possible à cause des contraintes de bande passante et de complexité. D’autre part, renvoyer les données du domaine cible sur le cloud pose des problèmes d’atteinte à la vie privée. Idéalement, le modèle devrait être affiné localement, en utilisant seulement les données du domaine cible.
Ainsi, l’objectif de ce stage est d’investiguer les moyens d’effectuer une adaptation de domaine non-supervisée sans avoir un accès direct aux données d’apprentissage initiales. Pour ce faire, le-la stagiaire exploitera les propriétés intrinsèques des signaux ambisoniques, un format audio beaucoup utilisé pour une représentation fidèle du champ sonore spatial.
Votre profilActuellement en dernière année de diplôme d’ingénieur (et idéalement avec une spécialisation traitement de signal), vous êtes à la recherche d’un stage d’une durée de 6 mois à compter de Janvier 2021.
Vous maîtrisez l’anglais technique.
Vous avez une forte appétence pour le traitement du signal.
Des connaissances dans ces domaines seraient un plus :
Méthodes d’apprentissage par réseaux de neurones.Programmation de réseaux de neurones sous Python (Keras/Tensorflow/PyTorch).Maîtrise du traitement du signal (de préférence : traitement du signal audio).Connaissances en traitement d’antenne.
Le plus de l’offreVous travaillerez au sein de l’équipe de traitement de la parole et du son. Vous serez amené-e à échanger avec les différents membres de l’équipe, experts sur les domaines du traitement audio multicanal, le développement informatique et l’intelligence artificielle liés à l’audio. Vous travaillerez directement avec un doctorant dont la thèse traite de la problématique de localisation de sources.
Vous contribuerez, au sein d’une équipe motivée, à la pointe sur 2 domaines en plein essor : le machine learning et le traitement d’antenne. Vous travaillerez ainsi sur des technologies qui seront de plus en plus utilisées dans le futur. Vous pourrez être amené-e à déposer un ou plusieurs brevets, et à participer à la publication d’articles.
EntitéL’équipe CVA (Content Video Audio) travaille sur les algorithmes de traitement audio, tels que les codecs voix/audio, les algorithmes d’amélioration (réduction du bruit, annulation d’écho, séparation de sources), le son 3D (dont le son binaural) et leur intégration dans les services innovants ainsi que sur les technologies de traitement du signal audio et machine learning : Interface homme-machine, compression, spatialisation sonore, conférence audio 3D, VoD, webradio.
Le rehaussement de parole à l’aide d’antennes de microphones est une étape essentielle pour de nombreuses applications, telle que la communication mains-libres lors d’interaction vocale avec des assistants virtuels. Par exemple, dans le contexte des enceintes connectées, la précision de la reconnaissance vocale est fortement dégradée par les signaux enregistrés en champ lointain. En effet, les effets prononcés de la réverbération et des sources interférentes (les bruits comme la télévision, les enfants, les appareils ménagers) affectent la performance des moteurs de reconnaissance vocale. Le rehaussement de parole à partir d’une antenne de microphones exploite le traitement spatial ou beamforming en focalisant dans la direction de la source souhaitée, tout en atténuant les autres directions. Par conséquent, estimer la direction d’un locuteur (c’est la localisation de sources sonores) est un prérequis pour le réhaussement de paroles par beamforming, et représente une étape importante dans la chaîne de traitement d’une antenne de microphones.
A noter que, au-delà du beamforming, la localisation de sources sonores trouve de nombreuses applications dans les domaines du codage audio, de la robotique, de la surveillance électronique et des sonars entre autres.
ContratStage
Durée du stage : 6 mois
Niveau d’études préparées pendant ce stage : Bac+5POSTULER

Laisser un commentaire