Formulaire de contact

Votre demande a bien été envoyée.

Veuillez saisir votre nom

Merci de saisir une adresse e-mail

Le format de l’e-mail est incorrect

Veuillez saisir le nom de votre société

Veuillez saisir un message

Nom*

Adresse email*

Société*

Objectif de la demande

Objet

Message*

Les données signalées par un astérisque sont indispensables au traitement de votre demande et sont destinées à PRELIGENS et ses sous-traitants. Les autres champs sont facultatifs et permettent à PRELIGENS de personnaliser les communications adressées.
Vos données à caractère personnel sont utilisées par PRELIGENS pour recevoir des communications électroniques dès lors que vous y avez consenti.
Les données collectées sont conservées pour le temps nécessaire au traitement de votre demande et pour une durée maximale de trois (3) ans à compter de la dernière communication à des fins de prospection commerciale.
Vous disposez d’un droit d’accès, de rectification, d’effacement, de retrait de votre consentement à tout moment, et de vous opposer, sans motif, à l’utilisation de vos données à des fins de prospection. Vous pouvez exercer les droits précités en nous contactant par e-mail à l’adresse [email protected].
Pour plus d’informations ou si vous estimez que vos droits ne sont pas respectés, vous pouvez contacter directement l’autorité de contrôle (CNIL) : https://www.cnil.fr/.

L’apprentissage, la clé d’un algorithme performant en toutes conditions.

← Toutes les ressources

27/05/2021 par Preligens

Les images satellites qui sont utilisées à des fins de Défense et de Renseignement sont prises à plus de 600 kilomètres d’altitude. Cela revient à photographier de la tour Eiffel depuis le sommet du Mont Blanc. Leur résolution, leur nombre de pixels et leur taille sont donc très différents des photos que nous prenons avec nos smartphones, ce qui constitue un véritable défi pour le développement d'algorithmes d'apprentissage automatique.

Pour exploiter ce type de données particulières, et atteindre des performances de détection et d'identification inégalées, les données d'entrée sont capitales pour que l'algorithme s'améliore de manière continue, mais au final, il s’agit surtout d’une question d'entraînement.

Dans cet article, nous allons explorer l'importance de l’entraînement pour l'apprentissage automatique et détailler comment nous parvenons à faire fonctionner nos détections même dans les cas les plus difficiles, parfois mieux que l'œil humain.

L'entraînement est la cinquième étape du processus de création des algorithmes. C'est l'étape où les techniques d'IA de pointe sont intégrées dans l'architecture, afin de trouver le modèle le plus performant et d'atteindre des résultats inégalés.

Pour trouver des aiguilles dans les bottes de foin

Lorsqu'on applique l'IA aux cas d'utilisation de la Défense et du Renseignement, chercher des aiguilles dans les bottes de foin est un cas d'usage assez classique. Couvrant des centaines de mètres carrés en une seule prise, les images satellite sont de bons candidats pour surveiller une grande zone en un coup d'œil.

Confrontons l'œil humain et la machine : pouvez-vous repérer le pick-up sur cette image ? Indice : il est situé près d'un arbre.

C'est quasi impossible sans un zoom approprié pour l’oeil humain alors que grâce à notre IA, cet objet d’intérêt a pu être détecté en quelques secondes :

Afin de distinguer le pick up parmi tous les rochers et les arbres, le détecteur de véhicules doit avoir été entraîné sur une variété de paysages.

L'équipe de data scientist de Preligens a développé des solutions avancées d’IA pour transformer le contexte d'une scène. Cela introduit plus de diversité dans les algorithmes d'entraînement et renforce en retour leur généricité. Le transfert de style est l'une de ces approches.

Le transfert de style permet de récupérer le style d'une image pour le restituer à n'importe quelle autre image. Appliqué à la vision par ordinateur, il consiste à modifier les conditions d'arrière-plan d'une image sur laquelle l'algorithme est performant, pour entraîner ce dernier à être aussi performant sur l'image modifiée (par exemple, modifier un arrière-plan végétal en un arrière-plan enneigé - voir l'exemple ci-dessous).

Exemple de transfert de style appliqué à des images satellite : passage d'un décor végétal à un décor enneigé - car les images enneigées sont plus difficiles à trouver.

Ou pour atteindre des performances inégalées sur des cas difficiles.

Lorsque l'on parle de cas difficiles d'analyse d'images satellites, deux situations peuvent se présenter :

un manque de visibilité sur les images, principalement dû aux conditions climatiques
un manque d'exemples disponibles pour entraîner l'IA, en raison de la rareté de l'objet lui-même.

Le niveau de couverture nuageuse est l'un des premiers filtres appliqués lors du téléchargement d'images auprès de nos fournisseurs. En effet, de la même manière que l'œil d'un satellite ne peut pas voir au-delà de la surface de l'eau, il ne peut pas voir à travers le brouillard ou les nuages.

Pourtant, c'est là que l'intelligence artificielle peut surpasser l'œil humain : si elle est correctement entraînée à reconnaître les objets d'intérêt, et notamment dans le cas de mauvaises conditions climatiques, la machine peut alors les repérer même si l'homme ne le peut généralement pas.

La vérité terrain est en vert ici et les prédictions sont représentées par les carrés rouges.

Nos algorithmes de détection révèle des hélicoptères sous des nuages qui auraient pu facilement être manqués par les annotateurs.

Comme indiqué précédemment, les cas difficiles peuvent également être la conséquence d'un manque d'images sur lesquelles s'entraîner, en raison de la rareté de l'objet d'intérêt lui-même.

Il existe des techniques d'augmentation des données pour créer un plus grand nombre d'exemples d'entraînement lorsque très peu d'exemples réels sont disponibles : ces techniques font appel à des transformations aléatoires appliquées à des données réelles, créant ainsi une plus grande diversité d'exemples.

L'équipe de data scientist de Preligens utilise des technologies propriétaires de génération de données basées sur les dernières techniques génératives et 3D pour alimenter les ensembles de données d'entraînement avec des données simulées. Cela leur permet de faire face aux cas d'utilisation les plus rares.

Exemple d'utilisation de la simulation - tous les avions ont été ajoutés manuellement à cette image satellite afin d'enrichir la base de données de formation.

En outre, une troisième technique, appelée apprentissage actif, peut être exploitée pour surmonter les cas particuliers.

L’apprentissage actif est une technique semi-supervisée utilisée pour hiérarchiser les données qui doivent être étiquetées afin d'avoir le plus grand impact pour former un modèle supervisé.

Une fois que nos clients ont constaté l'efficacité de notre application sur des cas d'utilisation générale, ils nous demandent d'identifier des objets plus difficiles à détecter, l'apprentissage actif permettant alors de trouver les quelques images pertinentes sur lesquelles s'entraîner.

Étant donné que toutes les données étiquetées n'apportent pas la même valeur au processus de formation, notre cadre d'IA propriétaire donne la priorité aux images qui maximiseront les résultats de l'entraînement, même pour les objets rarement vus.

L'apprentissage actif présente donc un double avantage : il augmente l'efficacité de l’entraînement et permet à l'IA de Preligens d'être plus économe, puisque Preligens peut se concentrer sur les données qui apportent de la valeur au détecteur et écarter les données sans valeur.

Les zones rouges correspondent aux 'incertitudes' de l'algorithme. Cette image est donc à choisir pour l'entraînement car elle contient des informations précieuses

Conclusion

En un mot, l'intégration de modèles d'apprentissage profond de pointe pour développer des algorithmes d'identification d'objets garantit de grandes performances. Mais pour répondre au niveau d'exigence des clients de la Défense et du Renseignement dans le monde, quelques composants supplémentaires à la pointe de la technologie sont nécessaires.

En fonction des besoins, les data scientists de Preligens choisissent parmi des dizaines de techniques de pointe pour construire les modèles les plus performants, de manière très flexible.

Vous souhaitez en savoir plus sur l'usine d'IA de Preligens et sur la manière dont le processus d’entraînement s'intègre dans notre cadre propriétaire pour développer nos algorithmes ? Consultez notre page dédiée, et contactez-nous pour discuter de nos capacités à l'adresse suivante [email protected]

Références:

Towards Data Science - Active Learning in Machine Learning

Active Learning - an R&D project between DSTL & Preligens

Episode 3, Jules Verne - entre rêves et sagesse

3 questions à Hubert Beroche