Re: Un système en reconnaissance des formes et vision pa...
3
Sinon y a YOLO qui reconnait les éléments d'une image de manière encore plus rapide. On l'utilise notamment pour la reconnaissance vidéo. F-RCNN je pense prend beaucoup de ressource pour une vidéo du coup je me demande quels GPUs ils ont utilisé pour la vidéo en article ...
Voilà le YOLO neural network :
YOLO v2
willouboy
Posté le: 23/11/2017 22:44 Mis à jour: 23/11/2017 22:44
Re: Un système en reconnaissance des formes et vision pa...
0
C'est surtout le fait qu'il reconnaisse la bouteille à 0:47 que je trouve étonnant. Parce que ça a strictement rien d'une bouteille si ce n'est l'étiquette... (je parle de la pub)
Gustavitch
Posté le: 23/11/2017 23:10 Mis à jour: 23/11/2017 23:10
Re: Un système en reconnaissance des formes et vision pa...
1
@kaporalhart C'est pas tout à fait vrai. Ce qui est vrai, c'est que les algorithmes n'ont pas de vue d'ensemble. Par exemple, si tu prends une image toute blanche avec un cercle noir, pour qu'un algo trouve le cercle il faut qu'il parcourt toute l'image en cherchant un cercle. C'est tout l'enjeu des algos de vision, parce que nous notre vision est très forte pour avoir très vite des vues d'ensemble et repérer des formes, alors qu'un algo ne voit que du détail. Donc nous, être humains, on n'a pas trop d'idée pour faire autrement que "Ben... Tu la vois la forme, elle est là". Pourtant il faut trouver autre chose ! La réelle difficulté pour détecter des objets dans une image, c'est donc surtout la performance. Là en réalité, la performance, c'est que ça détecte en temps réel !
user149450
Posté le: 23/11/2017 23:12 Mis à jour: 23/11/2017 23:14
Re: Un système en reconnaissance des formes et vision pa...
3
Citation :
@kaporalhart C'est pas tout à fait vrai. Ce qui est vrai, c'est que les algorithmes n'ont pas de vue d'ensemble. Par exemple, si tu prends une image toute blanche avec un cercle noir, pour qu'un algo trouve le cercle il faut qu'il parcourt toute l'image en cherchant un cercle. C'est tout l'enjeu des algos de vision, parce que nous notre vision est très forte pour avoir très vite des vues d'ensemble et repérer des formes, alors qu'un algo ne voit que du détail. Donc nous, être humains, on n'a pas trop d'idée pour faire autrement que "Ben... Tu la vois la forme, elle est là". Pourtant il faut trouver autre chose ! La réelle difficulté pour détecter des objets dans une image, c'est donc surtout la performance. Là en réalité, la performance, c'est que ça détecte en temps réel !
Mais mec y a aucun algo qui peut être assez compliqué pour la reconnaissance aussi précise. Non ce qui est utilisé c'est un CNN (réseau neuronal de convolution) qui permet dans un premier temps de trouver des formes basiques (lignes etc) dans les premiers couches du réseau, puis des formes (un rond, un angle) enfin dans les couches supérieur le réseau reconnait des choses plus complexes, une tête, un bras etc.
C'est justement ce paradigme (inspiré par une partie du cerveau + système d'actualisation des couches appelé backpropagation) qui ont permis d'aller plus loin que les algos !
Alex333
Posté le: 23/11/2017 23:33 Mis à jour: 23/11/2017 23:33
Re: Un système en reconnaissance des formes et vision pa...
0
@Compteinutile En soit, "algo" c'est flou comme définition, tout ce qui peut être fait sur ordinateur est considéré comme un algorithme (ou même les recettes de cuisine sur papier si tu veux :p). C'est juste que là c'est des algorithmes de deep learning, pas de tâches spécifiques "codé à la main".
Et @kaporalhart a raison, (et en partie toi aussi) : ils utilisent des CNN, mais ils sont obligés de parcourir toute l'image pour placer les boîtes où il faut. L'amélioration des CNN pour détecter les objets avec leurs positions sont les R-CNN (avec toutes les dérivés comme fast R-CNN et YOLO qui améliorent la vitesse pour la proposition des régions d'intérêts).
EDIT: Bon, pour YOLO je suis pas très sûr, je crois qu'ils ont justement réduit le temps de leur algorithme en supprimant complètement la recherche de région d'intérêts par "scan" et utilisent une grille + un autre réseau de neurones. Du coup il gagnent en rapidité mais perdent en précisions et en capacité de détecter plusieurs objets proches (ici, ils n'auraient surement pas pu détecter toutes les personnes dans la foule comme sur la vidéo).
password123
Posté le: 24/11/2017 5:21 Mis à jour: 24/11/2017 5:21
Re: Un système en reconnaissance des formes et vision pa...
0
@Compteinutile Puis vu que j'en suis déjà loin niveau "je ramène ma science" : Citation :
C'est justement ce paradigme ([...] + système d'actualisation des couches appelé backpropagation) qui ont permis d'aller plus loin que les algos !
La backpropagation, c'est juste une descente de gradient "dans l'autre sens" qui permet de gagner énormément de temps par rapport à une descente de gradient plus classique. Aucun changement de paradigme ici, on a les outils pour obtenir les mêmes résultats depuis très, très longtemps .
anykeyh
Posté le: 24/11/2017 5:25 Mis à jour: 24/11/2017 5:25
Re: Un système en reconnaissance des formes et vision pa...
0
La meme chose sur les caméras de surveillance, couplé à de la reconnaissance faciale, on sauve tout ça dans des bases de données... et voilà pas de souci ! La vie privée ? non, pas de souci ne vous en faites pas, on ne garde pas les vidéos. (sous entendu on garde juste leur interprétation)
Daemynion
Posté le: 25/11/2017 17:12 Mis à jour: 25/11/2017 17:15
Re: Un système en reconnaissance des formes et vision pa...
0
@Clayton Je confirme ce que tu as remarqué. Véhicule type Mercedes Vito passe tantôt comme une voiture tantôt comme un bus. Dès que tu passe sur du Sprinter, le programme ne sait pas si c'est une voiture où un camion. Autre défaut, le vendeur parqué avec son camion est d'abord reconnu correctement, puis quand le programme voit les ouvertures à gauche (côté trottoir), il reclassifie le véhicule en "bus".
Même si ça manque de précision, l'exercice réalisé reste assez impressionnant. @stero D'ici une dizaine d'années je pense que la vision du Terminator ne sera plus juste de la science-fiction.
Les commentaires appartiennent à leurs auteurs. Nous ne sommes pas responsables de leur contenu.
Si vous êtes l'auteur d'un élément de ce site, vous pouvez si vous le souhaitez, le modifier ou le supprimer
Merci de me contacter par mail. Déclaré à la CNIL N°1031721.