Et l’intelligence artificielle (IA) avec Python ?…
Premier malentendu : l’intelligence artificielle au sens strict de l’intelligence qui induit la conscience n’existe pas, un ordinateur n’a pas d’état d’âme , pas de sentiments, ce n’est pas un être, c’est une machine !
L’IA est une discipline scientifique basée sur des concepts très complexes (vieux parfois de 40 ans) relatifs à l’étude des probabilités par comparaison et traitement d’une foule de données par des méthodes dites ‘neuronales’, c’est à dire ‘singeant’ le fonctionnement du cerveau humain, que les médias transforment en terreau propice à la culture de tous les fantasmes.
L’ordinateur ne fait qu’exécuter le programme que les humains lui ont construit, le bon terme serait à mon avis ‘hyper programmation’ ou ‘hypercode’ … ils nous ont fait le coup pour le téléphone MOBILE nommé à tort PORTABLE, d’ailleurs les opérateurs utilisent le mot MOBILE dans leur communication et non ‘portable’ car un portable est un téléphone fixe dont le combiné détachable de sa base a une portée limitée à une dizaine de mètres en appartement .
Selon la complexité ou le finesse de résultat recherché, tout programme informatique contient donc plus ou moins de’ l’hypercode’.
Le traitement des données par organisation neuronale est exploité par l’informatique notamment pour effectuer des sondages d’opinion, des opérations boursières, aide à la création des diagnostics médicaux sur des sujets complexes (cancérologie… ), l’automatisation de systèmes (robots industriels, robots de service …) ou les prévisions météorologiques… avec un indice de confiance exprimé en %, ce qui confirme qu’il ne s’agit que de prédictions plus ou moins justes !.
Il faut distinguer l’automatisation des tâches répétitives qui relèvent d’un CODE ordinaire et celle prenant en compte l’environnement (déplacements, respect de limites…) faisant appel a des techniques plus élaborées de type conditionnel avec traitement des résultats par filtrage et analyses successives en cascade (hypercode).
Le principe de fonctionnement en mode neuronal consiste à puiser un grand nombre d’informations stockées dans des bases de données et à les traiter dans des assemblages d’unités de calcul groupées en série et/ou parallèle qui vont utiliser des algorithmes mathématiques si complexes que dans certains cas on est incapable de justifier le résultat obtenu… c’est l’incertitude des sondages d’opinion par exemple où l’on ‘oblige’ l’ordinateur à donner une réponse contenue dans une ‘fourchette’, c.a.d une valeur non vérifiable mais qui parait plausible !
Mon chat détectait à une distance de huit mètres, derrière la porte d’entrée de l’immeuble, que j’actionnais la serrure de la porte intérieure de mon appartement… un ordinateur nécessiterait un ‘apprentissage’ de dizaines d’exercices d’enregistrement et reconnaissance des sons pour parvenir à lui faire distinguer ce bruit dans une fourchette de 20 à 30 décibels, soit un taux d’échec de 70%… car l’intensité du bruit et sa fréquence varient selon la vitesse et la force exercée sur la serrure par le mouvement de la clé !, la ‘plage’ de réception auditive du chat est donc beaucoup plus vaste et sans commune mesure avec les facultés auditives programmables de l’ordinateur > miaou !.
C’est tout le problème de la reconnaissance d’image (faciale ou d’objet) :
En informatique, une image est supportée par une grille imaginaire formée de colonnes et lignes (cadre rectangulaire) , chaque intersection contenant un pixel (bit) et chaque groupe de huit pixels contenant un ‘paquet’ numérique composé de huit 0 et/ou 1 (octet), cet ensemble d’octets représente un point des diverses nuances de couleur qui forment l’image, rappel : la couleur n’existe pas, c’est la répétition des impulsions électriques qui excitent le cerveau par l’intermédiaire de l’oeil (nerf optique) traduisant ces impulsions en formes colorées. Sans un générateur d’impulsions électriques activant des diodes electro luminescentes (écran reproduisant le cadre) il n’y a pas d’image sur un écran.
Idem pour le son, ce sont des impulsions électriques qui actionnent par l’intermédiaire d’un electro-aimant, la membrane souple du haut parleur… qui produit une variation de pression sur l’air environnant… qui produit une vibration du tympan… qui envoie un signal électrique au cerveau… qui contrôle la résonance dans la boite crânienne.
On obtient l’effet inverse avec un microphone : l’air expulsé par la bouche exerce une pression sur la membrane souple du micro… qui fait varier l’intensité du courant électrique généré par un ensemble d’éléments électroniques qui ‘découpent‘ les signaux reçus en forme de créneaux dont la hauteur représente l’intensité (la puissance), et la longueur représente la durée dans le temps (base du solfège).
Lorsqu’on demande à l’ordinateur d’analyser (de lire) la composition d’une image, la première information qu’il nous donne est la taille de l’image (en fait le nombre de pixels contenus dans ce cadre) et il peut nous donner aussi le nombre de pixels révélant à nos yeux les ‘couleurs’ rouge, vert et bleu dans chacune de leur nuance (du plus foncé au plus clair) .C’est en exploitant ces informations que l’on peut modifier des images.
Pour ‘dresser’ un ordinateur à ‘reconnaître’ une image il faut d’abord la lui montrer à l’aide d’un scanner, on lui demande de copier cette image, il va le faire à l’identique, au pixel près et pourra ainsi dire à coup sûr qu’il la reconnait si on la lui représente parce qu’elle est IDENTIQUE, jusque là c’est facile, mais si une quelconque altération existe dans une image similaire elle est ‘non identique‘ et c’est ce que l’ordinateur va répondre !
Si l’on prend l’exemple de la reconnaissance d’un panneau de signalisation routière tagué ou seulement mouillé par la pluie, le réponse sera catastrophique car l’ordinateur ne reconnaîtra pas cette image puisqu’il ne l’a jamais ‘vue’ !, et même si on le ‘dresse’ à reconnaître un panneau mouillé ou tagué il ne sera jamais ‘identique’ à celui qui se trouve sur la route ce jour là, ors même un enfant donnerait la bonne réponse grâce à un calcul rapide de similitude, ce qui impliquerait l’envoi de centaines voire des milliers d’images à l’ordinateur de bord en quelques fractions de secondes en espérant une reconnaissance correcte dans le flot d’images présentées et durant un laps de temps proportionné à la vitesse de déplacement du véhicule…
Voilà une limite toute simple et évidente qui nous éloigne à jamais des ordinateurs intelligents, le système informatique actuel est verrouillé par son ‘quadrillage’ et son mode binaire (0/1).
Cela nous amène à la fameuse ‘5G’ dont on nous promet des applications extraordinaires et notamment la conduite automatique des véhicules .Il s’agit de la cinquième génération de transmission radio électrique (en 20 ans !), l’espoir fait vivre mais ce rêve tient plus de l’utopie que du simple bon sens (rappel : la voie ferrée).
Il est bon de rappeler que les transmissions téléphoniques aux MOBILES s’effectuent dans des câbles en fibre optique sous forme de signaux lumineux et par voie hertzienne sous forme de signaux radio-électriques sur la dernière partie du parcours (du relais de retransmission vers le mobile) ors cette partie est extrêmement sensible aux attaques malveillantes (piratage, prise de contrôle par dénaturation des signaux) et que la seule protection de cette partie vulnérable est assurée par le cryptage des signaux qui ont pour inconvénient majeur l’augmentation du volume des données et constituent donc un facteur de ralentissement des transferts… que l’on a tenté de compenser en augmentant les performances afin de pouvoir correctement sécuriser les données qui vont ralentir…. tiens voilà une autre limite qui l’eut cru ???.00000