{"id":376,"date":"2020-03-08T01:00:33","date_gmt":"2020-03-08T01:00:33","guid":{"rendered":"https:\/\/www.affinite.fr\/index.php\/2020\/03\/08\/comment-des-chercheurs-ont-peut-etre-revolutionne-lentrainement-des-intelligences-artificielles\/"},"modified":"2020-03-08T01:00:33","modified_gmt":"2020-03-08T01:00:33","slug":"comment-des-chercheurs-ont-peut-etre-revolutionne-lentrainement-des-intelligences-artificielles","status":"publish","type":"post","link":"http:\/\/www.affinite.fr\/index.php\/2020\/03\/08\/comment-des-chercheurs-ont-peut-etre-revolutionne-lentrainement-des-intelligences-artificielles\/","title":{"rendered":"Comment des chercheurs ont peut-\u00eatre r\u00e9volutionn\u00e9 l&rsquo;entra\u00eenement des intelligences artificielles"},"content":{"rendered":"<p> [ad_1]<br \/>\n<\/p>\n<div itemprop=\"articleBody\">\n<p>L\u2019\u00e8re de la domination des puces graphiques (GPU) dans l\u2019entra\u00eenement des intelligence artificielle (IA) ne touche peut-\u00eatre pas \u00e0 sa fin, mais les processeurs centraux des ordinateurs (CPU) pourraient revenir dans la course.<br \/>D\u00e9tourn\u00e9s de leur t\u00e2che initiale d\u00e9di\u00e9e aux rendus graphiques, notamment dans les\u00a0jeux vid\u00e9o, les GPU sont utilis\u00e9s depuis une d\u00e9cennie pour acc\u00e9l\u00e9rer les calculs gr\u00e2ce \u00e0 leurs hautes capacit\u00e9s de parall\u00e9lisation. \u00c9clipsant les CPU\u00a0qui ont longtemps r\u00e9gn\u00e9 en ma\u00eetres dans les t\u00e2ches de calculs, les GPU sont d\u00e9sormais rois dans de nombreuses t\u00e2ches comme l\u2019apprentissage profond des IA.<\/p>\n<h3 style=\"color:#333; font-family:arial,helvetica,sans-serif; font-size:23px; font-weight:700\"><strong>SLIDE, intelligence et optimisation pour tirer le meilleur du CPU<\/strong><\/h3>\n<p>Mais la situation pourrait commencer \u00e0 changer \u00e0 la suite de la publication d\u2019un article scientifique qui d\u00e9voile un algorithme de nouvelle g\u00e9n\u00e9ration. Appel\u00e9 <strong>SLIDE <\/strong>pour \u00ab <strong>S<\/strong>ub-<strong>LI<\/strong>near <strong>DE<\/strong>ep learning Engine \u00bb, ou moteur d\u2019apprentissage profond sous-lin\u00e9aire, il s&rsquo;agit d&rsquo;un \u00ab moteur \u00bb de calcul qui m\u00e9lange\u00a0savamment algorithmes aux petits oignons, haute parall\u00e9lisation\u00a0(pour tirer parti de chaque c\u0153ur du CPU) et fines optimisations de charge.<\/p>\n<p>Pour d\u00e9montrer les capacit\u00e9s de leur nouveau moteur de calcul CPU, les chercheurs de l&rsquo;universit\u00e9 de Rice, dans le Texas,\u00a0ont confront\u00e9 le GPU champion de la cat\u00e9gorie \u00ab apprentissage profond \u00bb, \u00e0 savoir le NVIDIA Tesla V100 Volta (2017), \u00e0 deux processeurs <a href=\"https:\/\/ark.intel.com\/content\/www\/us\/en\/ark\/products\/96899\/intel-xeon-processor-e5-2699a-v4-55m-cache-2-40-ghz.html\" target=\"_blank\" rel=\"noopener noreferrer\">Xeon E5-2699A v4<\/a> fonctionnant \u00e0 2.40 GHz (lanc\u00e9s en 2016).<\/p>\n<p>L\u2019astuce tient dans deux \u00e9l\u00e9ments. D\u2019une part, les CPU peuvent avoir acc\u00e8s \u00e0 beaucoup plus de m\u00e9moire que les GPU. Sur ce point, les chercheurs soulignent dans leur article qu\u2019il faut que cet acc\u00e8s m\u00e9moire soit bien g\u00e9r\u00e9 pour ne pas rencontrer de probl\u00e8mes qui ruineraient le fonctionnement de leur solution. Ils pr\u00e9cisent par ailleurs que m\u00eame sans optimisation et avec des probl\u00e8mes, les r\u00e9sultats obtenus sont \u00e9quivalents \u00e0 ceux fournis par une plate-forme reposant sur des GPU&#8230;\u00a0Cette plus grande quantit\u00e9 de RAM est donc bel et bien un\u00a0avantage.<br \/>D&rsquo;autre part, l\u2019autre point fort de cette solution est le caract\u00e8re \u00ab intelligent \u00bb du moteur logiciel. Pour l&rsquo;entra\u00eenement de r\u00e9seaux neuronaux, les GPU utilisent une grande quantit\u00e9 de donn\u00e9es et sollicitent aveugl\u00e9ment tous les types de neurones pour n\u2019importe quel type de calcul.<br \/>Plut\u00f4t que de mobiliser tous les neurones artificiels de mani\u00e8re non sp\u00e9cifique et brutale, le\u00a0moteur SLIDE n\u2019entra\u00eenent que les bons neurones pour la bonne t\u00e2che.<\/p>\n<h3 style=\"color:#333; font-family:arial,helvetica,sans-serif; font-size:23px; font-weight:700\">Un changement total d&rsquo;approche<\/h3>\n<p>C&rsquo;est l\u00e0 que r\u00e9side une partie essentielle du g\u00e9nie de ce projet.\u00a0Pour pouvoir d\u00e9terminer quels neurones sont\u00a0pertinents, les chercheurs ont totalement chang\u00e9 l&rsquo;approche de l&rsquo;entra\u00eenement des r\u00e9seaux neuronaux.<br \/>Comment ? En abandonnant un point fondamental, mais parfois d\u00e9cri\u00e9 de l&rsquo;entra\u00eenement des r\u00e9seaux neuronaux, la <em>back propagation<\/em>\u00a0(ou r\u00e9tropropagation du gradient, en fran\u00e7ais). Autrement dit, pour faire simple, la m\u00e9thode par laquelle les neurones font \u00e9voluer le \u00ab poids \u00bb accord\u00e9s aux r\u00e9sultats pour obtenir la bonne r\u00e9ponse.<br \/>L&rsquo;<em>\u00ab approche fondamentalement diff\u00e9rente \u00bb<\/em> des chercheurs de l&rsquo;universit\u00e9 de Rice consiste \u00e0 entra\u00eener les r\u00e9seaux neuronaux comme s&rsquo;il s&rsquo;agissait d&rsquo;un contexte de recherche, reposant sur des tables de hachage. Cette approche a pour cons\u00e9quence premi\u00e8re\u00a0de r\u00e9duire consid\u00e9rablement les besoins en calcul&#8230; et donc de gagner beaucoup de temps.<\/p>\n<figure class=\"figure text-center\"><img decoding=\"async\" class=\"article-img img-responsive-l\" src=\"https:\/\/img.bfmtv.com\/c\/1200\/479\/098b\/10bbc72b358b6ccc8d42e2ad15ad.jpg\" alt=\"\"\/><figcaption class=\"figure-caption figcaption color-txt-0 title-xs hidden-xs\"\/><\/figure>\n<h3 style=\"color:#333; font-family:arial,helvetica,sans-serif; font-size:23px; font-weight:700\">Quel bilan pour cette exp\u00e9rience\u00a0?<\/h3>\n<p>Gr\u00e2ce \u00e0 cette m\u00e9thode, les deux Xeon se sont montr\u00e9s jusqu\u2019\u00e0 3,5 fois plus performants que le gros NVIDIA Tesla V100 Volta dans le traitement de sets de donn\u00e9es connus des chercheurs tel qu\u2019Amazon-670K. Autrement dit, un m\u00eame entra\u00eenement qui a pris 3h30 avec TensorFlow, un des meilleurs outils d&rsquo;apprentissage du march\u00e9, et une plate-forme \u00e0 base de Tesla V100, n&rsquo;a pris qu&rsquo;une heure, sans GPU, et avec une plate-forme\u00a0CPU de classe Xeon \u00e0 44 coeurs.<\/p>\n<p>S\u2019il est plus facile de rajouter des GPU que des CPU dans un syst\u00e8me pour acc\u00e9l\u00e9rer les performances, les chercheurs soulignent \u00ab <em>qu\u2019il y a encore beaucoup de moyens d\u2019optimiser (le syst\u00e8me). Nous n\u2019avons pas encore utilis\u00e9 les unit\u00e9s vectorielles, ou les acc\u00e9l\u00e9rateurs int\u00e9gr\u00e9s aux CPU tel que le Deep Learning Boost d\u2019Intel.<\/em> \u00bb<br \/>En clair, la marge de progression semble importante. S\u2019ajoute \u00e0 cela un avantage de co\u00fbt : quand <a href=\"https:\/\/www.esus-it.fr\/product-eng-43076-Intel-Xeon-Processor-E5-2690v4-35MB-Cache-14x-2-60GHz-BX80660E52690V4.html\" target=\"_blank\" rel=\"noopener noreferrer\">la paire de Xeon s\u2019affiche \u00e0 5300 \u20ac<\/a> (HT), une seule Tesla V100 co\u00fbte le double. Elle doit en plus \u00eatre int\u00e9gr\u00e9e dans un syst\u00e8me qui int\u00e8gre de toute fa\u00e7on des processeurs professionnels de type Xeon.<\/p>\n<aside class=\"bg-color-0 padding-inside-all-s bloc border-s\">\n<h4 class=\"box-txt-normal\">\n<div class=\"\">\n<p><strong>\u00c0 d\u00e9couvrir aussi en vid\u00e9o<\/strong><\/p>\n<\/div>\n<\/h4>\n<\/aside>\n<p>Vu les besoins de puissance et la faciliter d\u2019ajouter des cartes GPU pour am\u00e9liorer les performances des serveurs et autres fermes de calcul, les processeurs graphiques ont encore de beaux jours devant eux.<br \/>Mais les CPU reviennent clairement dans la course et pourraient prendre l\u2019avantage notamment dans des syst\u00e8mes o\u00f9 le co\u00fbt ou l\u2019espace occup\u00e9 est limit\u00e9, comme le Spaceborne Computer envoy\u00e9 par HPE dans la station spatiale internationale.<\/p>\n<p>D&rsquo;autant que\u00a0Anshumali Shrivastava, l&rsquo;inventeur principal\u00a0\u00e0 la t\u00eate du projet d\u00e9voile un dernier avantage de sa solution :<\/p>\n<blockquote>\n<p><em>\u00ab SLIDE g\u00e8re les donn\u00e9es en parall\u00e8le.<\/em> [&#8230;] <em>J&rsquo;entends par l\u00e0 que si j&rsquo;ai deux instances de donn\u00e9es, par exemple, l&rsquo;une est une image de chat et l&rsquo;autre une image d&rsquo;un bus, elles activeront diff\u00e9rents neurones. SLIDE pourra alors mettre \u00e0 jour ou entra\u00eener ces deux neurones ind\u00e9pendamment.\u00bb<\/em><\/p>\n<\/blockquote>\n<p>Voil\u00e0 peut-\u00eatre bien l&rsquo;utilisation optimis\u00e9e du parall\u00e9lisme que le CPU attendait pour revenir dans la course&#8230;\u00a0<\/p>\n<p><strong>Sources :<\/strong> <a href=\"https:\/\/arxiv.org\/pdf\/1903.03129.pdf\" target=\"_blank\" rel=\"noopener noreferrer\">Arxiv.org<\/a> et <a href=\"https:\/\/news.rice.edu\/2020\/03\/02\/deep-learning-rethink-overcomes-major-obstacle-in-ai-industry\/\" target=\"_blank\" rel=\"noopener noreferrer\">Rice University <\/a>via <a href=\"https:\/\/www.engadget.com\/2020\/03\/03\/rice-university-slide-cpu-gpu-machine-learning\/\" target=\"_blank\" rel=\"noopener noreferrer\">Engadget<\/a><\/p>\n<\/p><\/div>\n<p><script>\n         !function(f,b,e,v,n,t,s){if(f.fbq)return;n=f.fbq=function()\n         {n.callMethod? n.callMethod.apply(n,arguments):n.queue.push(arguments)}\n         ;if(!f._fbq)f._fbq=n;\n             n.push=n;n.loaded=!0;n.version='2.0';n.queue=[];t=b.createElement(e);t.async=!0;\n             t.src=v;s=b.getElementsByTagName(e)[0];s.parentNode.insertBefore(t,s)}(window,\n                 document,'script','https:\/\/connect.facebook.net\/en_US\/fbevents.js');\n         fbq('init', '1065890633454496');\n         fbq('track', 'PageView');\n     <\/script><br \/>\n<br \/>[ad_2]<br \/>\n<br \/><a href=\"https:\/\/www.01net.com\/actualites\/comment-des-chercheurs-ont-peut-etre-revolutionne-l-entrainement-des-intelligences-artificielles-1868952.html\">Source link <\/a><\/p>\n","protected":false},"excerpt":{"rendered":"<p>[ad_1] L\u2019\u00e8re de la domination des puces graphiques (GPU) dans l\u2019entra\u00eenement des intelligence artificielle (IA) ne touche peut-\u00eatre pas \u00e0 &hellip; <a href=\"http:\/\/www.affinite.fr\/index.php\/2020\/03\/08\/comment-des-chercheurs-ont-peut-etre-revolutionne-lentrainement-des-intelligences-artificielles\/\" class=\"more-link\">Plus <span class=\"screen-reader-text\">Comment des chercheurs ont peut-\u00eatre r\u00e9volutionn\u00e9 l&rsquo;entra\u00eenement des intelligences artificielles<\/span> <span class=\"meta-nav\">&rarr;<\/span><\/a><\/p>\n","protected":false},"author":1,"featured_media":377,"comment_status":"open","ping_status":"open","sticky":false,"template":"","format":"standard","meta":{"_sitemap_exclude":false,"_sitemap_priority":"","_sitemap_frequency":"","footnotes":""},"categories":[1],"tags":[],"class_list":["post-376","post","type-post","status-publish","format-standard","has-post-thumbnail","hentry","category-tous"],"_links":{"self":[{"href":"http:\/\/www.affinite.fr\/index.php\/wp-json\/wp\/v2\/posts\/376"}],"collection":[{"href":"http:\/\/www.affinite.fr\/index.php\/wp-json\/wp\/v2\/posts"}],"about":[{"href":"http:\/\/www.affinite.fr\/index.php\/wp-json\/wp\/v2\/types\/post"}],"author":[{"embeddable":true,"href":"http:\/\/www.affinite.fr\/index.php\/wp-json\/wp\/v2\/users\/1"}],"replies":[{"embeddable":true,"href":"http:\/\/www.affinite.fr\/index.php\/wp-json\/wp\/v2\/comments?post=376"}],"version-history":[{"count":0,"href":"http:\/\/www.affinite.fr\/index.php\/wp-json\/wp\/v2\/posts\/376\/revisions"}],"wp:featuredmedia":[{"embeddable":true,"href":"http:\/\/www.affinite.fr\/index.php\/wp-json\/wp\/v2\/media\/377"}],"wp:attachment":[{"href":"http:\/\/www.affinite.fr\/index.php\/wp-json\/wp\/v2\/media?parent=376"}],"wp:term":[{"taxonomy":"category","embeddable":true,"href":"http:\/\/www.affinite.fr\/index.php\/wp-json\/wp\/v2\/categories?post=376"},{"taxonomy":"post_tag","embeddable":true,"href":"http:\/\/www.affinite.fr\/index.php\/wp-json\/wp\/v2\/tags?post=376"}],"curies":[{"name":"wp","href":"https:\/\/api.w.org\/{rel}","templated":true}]}}