Wiki Root66

Le Wiki de Root66, tuto, infos et astuces

Outils pour utilisateurs

Outils du site


linux_en_2007_-_1400_distributions

Généralités

La planète compte environ 1400 distributions, ayant dépassé le stade du projet et proposé au moins une version au téléchargement.

Sur ces 1400 distributions :

  • 780 environ (56%) peuvent être considérées comme actives (dernière mise à jour postérieure à la date arbitrairement choisie du 1er janvier 2004, site accessible, non officiellement interrompue). Ce chiffre est beaucoup plus élevé que ce que la rumeur publique laissait entendre et dénote un dynamisme de la communauté très réel.
  • 9% des noms de la liste sont des alias au sens large, acronymes, renoms, fusions ou variantes d'une autre distribution.
  • 26% sont réputées interrompues (officiellement, ou site inaccessible).
  • 7% sont classées sans nouvelles (site ou ftp disponible mais aucune mise à jour de moins de 4 ans).
  • Le reste, soit 3%, est de statut indéterminé: mentionnées sur des listes anciennes, aucune recherche n'a permis de savoir si elles ont dépassé le stade du projet ou même si elles ont jamais existé.

On peut donc, en regroupant toutes ces dernières catégories, estimer que 35% des distributions sont inactives.

Le degré d'activité est variable, mais variable aussi est la politique de communication. Certaines distributions font parvenir un communiqué à Distrowatch pour chaque virgule modifiée dans un script, d'autres n'attachent aucune importance à la communication au point de ne même pas annoncer les mises à jour majeures. Peut-être même fuient-elles la publicité, squattant un serveur ftp qu'elles ne souhaitent pas mettre à genoux. Il n'est donc pas sûr que des données plus complètes augmenteraient le nombre des distributions inactives.

L'écrasante majorité de ces distributions repose sur un noyau Linux. Un tout petit nombre (30) repose sur un système BSD ou Solaris. Cette domination ne sera certainement pas remise en cause dans un proche avenir. La plate-forme de référence est x86, ce qui n'est pas une surprise. Même les processeurs 64 bits (AMD ou Intel) n'ont pas réussi à faire une forte percée, dépassant à peine le nombre de distributions non-Linux (51).

Bien que les DVD inscriptibles soient devenus largement disponibles, la course au gigantisme n'est pas de mise, au contraire. Beaucoup de distributions se vantent de leur petite empreinte sur le disque et de leur petite taille au téléchargement. Environ 220 distributions actives se situent en deçà du seuil du demi-CD, 240 se limitent au classique cd, une grosse cinquantaine remplissent un dvd moyen et 28 dépassent ce seuil. De celles-ci, seules 8 sont vraiment exhaustives. La charge de travail correspondant au maintien d'un tel dépôt de paquetages ne peut être en effet supportée que par une entreprise ou une organisation importante. La structure arborescente de l'ensemble rend de plus ce gaspillage de ressources inutile.

Article rédigé par Gilles; version initiale : 21/01/2007.

Le système de paquetage

Une distribution est caractérisée par son système de paquetage (ou par l'absence de celui-ci). A ma connaissance, 12 systèmes de paquetage se disputent le marché, dont 3 systèmes majeurs RPM, Debian et TGZ :

  • RPM est utilisé par Redhat, OpenSUSE, Fedora, Mandriva, environ 140 distributions actives, soit 17% des actives.
  • Debian est utilisé par… Debian, Ubuntu, Knoppix, environ 300 distributions actives, soit 37% du marché.
  • TGZ (je regroupe ici tgz, tar.gz, tar.bz2) est utilisé par Slackware, Arch, une centaine de distributions, soit 13%.

23% des distributions actives n'ont aucun système de paquetage connu. Il faut ajouter à ces trois principaux le système de gestion de Gentoo, portage, utilisé par une quarantaine de distributions.

Si on compare les parts respectives calculées sur les distributions actives à celles calculées sur toute la base, on constate que la part de RPM est grignotée, par Debian principalement. Elle passe de 19% (de la liste totale) à 17% (des actives) alors que celle de Debian passe de 30% à 37%. Celle de TGZ augmente légèrement, de 10% à 13%.

Le “taux de mortalité” est de 21% chez Debian, 34% chez RPM, 15% pour TGZ, et seulement 2% pour portage, paradoxalement le plus difficile à mettre en oeuvre des quatre. Les taux de survie respectifs sont de 73%, 53%, 75% et 86% (la différence est imputable aux alias). Les utilisateurs de Gentoo seraient ils plus, comment dire… endurants?

L'évolution d'une distribution réalisée directement à partir des sources est sans nul doute la plus difficile à réaliser: le taux de mortalité est de 40%, le plus élevé de tous.

Sans pour autant qualifier d'obsolète le système RPM, on doit constater qu'il a sans doute un retard technique à rattraper s'il veut enrayer cette érosion.

Finalement, ce qui surprend le plus, c'est l'étonnante résistance de TGZ (le système utilisé par Slackware, pas celui de Arch), système rustique, ne possédant aucune des caractéristiques complexes de Debian, fort peu à l'aise dans les mises à jour et traitant avec un royal mépris le concept même de dépendance. Non seulement il ne disparaît pas, mais il se paie même le luxe d'augmenter son audience quand RPM voit la sienne se réduire.

La répartition entre distributions installables et CD autonomes à l'intérieur de ces systèmes de paquetage est elle aussi paradoxale. En prenant pour référence l'ensemble des 1400, actives ou interrompues, le rapport des cd autonomes aux distributions installables est de 260 à 110 chez Debian et de 40 à 200 en RPM. Ce dernier système ne semble donc pas une plate-forme de développement propice aux cd autonomes. Les parts sont sensiblement égales pour le système TGZ (60-60 environ). Portage a un profil semblable à Debian (30 à 10).

Si enfin on recherche quelle proportion des distributions utilise le système de paquetage de base et quelle proportion utilise un système passablement modifié, on constate que le système de base convient à 99,5% des distributions Debian, mais seulement à 91% des distributions RPM et à 90% des distributions TGZ, ce qui laisse supposer une moindre satisfaction des développeurs, malgré leur fidélité au système.

Pour quoi faire ?

Tout, bien sûr. Il existe des distributions pour à peu près tout, la liste des orientations principales compte une centaine d'éléments, mais on peut néanmoins retenir quelques grandes lignes. La première destination d'une distribution est l'administration système au sens large (sécurité, serveur, routeur, pare-feu, sauvegarde, sauvetage, déploiement, etc.) avec environ 400 distributions. Viennent ensuite les sciences et l'éducation (une centaine), les loisirs (70). Le travail (applications métier) vient bon dernier (25), ce dont nous ne tirerons aucune conclusion hâtive.

Il y a énormément de distributions sans orientation particulière (généralistes, ou usage classique de bureautique et d'internet, environ 350). Cette catégorie bat tous les records de mortalité, ce qui semblerait prouver qu'un projet spécifique est plus porteur et a plus de chances de se trouver une audience durable (170 actives contre 130 inactives). Il s'agit là d'un marché passablement saturé, où il est difficile de se créer une identité forte.

Un peu en marge des distributions se trouvent les implants (embedded). Ce sont des systèmes destinés à faire fonctionner un appareil donné depuis le téléphone portable jusqu'au grille-pain (si vous ne me croyez pas, cherchez 'toaster linux' sur Google). Quelquefois installables au sens strict, quelquefois totalement invisibles (Freebox), elles sont souvent produites par des entreprises qui ne sont pas très bavardes sur les spécifications. J'ai le plus grand mal à classifier ces 68 “distributions”. Les journaux bien informés affirment que le nombre de systèmes Linux ainsi installés dépasserait celui des utilisateurs classiques. Proche de cette catégorie, mais franchement installables, sont les distributions sur clé usb, souvent d'ailleurs des variantes de cd autonome, qui seraient au nombre de 6.

Transversalement, car il ne s'agit pas à proprement parler d'une orientation, vient la localisation. La localisation, c'est l'adaptation à un contexte linguistique et culturel particulier, sans présager d'un type d'utilisation bien défini. C'est la raison d'être de très nombreuses distributions (plus de 390).

La localisation

Celle-ci ne concerne qu'un sous-ensemble des 1400 distributions, car il est impossible de distinguer les distributions destinées à un public anglo-saxon des distributions non localisées. En principe, toute distribution installable est localisable par l'utilisateur avec plus ou moins d'effort. Dans la pratique, ce n'est pas si simple, seules les distributions majeures se prêtent à ce jeu. Tout cela pour dire que nous ne comptons que les distributions explicitement localisées, ce qui exclut de facto la majorité des distributions (celles qui ne précisent rien et les distributions majeures), géographiquement l'Amérique anglophone, la Grande-Bretagne, probablement aussi l'Australie et la Nouvelle-Zélande. Il y a 391 distributions localisées, soit environ 28% du total, dont 255 actives, ce qui, soit dit en passant, dénote une longévité supérieure à la moyenne.

Ces distributions sont issues d'une soixantaine de pays différents, soit environ un tiers des pays présents à l'ONU, ce qui implique (c'est bien entendu un truisme) que les deux tiers des pays du monde ne sont pas représentés. Une courte enquête sur certains de ces pays a montré qu'il s'y trouvait des LUG très actifs, souvent impliqués dans la localisation des applications (KDE, Gnome, Openoffice), cela indique donc seulement que ces LUG ont jugé qu'il y avait mieux à faire. Rappelons de plus qu'une distribution comme Mandriva, par exemple, n'est pas comptabilisée comme française puisqu'elle supporte de très nombreuses langues, un pays qui ne produirait que des distributions majeures n'aurait de facto aucune distribution à son actif.

Si on regroupe par grands ensembles géographiques (Europe, Asie, Afrique, Océanie, Amérique latine + le monde arabe, à cheval sur l'Afrique et l'Asie + la Russie et la Turquie, à cheval sur l'Europe et l'Asie – l'Antarctique où, malgré notre mascotte préférée, je n'ai trouvé aucune distribution), l'Europe vient largement en tête du classement (183), et pour cause: mosaïque de peuples et de langues, riche et éduquée, elle a tous les atouts en main. On admirera cependant la présence de (presque) toutes les langues, tous les pays, toutes les appartenances, même régionales. Les exceptions seraient, sous réserves, l'Albanie, la Belgique, l'Estonie, l'Irlande, le Luxembourg, Malte et la Slovaquie. On perçoit la volonté politique sous certains chiffres: 5 distributions pour la Catalogne, plus que pour toute l'Afrique. La France est honorablement représentée: 29 distributions, dont 22 actives.

La volonté politique est aussi le trait dominant de l'Amérique Latine: continent partagé en deux langues seulement, si on exclut les langues indiennes qui sont très peu représentées dans la liste, langues qu'elle partage de surcroît avec l'Europe, elle n'a d'autre explication pour l'existence de 60 distributions (37 lusophones, 23 hispanophones) que sa volonté politique et le dynamisme de ses équipes de développement. Bravo! Viva el presidente Cha… oh, pardon. Si l'Espagne réussit à avoir à elle seule plus de distributions (30 hispanophones, 11 régionales) que l'Amérique latine hispanophone (23), ce n'est pas du tout le cas du Portugal (3) face au Brésil (37).

L'Asie est le troisième grand pôle de développement. Le classement est ici plus difficile, car les langues sont souvent transfrontalières, et les distributions multilingues. Quoi qu'il en soit, plus d'une centaine de distributions se partagent le continent, dont une trentaine pour la seule Chine. L'Inde est championne toutes catégories des langues régionales (12 langues représentées).

Maintenant, les grands absents. Le Monde Arabe, tout d'abord. Riche (du moins en ce qui concerne le Moyen-Orient), cultivé, éduqué, il n'a aucune raison de se trouver là. Il propose pourtant autant de distributions (5) que la Catalogne. Syndrome inquiétant d'un repli sur soi, d'une méfiance à l'égard de la technique, de l'influence anglo-saxonne trop apparente dans l'informatique, de l'Occident en général ? Le problème n'est sûrement pas technique, car la localisation des applications est très avancée. L'analyse n'est pas aisée, mais les chiffres sont trop parlants pour se passer d'explication.

L'Afrique ensuite (3). Il n'est malheureusement pas besoin d'une explication idéologique dans son cas. La pauvreté, le poids des épidémies, trop souvent l'absence des libertés fondamentales, le sous-équipement technologique et le manque d'infrastructures expliquent pour une grande part son absence. Il n'y a pas non plus de revendication linguistique de la part des élites installées en Europe, sinon nous aurions vu le développement de distributions dans au moins une partie des langues les plus parlées du continent. L'émiettement linguistique, couplé à la présence de langues de colonisation fortes (Français et Anglais), fait le reste. C'est d'autant plus dommage que l'enseignement primaire dans les langues vernaculaires devrait être une des principales vocations du logiciel libre sur ce continent.

L'Océanie enfin. Je n'ai, ne connaissant pas bien cette région, aucune explication. Là aussi, les chiffres sont sans appel: quatre distributions actives pour l'Indonésie, deux pour les Philippines, un total à peine supérieur à celui de la Catalogne, c'est peu, surtout rapporté au nombre d'habitants de la région. Peut-être faudrait-il faire une recherche plus approfondie.

Si l'on excepte encore un fois l'Anglais, les langues les plus représentées sont l'Espagnol (53), le Portugais (40), le Chinois (30), le Français (32), le Japonais (25), l'Italien (20) et l'Allemand (20). Le Russe et l'Ukrainien (regroupés) comptent 20 distributions, le Polonais 12 et le Coréen 11.

Le top 10

Le défaut des statistiques présentées ci-dessus est l'absence de poids relatif des distributions: Mandriva compte pour 1 et Nasgaïa compte pour 1 (croyez bien que je n'ai aucun mépris pour Nasgaïa, mais il faut bien admettre qu'elles n'ont pas la même audience internationale). Les tentatives de pondération, par comptage des contributeurs, des utilisateurs, des participants aux forums, des simples curieux ont été nombreuses, mais pas toujours couronnées de succès.

Le top 100 de distrowatch.com, cote de curiosité plus que d'usage, falsifiable, biaisé dans le sens d'une surpondération des utilisateurs anglophones, possède, comme les autres méthodes, ses défauts. Son analyse dans la durée permet pourtant d'isoler une grosse vingtaine de distributions qui n'ont pas quitté le top 100 (calculé sur 30 jours), mois après mois, pendant trois ans. On y trouve toutes les “racines”, distributions majeures ayant une descendance, Debian, Red-Hat-Fedora, Mandrake-Mandriva, Slackware, Gentoo, les cd autonomes majeurs, Knoppix, SLAX, DSL. On y trouve OpenSUSE, distribution majeure, quasi sans descendance aucune, MEPIS, dérivé Debian destiné au grand public anglo-saxon. On y trouve encore des distributions plus mineures, moyennement placées dans le classement, mais fournissant une prestation solide et régulière à une “clientèle” fidèle.

Un seul exemple montrera la fragilité de ce top 100: Ipcop, pare-feu-routeur pour petite structure, se traîne aux environs de 50 “hpd” (hit per day, l'unité de compte du top 100) depuis des années. On apprend sur son site que ses créateurs viennent de comptabiliser le 2.500.000ème téléchargement, ce qui fait, à supposer que ces utilisateurs se rendent une fois chacun sur la page de leur distribution préférée, à raison de 50 “hits” par jour, 135 ans. Pourquoi en effet se rendre sur la page de son pare-feu sur Distrowatch puisqu'il indique de lui-même qu'il y a une mise à jour à faire?

Si l'on met de côté Solaris et les BSD, les distributions majeures sont, à mon sens, celles qui entretiennent les bases de données des arbres de dépendance, à savoir Fedora, Debian, Mandriva, Slackware, Gentoo, OpenSUSE et Arch. Je ne sais pas d'ailleurs quelle est l'indépendance d'Ubuntu par rapport à Debian dans ce domaine. Ce sont les mêmes qui déterminent la structure et le contenu des paquetages. La grande majorité des distributions dérive directement ou indirectement des cinq premières (Arch et OpenSUSE n'ont que peu de descendance). A mon sens, toutes les autres sont de ce fait “mineures”, leur classement s'apparente plutôt à la Star Academy.

Soyons encore plus clair pour contrer les stupidités que l'on voit proférer de temps en temps sur les forums: Si, par exemple, Debian disparaissait, ce serait d'un seul coup plus du tiers des distributions actives qui disparaîtrait avec elle, dont la majorité des stars du moment: Ubuntu, Knoppix, Mepis, etc., faute de l'indispensable mise en paquetage des logiciels et création de la base de données des dépendances. Si Mepis disparaissait, cela ferait une distribution interrompue de plus et une active de moins, alors même que Mepis est régulièrement trois ou quatre places au dessus de Debian dans le top 100 de Distrowatch.

Le futur

De 1993 à 2000, les distributions qui ont interrompu leur activité se comptent pour chaque année sur les doigts des deux mains et plus souvent d'une seule. 2001, ses drames et l'éclatement de la bulle internet font brutalement monter le décompte des abandons à une centaine. L'année suivante annonce une décrue (60) mais 2003 remonte au niveau de 2001. A partir de 2004, en comptant non plus seulement les cessations d'activité mais les dates de dernière activité connue, la courbe grimpe exponentiellement: 153 en 2004, 298 en 2005, 376 en 2006, déjà 58 depuis le 18 décembre 2006.

De toute évidence, on n'a pas encore atteint un plafond, et encore moins une consolidation. Il ne s'agit pas d'un flux de distributions qui apparaissent et disparaissent aussi vite, les taux de croissance sont largement positifs. On peut se demander si cela est justifié, utile, on peut même affirmer, comme l'a fait le créateur de Distrowatch, Ladislav Bodnar, dans un moment de déprime, que si les trois quarts des distributions disparaissaient, personne ne s'en apercevrait. Le débat “trop de distributions” est aussi récurrent sur les forums que Debian vs. RPM ou Gnome vs. KDE. Constatons seulement que certaines catégories de distributions sont plus à même de durer que d'autres. En tout cas, compte-tenu de la tendance actuelle, le débat n'est pas près de se terminer.

Risquons quelques prévisions:

  1. avec l'achèvement de la localisation des applications dans les 120 pays non représentés dans la liste, on devrait voir apparaître des cd autonomes dans de nouvelles langues, souvent avec l'appui des autorités, comme cela a été le cas au Bhoutan.
  2. les systèmes de paquetages Debian (apt), Arch (pacman) et Gentoo (portage) devraient continuer à prendre des parts de marché aux dépens de RPM, surtout après la sortie de Etch.
  3. BSD et Solaris ne pourront décoller que s'ils se dotent d'un système de paquetages binaires performant. Les projets Debian en ce sens sont prometteurs.
  4. avec la possibilité d'utiliser Openoffice en 64 bits natif, quasiment acquise, l'offre 64 bits devrait s'étoffer très rapidement. C'est même étonnant que ce ne soit pas déjà fait. On devrait de plus voir apparaître des distributions (ou des versions) spécifiques double coeur pour tirer parti des derniers processeurs sortis, en particulier dans les applications graphiques ou vidéo.
  5. la distinction entre cd autonome et distribution installable deviendra de plus en plus floue: déjà la plupart des cd d'installation sont utilisables en cd de sauvetage ou même en cd autonome complet, et l'immense majorité des cd autonomes ont une option d'installation. Cette tendance devrait toucher même les plus rétives des catégories, pare-feux, serveurs, qui ne conserveront plus que les données et les logs sur le disque. Cela présente des avantages évidents (que celui qui a réussi à coller un virus dans /sbin sur un cd m'écrive tout de suite)
  6. on devrait passer le cap des 1000 distributions actives avant la fin 2007.
linux_en_2007_-_1400_distributions.txt · Dernière modification : 2021/10/18 16:09 de 127.0.0.1