Le stockage en ligne centralisé est énormément utilisé par les entreprises, les organisations et les particuliers. L’ accessibilité des données est conditionnée par le bon fonctionnement et la bonne volonté de l’opérateur qui les stocke. Elles sont amassées dans des Data Centers, véritables usines de la donnée qui sont soumises à divers risques pouvant affecter leur sécurité et leur pérennité: vandalisme, vol de matériel contenant les données, incendies criminels, ou encore casse des serveurs, etc.

Pour réduire ces risques, une solution est d’augmenter le nombre de Data Centers. Néanmoins, cela ne fait que déconcentrer le stockage de données d’un point de vue géographique. Celui-ci demeure toujours centralisé, car il reste aussi aux mains d’un nombre limité d’acteurs.

Même si les Français Orange Business Services, Scaleway, 3DS Outscale ou OVH proposent des solutions performantes, le stockage de données en ligne est en grande majorité géré par un oligopole à prédominance américaine (Alphabet, Amazon, Apple, Dropbox, Facebook, Microsoft, Oracle, …).

Cela implique des risques de compromission, de liberté d’expression (censure), de sécurité juridique et économique, ou encore de souveraineté. En plus de la résilience d’accès à la donnée, l’un des enjeux du stockage décentralisé réside en la suppression de la centralisation du stockage aux mains d’un petit groupe d’acteurs, vers un très grand nombre d’acteurs n’ayant aucune possibilité de monopole ni de regard sur les données qu’ils stockent.

De nombreuses définitions existent pour définir plus ou moins précisément le stockage décentralisé. Pour faire simple, retenons que le stockage décentralisé (decentralized storage en anglais) est un système qui partage entre de nombreux opérateurs indépendants, la conservation de données informatiques.

Ensemble, ces opérateurs indépendants forment en quelque sorte un réseau de stockage pair-à-pair où les échanges (stockages et récupérations) de données peuvent se faire directement entre différents ordinateurs connectés au système, sans transiter par un serveur central. Le fait d’opérer en réseau ainsi que de chiffrer les données complexifie et réduit de façon drastique le risque d’attaque. Attaquer un seul opérateur est envisageable, attaquer un réseau qui en compte des milliers est aussi possible, mais techniquement et économiquement nettement plus difficile à soutenir.

La fiabilité et la sécurité de ce type de stockage sont directement corrélées au nombre d’opérateurs utilisant le réseau. En multipliant le nombre d’opérateurs, un réseau de stockage décentralisé permet de réaliser des économies d’échelle en permettant à quiconque (entreprises ou particuliers) de participer en tant que fournisseur de stockage (hébergeur) tout en monétisant son espace libre sur son disque dur.

Comment cela fonctionne-t-il ?

Sorte d’infrastructure as a service (IaaS) du cloud computing, les réseaux de stockage décentralisés s’appuient fortement sur la technologie blockchain, condition essentielle à leur sécurité, fiabilité et autonomie. Concrètement, voici l’une des méthodes d’utilisation d’un réseau décentralisé.

Lorsqu’un utilisateur (locataire) souhaite stocker des fichiers en ligne de façon décentralisée, il doit utiliser les services d’une organisation (entreprise, fondation, association) de decentralized storage. Celle-ci lui fournira un logiciel (généralement open source) d’accès à un réseau décentralisé. Ce logiciel va procéder à son « anonymisation » (même si dans certains cas le terme de « pseudonymisation » serait plus approprié)puis va créer différents segments (ou fragments) de ses fichiers avant leur téléversement sur le réseau.

Ces segments sont chiffrés et copiés de nombreuses fois (redondance), puis distribués aléatoirement à différents hébergeurs. Cette distribution sur le réseau d’hébergeurs est régie par des smart contrats (contrats intelligents) qui fixent les prix, les engagements de disponibilité, et d’autres aspects de la relation entre locataires et d’hébergeurs. Ces smart contrats sont ensuite exécutés sur la blockchain du réseau soutenu par l’organisation de decentralized storage. Cela permet la traçabilité et la validation des segments des fichiers du locataire.

S’appuyant sur la technologie blockchain, les smart contrats sont automatiquement générés et appliqués sur le réseau. Pour s’exécuter, les smart contrats ont besoin de preuves validées par la blockchain. Par exemple, les smart contrats peuvent demander une preuve de stockage (proof of storage), d’espace (proof of space), de conservation (PoH), de service (PoSe), d’espace-temps (proof of spacetime), de réplication (proof of replication), etc. Ces méthodes ne requièrent aucun intermédiaire pour fonctionner. Si une preuve apparaît sur la blockchain dans un certain délai, les hébergeurs sont automatiquement payés. Sinon, l’hébergeur est pénalisé.

Lorsqu’un locataire veut accéder à ses fichiers, il le demande au réseau qui peut utiliser des tables de hachage distribuées pour localiser tous les segments et les assembler. Le locataire qui les télécharge dispose de sa propre clé privée pour en valider la propriété. La redondance (multiplication des segments) permet de récupérer complètement le fichier d’origine d’un utilisateur avec seulement quelques segments (de façon peer-to-peer, sans transiter par un serveur central). Gage de résilience, cela signifie que même si un ou plusieurs opérateurs du réseau sont hors ligne, l’accès aux données est encore possible.

Dans un réseau de stockage décentralisé, les locataires et les hébergeurs utilisent majoritairement des cryptomonnaies pour se rémunérer via des micropaiements (déclenché par l’exécution de smart contrats). Le monde du decentralized storage a vu naître de nombreux projets au cours de ces dernières années : Storj de Storj Labs Inc., Sia de Nebulous Inc., ou encore Filecoin (FIL), crypto-monnaie soutenu par la fondation du même nom.

De plus, pour pallier aux délais dus à la récupération des données (souvent plus long qu’avec un stockage centralisé classique), certains services de decentralized storage proposent aux hébergeurs de leurs réseaux disposant de connexions à faible latence, ou d’une bande passante large, proches des utilisateurs finaux, une rémunération plus élevée.