Et si Facebook stockait ses données chez Amazon s3 ?

le 3 février 2009 à 08:56 par mrboo

Facebook héberge (entre autre) plus de 10 milliards de photos.
Ce qui donne un ordre d’idée de la quantité de données qu’ils doivent stocker et afficher via leur infrastructure technique.

Pour le sport, je me suis demandé combien ça leur couterait si ils utilisaient la solution de stockage d’Amazon: S3.

Essayons de voir ce que consomme Facebook:
« Chaque jour, 2 à 3 téra-octets d’images sont mis en ligne sur Facebook, 15 milliards de photos sont visualisées » [source]

« Électricité : 1 M$, Bande passante : 500 000$, Loyer et centres de données 1.25 M$, 50 000 serveurs à acheter : 100 M$ » [source]

Donc, en matière de stockage:
10 milliards de photos, à environ 0,5Mo par photo (il y en a 4 versions, mais pas de HD) ça fait 5 milliards de Mo… soit 5.000 To (wow…)
Si on regarde le tarif Amazon S3, et en doublant la quantité de données (il faut aussi stocker la vidéo et le reste des data) cela donne:
0,12$ x 2 x 5.000.000 Go = 1,2 M$

En matière de bande passante mensuelle:
3 To à uploader chaque jour: 3.000 Go x 30 x 0,10 $ = 9 K$ (lol…)
15 milliards de photos visualisées: une photo en format « écran » pèse environ 100Ko, donc en download:
15.000.000.000 x 0,0001 Go x 0,1 $ = 150 K$

Il me manque trop de données (notamment sur les vidéos) pour pouvoir faire une estimation précise de ce que couterait à Facebook le stockage de ses données chez Amazon.

On peut cependant se rendre compte de quelque chose d’intéressant pour le futur de ce service: le stockage « infini » des données (voir cette demo) n’est pas tenable à long terme sans un business model adapté.

En effet, la majorité des dépenses passent dans le stockage des « anciennes » données (y compris celles supprimées par les utilisateurs mais gardées par Facebook).

Il va donc falloir rentabiliser les données archivées: les récentes annonces du lancement prochain d’offres de datamining marketing vont probablement dans ce sens.

hdd-wscsi

8 commentaires pour “Et si Facebook stockait ses données chez Amazon s3 ?”

Aller au dernier commentaire | retourner à la racine du blog
  1. 1jcfrog dit :

    oula!
    ça fout le vertige de bon matin avant le (2eme) café! ;)

  2. 2mrboo dit :

    Et je suis surement en dessous de la réalité (il faut ajouter toutes les données comportementales et les statistiques détaillées des utilisateurs)

  3. 3JM dit :

    Mais pourquoi iraient-ils se faire facturer (au moins le double de ce que ça coute à S3 histoire d’être rentable) un tel service auprès d’un de leurs futurs clients (amazon) et pourquoi ne monteraient-ils pas un service concurrent vu l’infrastructure qu’ils ont dû monter…

  4. 4Brice dit :

    Malheureusement la source concernant le datamining n’est pas très fournie.
    J’ai cherché des infos sur ces pratiques à venir, mais j’ai pas trouvé grand chose, tu as autre chose la dessus ?

    Enfin, ça me conforte dans l’idée qu’il faut pas mettre d’infos trop perso sur Facedebook !

  5. 5mrboo dit :

    JM> Il faut prendre en compte l’ensemble des charges liées au stockage sécurisé des données:
    - Hébergement physique des 50.000 serveurs
    - Installation/Entretien/remplacement des serveurs
    - Électricité
    - Bande passante
    - Et surtout: spécialistes pour veiller au grain

    Les gars de chez smugmug (stockage de photos) avaient fait la démonstration des économies réalisées via s3:
    http://blogs.smugmug.com/don/2006/11/10/amazon-s3-show-me-the-money/

    Brice>
    http://tempsreel.nouvelobs.com/actualites/buzz_sur_le_web/20090202.OBS2782/facebook_veut_ouvrir_sa_base_de_donnees_aux_entreprises.html

  6. 6Jean Benoit dit :

    Très intéressant ces petits calculs.

    Pour info, est-ce qu’amazon garantie l’intégrité de tes données où est-ce à toi d’organiser des backups ?

  7. 7mrboo dit :

    Jean Benoit> Les données stockées chez Amazon sont présentes en triple exemplaire dans 2 lieux différents: difficile de faire mieux de mon coté ;)

  8. 8Brice dit :

    @mrboo : Ok merci pour l’info! Ce serait donc des enquêtes sur solicitation, donc pas d’utilisation de données comme bon leurs semble. Enfin, même si la barrière ne devrait pas durer très longtemps…

    Bref, post très intéressant en tout cas ;)

Vu sur Twitter

Voici quelques tweets qu'il me semble intéressant de relayer ici.

@LaFermeDuWeb #jQuery 1.4.2 est released: 2 fois plus performant par rapport à la version 1.4.1 ! http://bit.ly/aQg5cX
@schiste ACTA la partie dédiée à "internet enforcement" a fuité et est téléchargeable ici http://is.gd/8SKte
@julie_adore Pour visionnage de cette vidéo, le Crédit Coopératif s'engage à verser 5 centimes à une association ! http://bit.ly/CarteAgir #CarteAgir
@jromanetto Top des extensions Firefox utiles au référencement http://bit.ly/cLEz7v
@Oelita RT @MeaganFrancis: Fantastic post from @bringthefamily about photographing your family adventures: http://bit.ly/cJaI6Y
@lefakir la tablette pour les barbus http://www.ifreetablet.com/indexEN.php
@vendeesign RT @shatus: <3 RT: @startupz: RT @eMeRiKa: effet "prise de photo" en jquery, diffile à utiliser dans un site mais sympa http://bit.ly/aUx2ma
@SLIxx Hovercards: Twitter Launches New Profile Preview Feature - http://bit.ly/bim1oJ /via @mashable // l'aperçu du profil en beta
@Korben HipHop, le compilateur PHP -> C++ de Facebook http://www.korben.info/hiphop-le-compilateur-php-de-facebook.html
@Alban Ohh le TimeWarp sur @Mailchimp ça me parais terrible comme fonctionnalité (mais j'en ai pas l'utilité)
@emob OTABLO! le nouveau projet signé Emob ^^ http://tinyurl.com/otablo (please RT)
@kiedisfr RT 7 Reasons Why Developers are Deserting iPhone Apps and return to web technologies | SitePoint http://bit.ly/axWOBo /via @PierreTran
@vincentabry Ustream lance le Pay Per View (paie par vue) http://goo.gl/fb/nTGK
@tebenas [RWW Fr ]La Quadrature du Net pourrait cesser son combat faute de financements http://bit.ly/6W1lTg
@adriangaudebert Aujourd'hui nous lançons le #quadratureday, tous ensemble, sauvons @laquadrature ! http://bit.ly/7Y7psP @mrboo @korben @nitot @epelboin
@xuoan The 4 Big Myths of Profile Pictures « OkCupid http://okcupid.com/z/i2n
@DamiendB pas mal ca! RT: @cattias: : Créer vos jeu concours en ligne en 30mn via Digibonus http://tinyurl.com/ye2fjlm
@sebgregoire RT @LaFermeDuWeb: SEO Panel - Une plateforme web opensource pour suivre votre référencement naturel et le boost: http://bit.ly/6EgqOp
@emalquier [Startup] RT @gbertholet: Entrepreneurs ? Venez boire un pot le 4 février !!! http://bit.ly/4TBBR5 (RT merci merci !)
@davanac New Study Reveals Facebook Better Than Twitter for Marketers | Social Media Examiner http://goo.gl/fb/tRQQ