bg-infra
Centre de Calcul de l'Institut National de Physique Nucléaire et de Physique des Particules

Le libre dans le monde des datacenters
rêve ou réalité ?

Campus du Libre, 10 Novembre 2018

Benjamin Guillon, Cyril L'Orphelin - CNRS/CCIN2P3

Le CCIN2P3
  • Unité de Service et de Recherche du CNRS / IN2P3
  • IN2P3 : Institut National de Physique Nucléaire et de Physique des Particules
  • Localisé de l'autre côté de la rue
  • ~85 personnes dont 65 ingénieurs et 1 chercheur
Logo CNRS Facade du centre de calcul Logo CNRS
Thématiques de l'Institut
  • La physique des particules : les propriétés des constituants élémentaires de la matière
  • La physique nucléaire : les propriétés des noyaux des atomes et de leurs constituants les nucléons
  • L’astrophysique et les astroparticules : le rayonnement cosmique, le contenu, la structure et l’évolution de l’Univers
  • Dans une moindre mesure, les sciences de la vie et les sciences humaines et sociales
De nombreuses expériences
expériences
Que fait-on au CCIN2P3 du coup ?
Cela nécessite donc :
  1. Des moyens de traitement de grandes masses de données
  2. Des systèmes de stockage de masse
  3. Une infrastructure pour la production scientifique
  4. Des outils d'aide à la production scientifique
Traitement de grandes masses de données
vil1 vil2
batch middleware
Serveurs de calcul
OS Nb serveurs Licence
scientific linux ~50 GNU GPL oh yes!
centos ~800 GNU GPL oh yes!
Systèmes d'ordonnancements - Europe + USA
Nom Nb centres Type
TORQUE & MAUI 90 Commerciale + GNU LGPL bof !
pbs 50 Dual licensed bof !
condor 50 Apache 2 oh yes!
slurm 20 GNU GPL oh yes!
oracle grid engine 20 Sun Industry License oh yes!
lsf 20 IBM License oh no!
Infrastructure de grille de calcul

  • Soumissions distribuées : Grid/Cloud Computing
  • Couche de communication : Middleware / Intergiciel
  • Collaborations internationales
  • Standards ouverts
  • Open Source
middleware middleware
Que fait-on au CCIN2P3 du coup ?
Cela nécessite donc :
  1. Des moyens de traitement de grandes masses de données
  2. Des systèmes de stockage de masse
  3. Une infrastructure pour la production scientifique
  4. Des outils d'aide à la production scientifique
stockage de masse - 1
Utilisation Description Volumétrie
SPS
  • Semi Permanent Storage
  • Données à durée limitée < 2 ans
  • Grand nombre de fichiers
  • Accès de manière intensive par les serveurs de calcul
  • Solution commerciale IBM
  • 2.5 Po
Logo GPFS
PBS
  • Permanent Backed-up Storage
  • Sauvegarde de données basée sur le service TSM
  • Espace utilisateurs
  • Sauvegarde des logiciels
  • Sauvegarde des serveurs et postes de travails des labos IN2P3
  • Solutions commerciales IBM et DELL EMC
  • 4 Po
  • 1 Md fichiers
Logo isilon
Logo ISP
stockage de masse - 2
Utilisation Description Volumétrie Solution Logicielle
Local HPSS
  • Stockage de masse sur bandes magnétiques
  • Données scientifiques de l'IN2P3 et du CERN
  • Solution commerciale
  • 65 Po
  • +15 Po / an
Logo HPSS
Xrootd
  • Stockage avec accès haute performance
  • Interfacé avec HPSS pour les données sur bande
  • Solution Open Source
  • 10 Po
Logo xrootd
Distribué iRODS
  • Stockage avec accès à des données distribuées
  • Accès transparent à des supports de stockage différents
  • Solution Open Source
  • 2 Po
Logo iRODS
dCache
  • Stockage avec accès à des données disque distribuées
  • Utilisation massive
  • Données du LHC répartie sur une grille
  • Interfacé avec HPSSS
  • Solution Open Source
  • 15 Po
Logo isilon
Bases de données
oracle Licence Commerciale
Logo mariadb Fork communautaire de MySQL
GNU GPLv2, GNU LGPL
Logo postgresql PostgreSQL License
a liberal Open Source license
Logo MongoDb GNU AGPLv3
,Oracle, MariaDB, PostGres, MongoDB Nb comptes, 600, 500, 60, 30 Go, 60000, 400, 500, 30
Que fait-on au CCIN2P3 du coup ?
Cela nécessite donc :
  1. Des moyens de traitement de grandes masses de données
  2. Des systèmes de stockage de masse
  3. Une infrastructure pour la production scientifique
  4. Des outils d'aide à la production scientifique
Du réseau local ...
réseau 1 réseau 2 réseau 3

Un réseau local performant pour plusieurs salles :

  • n x 100Gbps entre salles
  • n x 1 ou 10Gbps vers les machines

Principalement Ethernet mais aussi Infiniband

... au point d'échange
Un IX RENATER et autres opérateurs, zone neutre
réseau
Une infrastructure propriétaire
Du cisco partout...
cisco1 cisco2 cisco3
Hébergement

Hébergement:

  • Colocation de serveurs
  • Infrastructure as a Service (IaaS)
  • Web hosting
Colocation de serveurs
Server Colocation

Clients institutionnels

  • Hébergement "sec"
  • Racks, fluides et réseau
Logo DSI CNRS Logo UCBL Logo Région Rhone-Alpes
Infrastructure as a Service

Virtualisation « à la demande »

Accès aux ressources mutualisées:

  • Calcul
  • Stockage
  • Réseau
Plateforme Openstack
Logo VMware

Logo Openstack + Logo KVM

Production et R&D:

  • 80 HVs
  • 50 Projets
  • 150 utilisateurs
  • 6500 vCPUs
  • 34 TB de RAM
  • 0,5 PB de stockage
Logo GPFSLogo Ceph
Web

Plus de 300 sites et services web institutionnels

Site web du CCIN2P3
Site web de l'Académie des Sciences
Site web de LSST
Gitlab
Défis de l'hébergement web

Plusieurs défis pour le CCIN2P3:

  • Augmentation des demandes
  • Hétérogénéité des technologies
  • Ressources contraintes

→ Sur une plateforme vieillissante...

Refonte de l'hébergement web
Docker Logo + Kubernetes Logo

Mutualisation → Conteneurisation

  • Cohabitation technologique
  • Orchestration et automatisation
  • Industrialisation, standardisation, délégation
Infrastructure as code

Industrialiser le déploiement d'infrastructures

  • Eviter les erreurs humaines
  • Standardiser les configurations
  • Automatiser les tâches rébarbatives
The Foreman Logo Puppet Logo Ansible Logo
Le Logiciel Libre dans l'infrastructure
CentOS Logo
OpenStack Logo
Ceph Logo
KeyCloack Logo
Apache Logo
OpenShift Logo
HAProxy Logo
ElasticSearch Logo
Collectd Logo
RedHat Logo
Que fait-on au CCIN2P3 du coup ?
Cela nécessite donc :
  1. Des moyens de traitement de grandes masses de données
  2. Des systèmes de stockage de masse
  3. Une infrastructure pour la production scientifique
  4. Des outils d'aide à la production scientifique
La gestion documentaire

Plateforme « Atrium »
→ Gestion électronique de documents (GED)


  • 4,8k utilisateurs (IN2P3)
  • 180k documents (depuis 2003)
  • 1.4To de données

Déploiement INSU à venir...

Nuxeo

Opensource et commercial

Organisation du travail en équipe
Usage Outil(s) Licence
Emails Zimbra Commercial
Conférences Indico Libre
Support utilisateur OTRS
Redmine
Libres
Retransmission
d'évènements
Wowza
Wirecast
Commercial
Gestion de projet informatique
Usage Outil(s) Licence
Gestion de projet informatique Redmine
Gitlab
Libres
Gestion de sources Git, SVN, CVS, Hg... Libres
Intégration continue Jenkins
Gitlab
Libres
Alors, rêve ou réalité?
Opensource
Positionnement institutionnel

Avantages du logiciel libre

  • Indépendance et contrôle
  • Exploration technologique
  • Travail aux limites
  • Moins de frais de licence et de support

Mise en avant du logiciel libre:
→ En France et en Europe

Contrôle des données
OpenData
  • F.A.I.R.
  • Rayonnement international
  • Public

VS.

Souveraineté des données
  • Respect de la législation
  • Propriété intellectuelle
  • Sécurité et confidentialité
Licence CeCILL
CEA CNRS Inria

«CEA CNRS INRIA Logiciel Libre»

  • Licence Opensource compatible GNU GPL
  • Conçu par les acteurs publics majeurs français
  • Préconisée dans le monde de l'ESR

→ Mais est-elle vraiment util(isé)e?

Libre et commercial?

Support et fonctions avancées payants
→ Logiciel Libre « professionnel »

IBM Pacman RedHat

Dépendance à des sociétés ...
... de plus en plus puissantes.

En résumé

Une philosophie Open Source pragmatique
→ qui dépend :

  • de la spécifité de nos besoins
  • de la performance des solutions
  • du cout humain de l'implémentation et l'intégration
En résumé

Une souveraineté assumée de la gestion de données

  • Hébergement
    • local, pour nos services
    • mais aussi communautaire (ESR)
  • Données stockées localement
  • Peu de recours à l'externalisation
Merci de votre attention

Des questions?

So?
cc.in2p3.fr/rejoignez-nous
Powered by Reveal.js