Ceph

Ceph File System es un sistema de archivos distribuido libre, está diseñado para el uso con gran cantidad de datos, está muy enfocado para el uso con Big Data. Ceph tiene como objetivo ser POSIX-compatible y completamente distribuido sin ningún punto de fallo. Los datos tienen replicación libre de errores, haciéndolo tolerante a fallos.

Ceph emplea tres tipos diferentes de daemons:

  • Monitores de clúster (ceph-mon), mantienen un control de actividad y fallos en los nodos del cluster. Los monitores de Ceph son responsables de la gestión del sistema de almacenamiento mediante el almacenamiento de la copia del mapa del cluster y realizando actualizaciones periódicas en respuesta a cambios en la configuración o cambios en el estado del OSD (falla, recuperación o agregar). Cuando algún OSD es adicionado o falla, los monitores detectan y mantienen el mapa del cluster actualizado. Se le informa al RADOS que hubo un cambio de manera que este mantenga los datos replicados, consistentes y disponibles en el sistema. Ceph usa Paxos, un algoritmo para el consenso distribuido. https://commons.wikimedia.org/wiki/File:Arquitectura_CEPH.png
  • Servidores de metadatos (ceph-mds), almacenan los metadatos de inodos y directorios.
  • Dispositivos de Almacenamiento de Objetos (ceph-osds), actualmente es el que almacena el contenido de los archivos. Idealmente, el ceph-osds debería almacenar los datos en un sistema de archivos BTRFS local, pero también pueden utilizarse otros sistemas de archivo local.6

Todos los demonios funcionan totalmente distribuidos, y pueden ejecutarse en el mismo ambiente de servidores, mientras los clientes interactuarán directamente entre ellos.7

Ceph distribuye los segmentos de los archivos individuales a través de los múltiples nodos para así conseguir un incremento de rendimiento, de manera similar como lo hace el agrupamiento de discos en RAID0 segmenta los datos en las diferentes porciones de múltiples disco duros. Su balanceo de carga es autoadaptable por lo cual soporta la frecuencia de acceso a objetos replicancolos sobre mas nodos.8

 

Resumen: 
Sistema de archivos distribuido libre, está diseñado para el uso con gran cantidad de datos