Conecta con nosotros

Noticias

Almacenamiento de datos: ¿qué es un archivo, un bloque y un objeto?

Publicado el

almacenamiento de datos

La tecnología del almacenamiento de datos se puede entender mejor si se estudian los fundamentos de los sistemas de archivos (CIFS, NFS,…), protocolos como SMB, y los diferentes tipos de almacenamiento de datos (archivos, bloques y objetos) utilizados por usuarios y aplicaciones. Así se comprenderá mejor los servicios de computación en la nube destinados a almacenar información.

Actualmente existen muchos servicios de almacenamiento en la nube, como Dropbox, iCloud, GDrive, OneDrive, Mega, JottaCloud, Microsoft Azure Blob Storage, Google Cloud Storage, Amazon Web Services (AWS) S3, etc., cada vez con mayores exigencias de capacidad. Pero, ¿realmente sabes cómo funcionan?

¿Qué es un sistema de archivos en el almacenamiento de datos?

Un sistema de archivos (File System o FS) es un elemento fundamental en el almacenamiento de datos, y que se encarga de organizar y administrar los datos almacenados en un dispositivo de memoria. Gracias a estos sistemas, la información puede ser guardad de forma eficiente, segura y organizada, además de aportar los métodos para acceder a los datos, modificarlos, o eliminarlos, tanto los archivos como las carpetas.

Para que todo esto funcione, el sistema de archivos del medio de almacenamiento de datos debe tener una estructura jerárquica, un sistema de control de acceso, herramientas de gestión del espacio, y metadatos necesarios para identificar propiedades, propietarios, fechas de creación, modificación, etc.

Los sistemas de archivos comúnmente se conoce por los usuarios como «formato», y pueden ser muy diversos, como FAT, NTFS, XFS, btrfs, ext4, y un largo etc. Estos se usan para los ordenadores convencionales, sin embargo, en la nube, los grandes servidores usan otros formatos, ya que se utilizan sistemas de archivos en red, como puede ser CIFS, NFS, o también el protocolo SMB para compartir datos entre sistemas heterogéneos (Unix/Windows).

¿Qué es DBMS?

base de datos

Un sistema de gestión de bases de datos, o Data Base Management System (DBMS), es un software que permite a los usuarios interactuar con bases de datos, para ellos se encarga de organizar, almacenar, recuperar y modificar datos. Para ello, definirá la estructura de la base de datos, tablas, campos, tipos de datos, relaciones entre ellos, etc., además de proveer sistemas de acceso, control, manipulación, y recuperación.

Hay que diferenciar entre un sistema de archivos y un DBMS, ya que hay algunas diferencias a tener en cuenta:

  • El sistema de archivos almacena datos en bruto, el DBMS lo hace usando un modelo particular.
  • El acceso se realiza a nivel de archivo en el sistema de archivos, mientras que se realiza a nivel de registro en el DBMS.
  • El FS no admite consultas complejas, mientras que un DBMS sí, usando lenguajes como SQL.

Diferencias entre archivo, bloque y objeto

Una vez comprendido esto, lo siguiente es aclarar cómo se guarda la información, y hay que saber que los sistemas de almacenamiento de datos pueden utilizar distintos bloques elementales de información:

  • Archivos: el almacenamiento de archivos organiza los datos en una estructura jerárquica con carpetas, subcarpetas y archivos. Es ideal para el almacenamiento general de archivos y se puede acceder a él mediante sistemas de archivos como los descritos anteriormente. Un ejemplo de estos archivos es el que se puede tener en un PC cualquiera o un NAS, con carpetas con documentos de texto imágenes, vídeos, etc. Además, muchos servicios de los principales proveedores en la nube también emplean este tipo de sistema, como Amazon EFS, Azure Files, Google Cloud Filestore, etc.
  • Bloques: en este otro caso, se accede a bloques. Un conjunto de bloques componen un archivo. Es ideal para cargas de trabajo con muchos usuarios que acceden al mismo archivo simultáneamente, como las bases de datos. Como ejemplo, tenemos los sistemas de bases de datos, como SQL. Dentro de este tipo hay ejemplos de servicios como AWS Elastic Block Store, Azure Disk y Google Persistent Disk.
  • Objetos: almacena objetos de datos con identificadores únicos y carece de una estructura jerárquica. Es escalable y se adapta bien al análisis y la IA, pero tiene limitaciones en el bloqueo de archivos. En este caso son datos ricos en metadatos, para ser utilizado por la IA. Este tipo de almacenamiento de datos es el más utilizado en servicios de la nube como Azure Blob, Google Cloud Storage, AWS S3, etc., así como algunas soluciones innovadoras específicamente pensadas para satisfacer las demandas de la IA.

Lo más leído