- Por Douglas Wallace Gerente General, América Latina y El Caribe en Pure Storage (Excepto Brasil y México)
Esta década se perfila como el periodo histórico de “los felices años veinte” de los datos no estructurados. De acuerdo con Gartner, las tasas de crecimiento de estos han alcanzado el 30% anual, lo que significa que los volúmenes totales casi se cuadriplicarán para 2027.
Tal crecimiento es un desafío en sí mismo, pero este tipo de información también viene en una variedad de tamaños y se pueden almacenar como archivos u objetos, con necesidades de rendimiento cada vez más exigentes.
Archivo y objeto rápidos: rendimiento y rendimiento de E/S
Un impulsor clave del almacenamiento rápido de archivos y objetos es el rendimiento de ese para acceder los datos no estructurados. Hemos visto una explosión en el análisis y el aprendizaje automático, impulsada por la necesidad de extraer valor de enormes cantidades de datos sin procesar.
Mientras tanto, las imágenes digitales demuestran lo recién mencionado, como PACS (sistemas de archivo y comunicación de imágenes) en la industria de la salud. Un ejemplo aquí es el uso pionero del aprendizaje automático para el diagnóstico del cáncer por parte de Paige, con sede en EUA, que necesita una capacidad de almacenamiento a escala de petabytes con acceso rápido y alto rendimiento para permitir el reconocimiento automático de millones de imágenes en muestras de tejido de pacientes.
Además, la copia de seguridad y la protección de datos pueden producir una gran cantidad de archivos y objetos de varios tamaños. Hoy en día, se requiere que las restauraciones sean muy veloces para ayudar a recobrar la información en caso de un ataque de ransomware.
Archivo rápido y objeto: ¿Por qué el y?
Durante décadas, el almacenamiento de archivos ha sido una opción principal, con soluciones NAS de escalamiento horizontal que aumentan la capacidad y el rendimiento para admitir datos no estructurados, pero el almacenamiento de objetos se está volviendo cada vez más importante y bien establecido, impulsado por la web y el auge de la Nube.
Los archivos y objetos pueden contener el mismo tipo de contenido. Pero, mientras que los primeros usan un sistema jerárquico basado en directorios, los segundos usan una estructura «plana» con objetos a los que se les asigna un identificador individual y metadatos que se pueden usar para contextualizarlos.
Beneficios de archivos y objetos rápidos
Los datos no estructurados pueden abarcar muchas ubicaciones y métodos de acceso durante su ciclo de vida. Los productos emergentes de almacenamiento de objetos y archivos rápidos de la actualidad son compatibles con los protocolos del sistema de archivos de red (NFS) y del bloque de mensajes del servidor (SMB), que coinciden con la forma en que se escriben muchas aplicaciones empresariales existentes.
Además, las soluciones rápidas de archivos y objetos también pueden manejar datos no estructurados en formatos de acceso a objetos que son el resultado de sus orígenes en la Nube, como Amazon S3.
¿Qué deben buscar los clientes en un producto rápido de almacenamiento de archivos y objetos?
En primer lugar, la capacidad. La plataforma debe adaptarse a sus necesidades, que para muchas empresas podrían ser petabytes. Dado que los datos no estructurados pueden crecer rápidamente, escalar la solución también debe ser fácil y no implicar una configuración de red compleja o tareas manuales de reequilibrio de datos.
En segundo lugar, debe tener acceso al almacenamiento de archivos y objetos, ofreciendo los protocolos clave como NFS y SMB para archivos y S3 para acceso a objetos.
En tercer lugar, debe construirse para un acceso rápido y un alto rendimiento. Se requiere baja latencia, especialmente para operaciones de lectura y acceso a metadatos, para desbloquear el potencial de AI/ML, así como muchos marcos de análisis modernos. El almacenamiento all-flash ofrece este acceso rápido gracias a su naturaleza de estado sólido.
La velocidad es clave
Ya sea para analizar conjuntos de datos muy grandes o para realizar una operación de restauración masiva después de un ataque de ransomware, los datos no estructurados pueden requerir un rendimiento de acceso muy alto. Por ejemplo, cuando se trata de restaurar sistemas después de una interrupción o un ataque de ransomware, los clientes empresariales deben buscar números de rendimiento que se acerquen a los 300 TB por hora, para limitar el tiempo de inactividad y el daño financiero y de reputación que conlleva.
El mundo del almacenamiento de datos realmente se está embarcando en los locos años veinte. Las plataformas rápidas de almacenamiento de archivos y objetos son la respuesta a los desafíos de datos actuales y futuros, y están diseñadas para ayudar a las empresas a aprovechar el valor de los datos no estructurados.


