Del curso: Fundamentos de la ingeniería de datos
Accede al curso completo hoy mismo
Únete hoy para acceder a más de 25.000 cursos impartidos por expertos del sector.
Ecosistema Hadoop
Del curso: Fundamentos de la ingeniería de datos
Ecosistema Hadoop
Dentro de las herramientas que deberás conocer se encuentra Apache Hadoop. Esta tecnología se desarrolló con el objetivo de tener un almacén de datos redundante y económico que permitiera a las organizaciones aprovechar big data analytics económicamente y aumentar la rentabilidad del negocio. Un diseño arquitectónico de Hadoop debe tener varios factores de diseño en términos de redes, potencia informática y almacenamiento. Hadoop proporciona un marco de big data de computación confiable, escalable, flexible y distribuido. La arquitectura Hadoop permite el procesamiento paralelo de datos utilizando varios componentes. Sistema de archivos distribuidos Hadoop o Hadoop Distributed File System, o HDFS por sus siglas en inglés, está basado en Java y permite almacenar grandes conjuntos de datos en los nodos de un clúster con tolerancia a fallos. Hadoop YARN, otro negociador de recursos más, o Yet Another Resource Negotiator en inglés, que ayuda a la gestión de recursos en el clúster de…
Practica mientras aprendes con los archivos de ejercicios.
Descarga los archivos que el instructor utiliza para enseñar el curso. Sigue las instrucciones y aprende viendo, escuchando y practicando.