Para 2025, Deloitte prevé un volumen anual de 175 zettabytes de datos a nivel internacional y la Comisión Europea calcula que el mercado de big data podría alcanzar un valor de 829 mil millones de euros. Si quieres hacer carrera dentro de este campo, Daniel Restrepo, ingeniero senior de Big Data en SoftServe, comparte una lista de libros que te guiarán:
1. Fundamentals of data engineering: Plan and build robust data systems
Los expertos Joe Reis y Matt Housley enseñan a planificar, diseñar y construir sistemas de datos valiosos. Muestran los principios de una arquitectura de datos eficaz y una visión de la ingeniería de datos a nivel medio-alto. Profundizan en las tendencias emergentes, destacan nuevas perspectivas, los fundamentos de Azure Data y servicios en la nube.
2. Data engineering with Python
Guía sobre las complejidades del diseño e implementación de pipelines y la conectividad de las bases de datos. La lectura introduce en las técnicas ETL; aporta una habilidad crítica para convertir datos sin procesar en perspectivas significativas, ofrece implementos para agilizar el flujo, explora la personalización de las canalizaciones y pone de relieve la flexibilidad de Python.
3. The datapreneurs, the promise of AI and the creators building our future
Bob Muglia desentraña cómo la simbiosis entre el ingenio humano y los datos digitales es la piedra angular para la nueva era de la inteligencia artificial. Incluye voces de expertos del sector y líderes de opinión. Presenta una visión profunda de los beneficios y riesgos potenciales, además de cuestiones éticas y sociales.
4. Learning Spark (2ª edición)
Se adentra en la manipulación de datos y el descubrimiento de conocimiento, a través de conceptos y aplicaciones que encarna Apache Spark. Los autores exponen la esencia de los Resilient Distributed Datasets y la resiliencia del framework con su arquitectura distribuida. El texto despliega los estándares API DataFrame, Dataset y Spark SQL, la transmisión estructurada y el aprendizaje automático con MLlib.