Un ingeniero de fiabilidad de sitios web se encarga de que las aplicaciones y los sitios web funcionen sin problemas y de forma confiable. Obtén más información sobre esta carrera emergente y las habilidades que necesitarás para empezar.
Read in English. (Leer en inglés.)
Un ingeniero de fiabilidad del sitio (site reliability engineer, SRE) garantiza que los sitios web sean más fiables, eficientes y escalables. Ayudan a crear soluciones automatizadas para mejorar los aspectos operativos del sitio. Como cada vez realizamos más tareas en línea en nuestra vida cotidiana, es cada vez más importante mantener estas tecnologías en funcionamiento. Echemos un vistazo a esta carrera emergente, incluyendo las habilidades que necesitas para empezar.
Los SREs empezaron a aparecer en 2003 cuando Google formó un equipo de ingenieros de software con el único propósito de mejorar la fiabilidad y la escalabilidad de los sitios de la empresa. El enfoque fue tan eficaz que otras empresas tecnológicas líderes, como Netflix y Amazon, pronto siguieron su ejemplo.
El papel de un site reliability engineer garantiza que un sitio tenga las funciones necesarias para proporcionar a los usuarios los servicios solicitados. En el mundo automatizado de hoy, esto incluye la creación de herramientas de autoservicio que proporcionen mayor disponibilidad, rendimiento y eficiencia a los usuarios.
Según el vicepresidente de ingeniería de Google, Ben Treynor, SRE es "lo que ocurre cuando se pide a un ingeniero de software que diseñe una función de operaciones". La mayoría de los SREs dedican su tiempo a tareas de operaciones y proyectos de desarrollo (desarrollo de nuevas funciones, automatización de procesos, escalado de sistemas, etc.).
Las tareas y deberes de los roles de ingeniería de fiabilidad del sitio podrían incluir:
Asesorar y entrenar a los ingenieros junior
Realizar revisiones después de los incidentes
Codificación de la automatización dentro de la infraestructura del sitio
Documentar su trabajo para convertir los hallazgos en acciones repetibles
Anticiparse a los posibles problemas antes de que se produzcan (y proponer soluciones)
Colaborar con los desarrolladores de software, los ingenieros y los equipos de operaciones
Supervisar los sitios y el software para asegurarse de que funcionan correctamente (incluidos los turnos de guardia)
Las disciplinas de los site reliability engineers y DevOps se solapan en muchos aspectos, pero también tienen una diferencia clave. Los equipos de DevOps definen lo que hay que hacer para minimizar las diferencias entre el desarrollo de software y las operaciones. Los equipos de SRE traducen los pilares de DevOps en prácticas. Si DevOps es el "qué", SRE es el "cómo".
El éxito en este papel a menudo implica ser un solucionador de problemas proactivo con un ojo para la ingeniería y el desarrollo de software. Estas son algunas de las habilidades que te servirán en este trabajo:
Comprensión del desarrollo y las operaciones
Familiaridad con los sistemas de supervisión de la producción
Atención al detalle
Habilidades analíticas y de resolución de problemas
Capacidad para colaborar con equipos multifuncionales
Codificación en Java, Python, Perl o Ruby
Capacidad de redacción técnica
La ingeniería de fiabilidad del sitio es típicamente un papel de nivel medio, una buena opción para aquellos con algunos años de experiencia como administrador de sistemas o desarrollador de software. La mayoría de las empresas exigen una licenciatura en informática o un campo relacionado. También son ventajosas las certificaciones adicionales y la experiencia con diferentes códigos de funcionamiento y programación.
Si estás empezando, un puesto de nivel junior en un equipo de ingeniería de fiabilidad de sitios es una buena manera de aprender y crecer. En este entorno de colaboración, puedes trabajar con otros para resolver problemas mientras desarrollas tus habilidades. A medida que ganes experiencia y conocimientos técnicos, podrás avanzar en tu carrera hacia puestos más altos.
Desarrolla las habilidades que necesitarás como SRE con Site Reliability Engineering: Measuring and Managing Reliability, ofrecido por Google Cloud en Coursera. Desarrolla una comprensión más profunda de cómo se utilizan los indicadores de nivel de servicio (service level indicators, SLI) y los objetivos de nivel de servicio (service level objectives, SLO) para gestionar y medir la fiabilidad. Al finalizar el curso, tendrás un certificado para compartir en tu currículum.
Writer
Coursera is the global online learning platform that offers anyone, anywhere access to online course...
This content has been made available for informational purposes only. Learners are advised to conduct additional research to ensure that courses and other credentials pursued meet their personal, professional, and financial goals.