Un ingeniero de fiabilidad de sitios web se encarga de que las aplicaciones y los sitios web funcionen sin problemas y de forma confiable. Obtén más información sobre esta carrera emergente y las habilidades que necesitarás para empezar.
Read in English. (Leer en inglés.)
Un ingeniero de fiabilidad del sitio (site reliability engineer, SRE) garantiza que los sitios web sean más fiables, eficientes y escalables. Ayudan a crear soluciones automatizadas para mejorar los aspectos operativos del sitio. Como cada vez realizamos más tareas en línea en nuestra vida cotidiana, es cada vez más importante mantener estas tecnologías en funcionamiento. Echemos un vistazo a esta carrera emergente, incluyendo las habilidades que necesitas para empezar.
Los SREs empezaron a aparecer en 2003 cuando Google formó un equipo de ingenieros de software con el único propósito de mejorar la fiabilidad y la escalabilidad de los sitios de la empresa. El enfoque fue tan eficaz que otras empresas tecnológicas líderes, como Netflix y Amazon, pronto siguieron su ejemplo.
El papel de un site reliability engineer garantiza que un sitio tenga las funciones necesarias para proporcionar a los usuarios los servicios solicitados. En el mundo automatizado de hoy, esto incluye la creación de herramientas de autoservicio que proporcionen mayor disponibilidad, rendimiento y eficiencia a los usuarios.
Según el vicepresidente de ingeniería de Google, Ben Treynor, SRE es "lo que ocurre cuando se pide a un ingeniero de software que diseñe una función de operaciones". La mayoría de los SREs dedican su tiempo a tareas de operaciones y proyectos de desarrollo (desarrollo de nuevas funciones, automatización de procesos, escalado de sistemas, etc.).
Las tareas y deberes de los roles de ingeniería de fiabilidad del sitio podrían incluir:
Asesorar y entrenar a los ingenieros junior
Realizar revisiones después de los incidentes
Codificación de la automatización dentro de la infraestructura del sitio
Documentar su trabajo para convertir los hallazgos en acciones repetibles
Anticiparse a los posibles problemas antes de que se produzcan (y proponer soluciones)
Colaborar con los desarrolladores de software, los ingenieros y los equipos de operaciones
Supervisar los sitios y el software para asegurarse de que funcionan correctamente (incluidos los turnos de guardia)
Las disciplinas de los site reliability engineers y DevOps se solapan en muchos aspectos, pero también tienen una diferencia clave. Los equipos de DevOps definen lo que hay que hacer para minimizar las diferencias entre el desarrollo de software y las operaciones. Los equipos de SRE traducen los pilares de DevOps en prácticas. Si DevOps es el "qué", SRE es el "cómo".
El éxito en este papel a menudo implica ser un solucionador de problemas proactivo con un ojo para la ingeniería y el desarrollo de software. Estas son algunas de las habilidades que te servirán en este trabajo:
Comprensión del desarrollo y las operaciones
Familiaridad con los sistemas de supervisión de la producción
Atención al detalle
Habilidades analíticas y de resolución de problemas
Capacidad para colaborar con equipos multifuncionales
Codificación en Java, Python, Perl o Ruby
Capacidad de redacción técnica
La ingeniería de fiabilidad del sitio es típicamente un papel de nivel medio, una buena opción para aquellos con algunos años de experiencia como administrador de sistemas o desarrollador de software. La mayoría de las empresas exigen una licenciatura en informática o un campo relacionado. También son ventajosas las certificaciones adicionales y la experiencia con diferentes códigos de funcionamiento y programación.
Si estás empezando, un puesto de nivel junior en un equipo de ingeniería de fiabilidad de sitios es una buena manera de aprender y crecer. En este entorno de colaboración, puedes trabajar con otros para resolver problemas mientras desarrollas tus habilidades. A medida que ganes experiencia y conocimientos técnicos, podrás avanzar en tu carrera hacia puestos más altos.
Desarrolla las habilidades que necesitarás como SRE con Site Reliability Engineering: Measuring and Managing Reliability, ofrecido por Google Cloud en Coursera. Desarrolla una comprensión más profunda de cómo se utilizan los indicadores de nivel de servicio (service level indicators, SLI) y los objetivos de nivel de servicio (service level objectives, SLO) para gestionar y medir la fiabilidad. Al finalizar el curso, tendrás un certificado para compartir en tu currículum.
Writer
Coursera is the global online learning platform that offers anyone, anywhere access to online course...
This content has been made available for informational purposes only. Learners are advised to conduct additional research to ensure that courses and other credentials pursued meet their personal, professional, and financial goals.
These cookies are necessary for the website to function and cannot be switched off in our systems. They are usually only set in response to actions made by you which amount to a request for services, such as setting your privacy preferences, logging in or filling in forms. You can set your browser to block or alert you about these cookies, but some parts of the site will not then work.
These cookies may be set through our site by our advertising partners. They may be used by those companies to build a profile of your interests and show you relevant adverts on other sites. They are based on uniquely identifying your browser and internet device. If you do not allow these cookies, you will experience less targeted advertising.
These cookies allow us to count visits and traffic sources so we can measure and improve the performance of our site. They help us to know which pages are the most and least popular and see how visitors move around the site. If you do not allow these cookies we will not know when you have visited our site, and will not be able to monitor its performance.
These cookies enable the website to provide enhanced functionality and personalization. They may be set by us or by third party providers whose services we have added to our pages. If you do not allow these cookies then some or all of these services may not function properly.