目录:
定义-站点可靠性工程(SRE)是什么意思?
站点可靠性工程(SRE)是一种网站运营方法,它使用软件工程中的技术来构建更可靠的网站。 网站可靠性工程于2003年在Google首次开发。该术语与DevOps有关,DevOps还将软件工程与系统管理结合在一起,但DevOps涉及自动执行手动任务。
Techopedia解释了站点可靠性工程(SRE)
站点可靠性工程涉及使用软件工程技术,包括算法,数据结构,性能和编程语言,以实现高度可靠的Web应用程序。 该方法于2003年在Google上首次开发。
Google工程副总裁Ben Traynor在接受采访时说,该公司为其SRE团队雇用了50-50名具有软件工程和系统管理背景的人员。 Google将小型SRE团队分配给主要项目。 Traynor将Google出色的正常运行时间归因于许多网站运营活动的自动化。 尽管偶尔会发生故障,但由于SRE团队已预先自动化了许多任务,因此可以快速修复。
Google还从角色扮演游戏中汲取了灵感,它通过结构化的操作准备演练来测试需要自动化的故障情况下的工程师。 该公司称这些练习为“不幸之轮”,其中一名员工扮演系统的角色,而一名则扮演待命工程师的角色。 Traynor说,这种方法使工程师比传统钻头更能考虑可靠性。
SRE与DevOps相似,但后者主要关注于自动化系统的总体部署,而SRE则专门针对可靠性。
