tgoop.com/the_developer_guide/5703
Last Update:
ุฏุฑุฏุดุฉ ุณุฑูุนุฉ ุนู ูุธููุฉ Site Reliability Engineer โก๏ธ
.
.
ุฒู
ุงู (ูุจู ู
ุง ูุธูุฑ ู
ุตุทูุญ SRE)ุ ูู
ุง ุฃู ุดุฑูุฉ ูุงูุช ุชุจูู ุณูุณุชู
ูุจูุฑ โ ู
ุซููุง web app ุฃู service ูููุง ู
ูุงููู ุงูู Users โ ูุงู ููู ุฏุงูู
ูุง ูุตู ูุงุถุญ ุจูู ูุฑูููู:
1- ุงูู Developers: ุงููุงุณ ุงููู ุจุชูุชุจ ุงูููุฏ ูุชุถูู Features ุฌุฏูุฏุฉ.
2- ุงูู Operations / SysAdmins: ุงููุงุณ ุงููู ู
ุณุคููุฉ ุนู ุชุดุบูู ุงูุณูุณุชู
ุ ุงูู moniteringุ ุงูู serversุ ุงูู uptimeุ ุฅูุฎ.
ูุงููุฑูููู ุฏูู ูุงููุง ูู ุญุฑุจ ู
ุณุชู
ุฑุฉ ุฏุงูู
ูุงุ ุงูู Developer ุนุงูุฒ ูู release features ุจุณุฑุนุฉ ููุฑูุญ ุฏู
ุงุบูุ ูุงูู Ops ุนุงูุฒ ุงูุณูุณุชู
ููุถู ุซุงุจุชุ ุนูุดุงู ูุฏู ุจููุฑู ุฃู ุชุบููุฑุงุช ู
ูุงุฌุฆุฉ.
ูุทุจุนูุง ุฏู ููุฃุซุฑ ุนูู ุงูุจูุฒูุณ ุจุดูู ุนุงู
ูุนูู ุทุจูุนุฉ ุงูุดุบู ูู ุงูุดุฑูุฉ ูููุง ุชุฏุฎูุช ุฌูุฌู ูุนู
ูุช ูุธููุฉ ุฌุฏูุฏุฉ ุงุณู
ูุง Site Reliability Engineer
โโโ
๐ ูุนูู ุฅูู SREุ
ุจุจุณุงุทุฉุ ุงูู Site Reliability Engineering ูู ุทุฑููุฉ ูุชุทุจูู ู
ุจุงุฏุฆ ุงูู Software Engineering ุนูู ู
ุดุงูู ุงูู Operations.
ูุนูู ุจุฏู ู
ุง ุชุนุชู
ุฏ ุนูู manual workุ ูุฎูู ูู ุญุงุฌุฉ automatedุ measuredุ ูู
ุจููุฉ ุนูู data ูุงูุนูุฉ.
ุงูู SRE Engineer ุจูููู ูู ุงููุต ุจูู ุงูู Developers ูุงูู Ops. ูู ู
ููุฏุณ ูุงูู
ุงูู
ูุธูู
ุฉ ูููุง ู
ู ุฃูู ุงูููุฏ ูุญุฏ ุงูู production.
โโโ
โ๏ธ ุดุบู ุงูู SRE ู
ูุณู
ูุญุงุฌุชูู ุฃุณุงุณูุชูู:
1- ุงูู Reliability: ูุชุฃูุฏ ุฅู ุงูุณูุณุชู
ุดุบุงู ุจุซุจุงุชุ ู
ููุด downtimeุ ููู ุญุงุฌุฉ monitored.
2- ุงูู Velocity: ูุชุฃูุฏ ุฅู ุงูู teams ุชูุฏุฑ ุชู deploy ุจุณุฑุนุฉ ูุขู
ุงู ุจุฏูู ู
ุง ุงููุธุงู
ูุจูุธ.
โโโ
๐ก ุจุนุถ ุงูู
ูุงููู
ุงูุฃุณุงุณูุฉ ูู ุนุงูู
ุงูู SRE:
1. SLI / SLO / SLA
- ุงูู SLI (Service Level Indicator): ู
ููุงุณ ูุฃุฏุงุก ุงูุณูุณุชู
ุ ุฒู ู
ุซููุง latency ุฃู availability.
- ุงูู SLO (Service Level Objective): ุงููุฏู ุงููู ุนุงูุฒูู ูุญุงูุธ ุนูููุ ุฒู ุฅู ุงูู uptime ูููู 99.9%.
- ุงูู SLA (Service Level Agreement): ุงูุงุชูุงู ุงููู ุงูุดุฑูุฉ ุจุชุฏูู ููุนู
ูุงุกุ ููู ูุณุฑุชู ู
ู
ูู ูุญุตู penalties.
ุงูู SRE ุจูุชุงุจุน ุงูู SLI ุนุดุงู ูุชุฃูุฏ ุฅููุง ุฏุงุฎู ุงูู SLOุ ููู ูุฑุจูุง ููุณุฑู ุจูููู ุฃู ุชุบููุฑุงุช ูุญุฏ ู
ุง ุงูุฏููุง ุชุณุชูุฑ.
โโ
2. Error Budget
ุจุฏู ู
ุง ุชู
ูุน ุงูุชุบููุฑ ุชู
ุงู
ูุงุ ุฎูู ููู ู
ูุฒุงููุฉ ููุฃุฎุทุงุก ุนู ูุฑูู ุงูู Development. ู
ุซููุงุ ูู ุงูู SLO ุจุชุงุนู 99.9%ุ ูุจูู ุนูุฏู 0.1% downtime ู
ุณู
ูุญ ุจูู.
ูู ูุณู ุงูู
ูุฒุงููุฉ ุฏู ู
ูุฌูุฏุฉ: ู
ู
ูู ุชู deploy features.
ูู ุฎูุตุช: ุชููู ูู ุญุงุฌุฉ ูุญุฏ ู
ุง ุงููุธุงู
ูุณุชูุฑ.
โโ
3. Monitoring & Alerting
ุงูู SRE ุจูุจูู ุฃูุธู
ุฉ monitoring ุฐููุฉ ุชู detect ุงูู
ุดุงูู ูุจู ู
ุง ุงูู
ุณุชุฎุฏู
ูุญุณ ุจููุง. ูุจูุนู
ู alerts ู
ุจููุฉ ุนูู ุงูู SLO ู
ุด ุนูู noise. ูุนูู ู
ุด ูู Warning ุชุจูู Alert.
โโ
4. Incident Management
ูู
ุง ุงูุฏููุง ุชูุนุ ุงูู SRE ุจูููุฏ ุนู
ููุฉ ุงูู incident response ููุญุฏุฏ ุงูู
ุดููุฉุ ููุตูุญูุงุ ูุจุนุฏูุง ูุนู
ู ุญุงุฌุฉ ุงุณู
ูุง Postmortem โ ุชุญููู ุจุนุฏ ุงูู
ุดููุฉ ุนุดุงู ูุชูุงุฏู ุชูุฑุงุฑูุง.
โโ
5. Automation
ูู ุญุงุฌุฉ ู
ู
ูู ูุชุนู
ููุง automation:
- deployment
- scaling
- recovery
- testing
- monitoring
โโโ
๐ฏ ุงูู
ูุงุฑุงุช ุงููู ูุงุฒู
ุชููู ุนูุฏ ุฃู SRE ู
ุญุชุฑู
:
- ููู
ุนู
ูู ููู Linux systems
- ุฎุจุฑุฉ ูู Cloud platforms (AWS / GCP / Azure)
- ู
ุนุฑูุฉ ูููุฉ ุจู Networking ู Load Balancing
- ุฃุฏูุงุช ุฒู Prometheus, Grafana, Kubernetes, Terraform, Jenkins
- ู
ูุงุฑุงุช ูู Scripting (Python / Bash / Go)
- ูุฃูู
ุญุงุฌุฉ: problem-solving ู communication skills ู
ู
ุชุงุฒุฉ.
โโโ
ููููู
ุงููู ููู ุฎูุฑ ๐ฟ
BY DevGuide ๐ต๐ธ
Share with your friend now:
tgoop.com/the_developer_guide/5703