Trong bài này, chúng ta sẽ tìm hiểu sơ qua về cấu trúc giá của Google Cloud. Google là nhà cung cấp đám mây đầu tiên cung cấp dịch vụ thanh toán theo giây cho các Cơ sở hạ tầng dưới dạng dịch vụ (IaaS), dịch vụ và công cụ điện toán đám mây. Nếu bạn chưa biết IaaS là gì thì mình có giải thích ở bài 2. Ngoài ra, tính năng thanh toán theo giây hiện cũng được áp dụng cho Google Kubernetes Engine, Container Engine, Cloud Dataproc và App Engine.
Khi thời gian bạn chạy instance vượt hơn 25% của tháng đó, thì Compute Engine sẽ tự động giảm giá cho mỗi phút tăng thêm của instance này. Ngoài ra, bạn cũng có thể tuỳ chỉnh lượng tài nguyên mà ứng dụng sử dụng để tối ưu mức giá và khối lượng công việc.
Google Cloud cũng có một trang web giúp bạn tính toán chi phí là Google Cloud Calculator.
Câu hỏi mà mình nghĩ nhiều bạn sẽ đặt ra khi tìm hiểu về chủ đề này là Làm sao để Google Cloud không tiêu quá nhiều tiền hoặc vượt ngưỡng thanh toán?
Thật ra có rất nhiều giải pháp cho câu hỏi này, nhưng mình chỉ giới thiệu 4 giải pháp chính là Budgets, Alerts, Reports, và Quotas.
Đầu tiên là sử dụng Budgets (ngân sách) ở cấp tài khoản thanh toán hoặc ở cấp dự án. Budgets có thể là một giới hạn cố định hoặc linh hoạt theo một vài số liệu khác, ví dụ như phần trăm chi tiêu của tháng trước.
Bạn cũng có thể sử dụng Alerts (cảnh báo) để được thông báo khi chi phí đạt đến giới hạn ngân sách. Ví dụ: giới hạn ngân sách là 20 triệu và Alerts được đặt ở mức 90% thì bạn sẽ nhận được cảnh báo khi chi phí đạt tới 18 triệu. Alerts thường đượt đặt ở mức 50%, 80% nhưng bạn cũng có thể tuỳ chỉnh con số này.
Reports là một công cụ trực quan trong Google Cloud console, cho phép bạn theo dõi chi phí dựa trên dự án hoặc dịch vụ.
Cuối cùng, Quotas (giới hạn) được sử dụng để ngăn chặn dịch vụ sử dụng quá nhiều tài nguyên do lỗi hoặc các cuộc tấn công nhằm vào ứng dụng. Có 2 loại quotas là Rate quota và Allocation quota. Cả 2 đều được áp dụng ở cấp độ dự án. Rate quota (giới hạn tỷ lệ) được đặt lại sau một thời gian cụ thể. Ví dụ: GKE có quota là 3.000 lệnh call API trong 100 giây từ mỗi dự án Google Cloud. Sau 100 giây thì giới hạn này được đặt lại. Allocation quota (giới hạn phân bổ) chi phối số lượng tài nguyên mà dự án có thể sử dụng. Ví dụ: Theo mặc định, mỗi dự án Google Cloud có giới hạn phân phổ không quá 15 mạng VPC.