同時処理
コンピュートリソースとストレージリソースを分離しており、複数のワークロードを競合なく、同時に処理できる
クラウド向けに構築されたデータウェアハウス
Snowflakeのイメージは掴めましたでしょうか。
クラウドベースで構築されているSnowflakeには、以下のような特長があります。
コンピュートリソースとストレージリソースを分離しており、複数のワークロードを競合なく、同時に処理できる
コンピュートリソースは必要な時に必要なだけ利用することができる
システムを停止しなくてもスケールアップ・スケールアウトが可能
オートスケール機能により、増減する同時アクセスにも柔軟に対応
インフラ部分はSnowflake社が運用するので、従来のようにDWH基盤の保守・運用を気にする必要がない
他にもたくさんの特長がありますが、最も強調したいのが『高性能なのに低価格』という点です。
Fivetran社が実施した”Amazon Redshift”や”Google BigQuery”等と性能を比較したベンチマークテストの結果から、価格性能比でSnowflakeが最も優れているという事がよく分かります。
Fivetran社が実施したベンチマークテスト結果
https://fivetran.com/blog/warehouse-benchmark
Snowflakeの価格体系は非常にシンプルに構成されています。
まず、Snowflakeでは、上に述べたようにコンピュートリソースとストレージリソースが分離されているため、それぞれ別々に稼働した分だけ課金されます。
ウェアハウスのサイズは8種類(X-Small、Small、Medium、Large、X-Large、2X-Large、3X-Large、4X-Large)用意されており、上位サイズにいくにつれて処理性能・時間単価がそれぞれ2倍ずつになっていきます。
ウェアハウスサイズ | Servers / Cluster (処理性能) | Credits / h (時間単価) |
X-Small | 1 | 1 |
Small | 2 | 2 |
Medium | 4 | 4 |
Large | 8 | 8 |
X-Large | 16 | 16 |
2X-Large | 32 | 32 |
3X-Large | 64 | 64 |
4X-Large | 128 | 128 |
この課金モデルでは、ウェアハウスサイズを大きくしても処理時間がその分短くなるので、1タスク当たりのコストは変わりません。例えば、X-Smallで128分掛かるタスクを4X-Largeで実行すると1分で終了するため、それぞれの時間単価を掛けた時のコストはどちらも128となります。
つまり、これをうまく活用することで、大きいタスクが走る時間帯にサイズを上げ、逆にタスクが少ない時間帯はサイズを下げる等の運用ができるようになり、コストを抑えつつもハイパフォーマンスなDWH環境を常に提供することができるようになるのです。
ウェアハウスの課金モデルに出てきたクレジット(Credits)ですが、単価はクラウドプロバイダ、リージョン、Snowflakeのエディションによって異なります。また、料金体系は秒単位の従量課金のオンデマンドと事前購入するキャパシティ(クレジット数に応じて割引がある)の2種類が用意されています。
AWS USリージョンの場合のクレジット単価及びストレージ費用は以下となります。
Standard Edition | Premier Edition | Enterprise Edition | Business Critical | Virtual Private Snowflake | |
オンデマンド – US | |||||
コンピュート | $2.00/hr | $2.25/hr | $3.00/hr | $4.00/hr | Contact |
ストレージ | $40/TB/mo | ||||
キャパシティ – US | |||||
コンピュート | Contact | Contact | |||
ストレージ | $23/TB/mo |
また、Snowflakeには1ヶ月で400ドル分のリソースを無料で利用することができるトライアルが用意されています。以下の記事でトライアルの始め方を解説していますので、併せて御覧ください。
ブログで最新情報を発信しています