Treasure Data Platform で始めるデータ分析入門 〜1. イントロダクション〜
はじめに
これから全7回に渡ってTreasure Data Platformを使ったデータ分析の紹介をします。教科書はこちらになります。
本シリーズの目的は2つ。
- Treasure Data Platform Service の概要を理解してもらう。
- 本シリーズを理解すればデータ分析が誰でも容易にレポーティングが可能になる。
今やデータサイエンティスト() という言葉は,高度な分析手法を駆使してあらゆる問題を解決するプロフェッショナル集団という響きがありますが,それは本質ではありません。データサイエンティストの本質は,
- 意思決定者(経営者,ディレクター,マネージャー)が容易に理解できるようなシンプルかつ説得力のある分析結果を提供することができること,
- データ収集からレポーティングまでの,分析のあらゆるレイヤーを深く理解し,適切なツールで一気通貫した分析プラットフォームを構築すること,
にあります。
前者について,データ分析のゴールは高度な分析結果を導き出すことではありません。その分析結果をもって意思決定者がサービスや経営の改善につながる示唆を与えることです。意思決定者は分析に精通しているとは限りません。よって分析結果はシンプルかつアクショナブルなものでないといけません。いくら高度な手法をもって有効な分析結果をもたらせるものでも,彼らに理解してもらえなければそれは単なる時間の浪費でしかありません。
後者について,「データ分析」という言葉は「データを分析ツールに取り込んでレポーティングすること」という意味合いで使われますが,実はもっと多くの含みを持っています。そもそも分析に使うデータはどこからやってくるのでしょうか?それらのデータはデータベースなどのストレージからクエリを投げて切り出されたものです。ではストレージに蓄えられているデータはどこからやってくるのでしょうか?それはアプリケーションなどのあらゆるデータソースから発生するローデータをインフラエンジニアがネットワークを通してストレージに定期的に流すことによってやってくるのです。データ分析を行うというのはそういったデータの源泉および上流を理解し,インフラエンジニア,データベースエンジニアと連携して進めていくものであるのです。
本シリーズではデータ分析を以下の6つのレイヤーに分解し,各々について解説していくものとします。
本シリーズではデータ分析を以下の7つのレイヤーに分解し,各々について解説していくものとします。(Slide Shareの資料は常時更新されます。)
- Data Collection
- Data Storage
- Data Management
- Data Processing
- Data Processing Design Part.1 Part.2 Part.3 Part.4 Part.5 Part.6
- Data Visualization Treasure Viewer, MetricInsights, Tableau
- Data Visualization Patterns Part.1 Part.2 Part.3
データ分析のツールとして Treasure Data Platform を用いるモチベーションは,この6つのレイヤーを一気通貫して提供できる唯一の存在であり,最低限の人的リソースでデータ分析を完結できることによるものです。
Treasure Data Platform は分析に必要なあらゆるレイヤーを一気通貫して提供します。
サービス紹介
Treasure Dataはクラウド上に巨大なデータストレージと分散可能な計算ノードを持ち,あらゆる業種のデータ分析を協力にサポートします。
Treasure Dataを使うメリットは,データ収集からレポーティングまでのツールを全て提供すること,クラウド上にサービスを展開することによって即座に分析が開始できること,コストも大幅に削減することができることにあります。
Value Proposition は以下の3つ。
- Faster time to Value
- Cloud Flexibility and Economics
- Simple and Well Supported
サービスの詳細な説明は弊社CTOのインタビューをご覧下さい。
【連載・視点】ビッグデータ収集から解析まで一手に行う注目株……トレジャーデータ | RBB TODAY
次回は,1. Data Storage について解説します。