shohei_anzai1のブログ (original) (raw)
1.パフォーマンスが悪いとなぜいけないのですか?
- 答えを得るのに時間がかかる
- フローに乗れない
- イライラする
- 本当のTaskを忘れる
<要点>
一般的なものを選択する
2.表計算はどこで処理されますか?
- データベース
- Tableau
<要点>
Tableau側で計算されます
3.JOIN(結合)はどこで処理されますか?
- データベース
- Tableau
<要点>
データベース側。データソース画面で操作します。
4.Tableau Desktopで表示が遅くてもTableau Serverで高速に表示できる
- 正しい
- 誤り
<要点>
Desktopで遅ければ、Serverで早くなることはない
5.次の内Tableauのシートで作業する前に件数を減らせるフィルターを選びなさい
- ディメンションフィルター
- 抽出フィルター
- コンテキストフィルター
- データソースフィルター
<要点>
フィルターの優先度の順番。(上に行くほど影響大)
コンテキストフィルター以下はワークシート上で働き、以上はワークブック(ワークシートの集まった1つのまとまり)全体に働く。
6.データの集計が遅い場合、DBで事前にテーブルを準備してもよい
- 正しい
- 誤り
<要点>
DB上で事前にテーブルを準備しておけばTableau上での必要な処理が少なくなり、集計も早くなる。
7.売上のトランザクションデータと地域マネージャーのマスターデータのテーブルがある。これらのテーブルは同じスキーマ内に存在している。一般的に適切と思われる結合方法はどれか?
- 結合
- ブレンディング
- クロスデータベース結合
<要点>
同じスキーマ内(同じファイル内)というところがポイント。
8.売上のトランザクションデータと在庫のトランザクションのテーブルがある。これらのテーブルは別のデータベースに存在しており、異なる粒度でデータが格納されている。商品単位での売り上げと在庫とを比較したい場合、一般的に適切と思われる結合方法はどれか?
- 結合
- ブレンディング
- クロスデータベース結合
<要点>
異なる粒度でデータが格納されている(別ファイル)というところがポイント。
9.ライブ接続と抽出接続について正しいものを答えなさい
- ライブ接続は抽出接続より必ず早い
- 抽出接続はライブ接続より必ず早い
- ライブ接続が早いか、抽出接続が早いかはケースバイケースである
<要点>
接続方法以外にも様々な要因に依存するためどちらが必ず早いということは言えない
10.抽出は必要な粒度で集計した状態で作成することができる
- 正しい
- 誤り
<要点>
抽出時に条件でフィルターをかけたり、サンプリングしてデータ量を少なくしたりすることが可能。
→必要な粒度で集計可能
11.行レベル計算を内包する集計計算を作成するときは
- 計算式を分けて記載する
- 一つの計算式にまとめる
<要点>
長い計算式はわかりにくくなるので、分けて記載した方が良い。
行レベル計算と集計計算を分割
→行レベルの計算を1つ目の計算フィールドに、集計計算を2つ目の計算フィールドに
12.地域項目の中に入っている値「北海道」と「東北地方」を表示上「北日本」エリアとしてまとめたい。適切な方法はどれか?
- 元データの「北海道」と「東北地方」を「北日本」に置換する
- グループ化して別名をつける
- 右のような計算式を作成: IF [地域]="北海道" OR [地域]="東北地方" THEN "北日本" ELSE [地域] END
<要点>
元データはいじらずにグループ化できる。
計算式を書くよりも、Tableauのネイティブ機能(既存で使える機能)を使った方が処理速度が速い。
計算式でしか対応できない場合に計算式を書くようにする。
13.最も速く処理できるデータ型を選びなさい
※一般的なプログラミング言語やシステムについてではなく、Tableauの計算フィールドのパフォーマンスについて回答してください。
- ブール型 例: 0真 1偽
- 整数型
- 文字列型
<要点>
速い順に【整数型】>【ブール型】>【文字列型】
14.日付の列に「2019年06月06日」という形式でデータが入っており、文字列として取り込まれた。日付型に直す方法として最初に試すべきことは?
- 計算式を作成する:DATE(LEFT(STR([日付]),4) + “-“ + MID(STR([日付]),5,2) + “-“ + RIGHT(STR([日付]),2))
- 計算式を作成する: DATEPARSE("yyyy年MM月dd日",[日付])
- 文字列型になっているデータ型をそのままDate型に変更する
<要点>
とりあえずそのままDate型に変更してみる
→8桁の数字等であればこれで出来る可能性が高い
15.日付のフィルターを作成したい。一番パフォーマンスがいいのは?
- 不連続フィルター
- 連続型の範囲フィルター
- 相対日付フィルター
<要点>
パフォーマンスの良い順に【相対日付フィルター】>【連続型の範囲フィルター】>【不連続フィルター】
※不連続は一つ一つデータを取得、範囲フィルターは範囲をまとめてとってくるため、決め打ちの相対日付にパフォーマンスが最も良い。
16.フィルターを自由に選べるように表示しておくことにした。パフォーマンスがよいのは?
- 複数の値(ドロップダウン)
- 複数の値(カスタムリスト)
<要点>
表示する必要のある項目をすべて取得する必要がある為、ドロップダウンは遅い。一方、項目がデータに依存しないクイックフィルター(カスタム)は速い。
17.表示されたフィルターの「関連値のみ」オプションを使用すると
- 表示項目が減るため早くなる
- クエリが増えるため表示が遅くなる
<要点>
表示する必要のある項目をすべて取得する必要がある為、ドロップダウンは遅い。
一方、項目がデータに依存しないクイックフィルター(カスタム)は速い。
18.クエリパイプラインとして正しいものを選びなさい
- 抽出フィルター、データソースフィルター、コンテキストフィルター、FIXED、ディメンションフィルター、EXCLUDE/INCLUDE、メジャーフィルター、表計算フィルター
- データソースフィルター、抽出フィルター、コンテキストフィルター、ディメンションフィルター、FIXED、EXCLUDE/INCLUDE、メジャーフィルター、表計算フィルター
- 抽出フィルター、データソースフィルター、コンテキストフィルター、FIXED、ディメンションフィルター、EXCLUDE/INCLUDE、表計算フィルター、メジャーフィルター
- 抽出フィルター、データソースフィルター、コンテキストフィルター、FIXED、EXCLUDE/INCLUDE、ディメンションフィルター、メジャーフィルター、表計算フィルター
19.Tableauは表示できるデータ量に制限がないため、数万行のテキストテーブルを表示するのが得意である
- 正しい
- 誤り
<要点>
データ量を絞った方がパフォーマンスがよい。
20.ダッシュボードのサイズは
- 表示されるべき形にしっかり固定する
- ユーザーが好きな大きさで見られるよう、自動にしておく
<要点>
作成者の意図が反映されるように固定すべき。
21.パフォーマンスのよいダッシュボードデザインは結果的に人が見たときにもわかりやすいデザインに通じている
- 正しい
- 誤り
<要点>
シンプルでわかりやすいものが基本的にパフォーマンスがよいものとなる
1-1. (サブカテゴリ別円グラフ)のどこが問題ですか?
- 色数が多すぎる
- 角度の違いを識別するのが困難
- ラベルがどこに割り振られているか識別するのが困難
- 色の凡例とグラフの位置が遠い
- タイトルが不明瞭
- 売上のサイズの凡例に意味がない
- サブカテゴリの並び順に意味がない
- 円グラフは常に使うべきではない
<要点>
・色が多すぎてわかりにくい
→多くても7色までにする
・項目が多くそれぞれの割合が分かりにくい
→3項目以上ある場合は円グラフだと識別が困難であるため棒グラフを使用する
・シェアの大きさの順番がバラバラなためわかりにくい
→降順にし、どのサブカテゴリのシェアが大きいのかを分かりやすく明示する
・売上規模の凡例に必要性を感じない
→極力情報を減らし、一目で何が言いたいのかわかりやすくする
1-2. (サブカテゴリ別円グラフ)に新しいタイトルを付けるとしたらどれが最も適切ですか?
- 円グラフ
- 売上金額ランキング
- 売上金額シェア
- サブカテゴリの売上金額ランキング
- サブカテゴリの売上金額シェア
2-1. (サブカテゴリ別売上推移)のどこが問題ですか?
- 色数が多すぎる
- 線が重なってスパゲッティーのようになっている
- 時系列の推移を表現するのに線グラフは適切ではない
- 意味なく同系統の色が使われている
<要点>
・線が絡まりすぎていてわかりにくい
→カテゴリごとにグラフを分ける
→エリアチャートに変え、絡まりをなくす
・凡例の順番がランダムでわかりにくい
→上から順番に並び変える
2-2. (サブカテゴリ別売上推移)の線の絡まりを少しでもほどく表現方法はどれですか?
- ランクチャートにする
- 月の推移ではなく年月の推移にする
- カテゴリごとに行を分ける
- エリアチャートにしてスタックマークをオンの状態で表示する
3-1. (予実対比)のどこが問題ですか?
- 棒の数が多すぎる
- 売上または目標金額の大きさを表現するのに棒グラフは適切ではない
- どちらが実績でどちらが目標なのか凡例を探し当てるまでわからない
- 異なる四半期の売上と目標金額を比較してしまう可能性がある
- 売上実績の時系列推移を見ることが困難
- 縦軸のラベル「値」に意味がない
<感じたこと>
・棒が多すぎてわかりにくい
→重ねてわかりやすく
・予算と実績の判別がつきにくい
→実績を前へ、予算を後ろに配置することでわかりやすく
・売上と予算が隣り合ってしまっている為、それぞれの推移が分かりにくい
→重ねてわかりやすく
3-2. (予実対比)を表現するものとして適切と思われるチャートはどれですか?
- 線グラフ
- 円グラフ
- 散布図
- 箱ひげ図
- ヒストグラム
- ブレットグラフ
4-1. (製品別売上・利益)のどこが問題ですか?
- 売上の大きさを表現するのに棒グラフは適切ではない
- 行が多すぎてヘッダーが潰れている(白くなって表示できない)
- 売上と利益の相関を理解できない
- ソート順に意味がない
<要点>
・製品数が多すぎて棒グラフがつぶれてしまい見づらい
・別々のグラフの為、売上と利益の相関性が分かりづらい
→横軸を売上、縦軸を利益としたプロットグラフにすることで相関関係をわかりやすく表示
→カテゴリ毎に分けることで、重なりを減らし見やすくする、またカテゴリ毎の特徴も確認できる
4-2. (製品別売上・利益)で二つの数値の相関を示したいのだとすると適切と思われるチャートはどれでしょうか?
- 線グラフ
- 円グラフ
- 散布図
- 箱ひげ図
- ヒストグラム
- ブレットグラフ
5-1. (地域・サブカテゴリ別利益)のどこが問題ですか?
- 利益の大きさを表現するのに棒グラフは適切ではない
- 画面の縦幅が十分でなく、縦棒グラフが圧迫されて棒グラフの長さが機能していない
- 地域のソート順に意味がない
- マイナスの値を表現するのに棒グラフは向いていない
- 縦軸の目盛り(ヘッダー)の桁数が多い
<要点>
・棒グラフが多く幅を十分に確保できない為、棒グラフの長さが分かりにくい
→ヒートマップグラフに変更
・メモリの桁数が多く、わかりにくい
→桁数を丸める
5-2. (地域・サブカテゴリ別利益)で同じ画面スペースの中でインタラクションなしに一目で利益の大小を示すにはどのPreattentive Attributeの組み合わせを選択すれば最も視覚効果を高めて表現できるでしょうか?(一度に組み合わせて使用するものとする)
- 長さ
- 色相
- サイズ
- 向き
- 彩度
6-1. ダッシュボードに配置されているシートのうち、最も無駄なスペースを使っていると思われるシートはどれですか?
- 地域・カテゴリ別売上マップ
- カテゴリ別売上
- 受注年・地域・カテゴリ別売上一覧
6-2. 1で選択した回答に合わせ、問題と感じたものを選択してください
あくまでも上で選択したチャートに該当する問題のみ選択すること。シート単体で見たときの問題点ではなく、ダッシュボード全体のバランスを鑑みて回答を選択すること。
- 都道府県を表現するのに地図は適切ではない
- 3つのカテゴリの割合を円グラフで作成するべきではない
- 地域ごとに分かれていることに意味がない
- カテゴリ別売上にカテゴリごとの色がついていることに意味がない
- Visual Analyticsにおいてクロス集計表は不要である
<要点>
・地域別に円グラフを示しているため、縦長になってしまいわかりにくい。
・そもそも地図で示す必要がないとも考えられる。
・推移が表になっているが、増減が分かりにくい。
・パーセンテージを示す際、小数点第二位迄示すとわかりにくい
1.ファイル形式のスプレッドシートでデータに関するレポートを作成したときに起こる問題点の内、Data Driven Cultureの浸透を阻害する要因となるものはどれですか
- 視覚化ができない
- データを見ることができない
- みんなで同じデータを見る(一元管理する)ことができない
- データを集計することができない
<要点>
データドリブン(Data Driven)とは、勘や経験のみに頼らず、売上データやWeb上の解析データなど様々な種類のデータを情報を蓄積し、そのデータの分析結果をもとに、課題解決のための施策立案やビジネスの意思決定などを行う業務プロセスのこと。
全員が同じデータを用いて、認識を合わせていくことが重要。
スプレッドシートで共有の場合、みんなで同じデータを観ようとすると、編集の度に共有しなおさないといけない。
可視化・データを見ること・データの集計はスプレッドシートでもできる
2.Tableau Server/Onlineを使わず、twbxでレポートを共有したときの問題点として正しいものはどれですか
- データを視覚化できない
- セルフサービスで分析することができない
- データ更新のスケジュール設定ができない
- データを一元管理できない
- インタラクティブな操作でデータを深堀することができない
- 機密データ流出のリスクがあ
<要点>
twbxの場合でも、データを視覚化(グラフ作成)・セルフサービスでの分析、インタラクティブな操作(フィルター操作等)はできる。
しかし、スプレッドシートで共有したときと同様に一元管理できない問題や、スケジュール管理できない問題が出る。
ファイルを誤って送ってしまうデータ流出の可能性もある。
3. Tableau Server/Onlineの機能に含まれているものはどれですか
- データを自動的に更新する
- データの流出を防ぐ(セキュリティ)
- 各コンテンツの利用状況、ユーザーの動向を把握する
- データの使用可能者・範囲・用途・権限を設定する(ガバナンス)
- Desktopで作成したVizの表示上の全ての機能(見栄えとインタラクション)
- Desktopアプリケーションを持たないユーザーにも提供する
- ユーザー個別のフィルター条件を記憶してダッシュボードをカスタマイズする(カスタムビュー)
- 定期的にメールでデータビジュアライゼーションを自分あるいは関係者に送付る(サブスクライブ)
- データが一定以上の値を示したときにお知らせを飛ばす(アラート)
- データを見た人がコメントしたり所定の相手にメンションする(コラボレーション)
- Web上でVizを作成する(Web編集)
- Webパーツとして外部Webサービスに埋め込むことができる
- モバイル・タブレットなど多様なデバイスに対応する
- データの所在や情報を明らかにしてより活用を促す(データカタログ)
- ログインした人に応じてそれぞれが見るべきVizを推奨する
<要点>
Tableau Server/Onlineの機能は豊富です。
4. Tableau Server/Onlineを使用したときの効果について当てはまるものはどれですか
- それぞれが必要なタイミングでデータを使うことができる
- 必要な人のみにデータの閲覧を可能にする
- 適切なタイミングに更新され、管理された安全なデータを使用することができ
- 誰がデータの管理者なのかを容易に確認できる
- データのメタデータを、データベースに接続せずに確認できる
- データの集計結果やVizの表示結果など、複数人が同じものを見ている場合、リソースを共有することができる
- 誰かに聞かなくとも、どこからやってきて、どのように加工されたデータを使っているのかがわかる
- データを見て判断する癖をつけることができる
<要点>
Tableau Server/Onlineの機能によって得られる効果に関しても確認しておきましょう。
5. なぜセルフサービスで分析ができなければならないのですか
- 自分の持っている課題や質問を人に伝えて解決してもらうのが困難であるから
- 自分の問いかけに瞬時にデータを通して答えを得るとき、即座に次の問いや解決方法を思い浮かべたり、試したりできるから
- 人が思考のフローに乗るためには自身の思考や操作に対する瞬時のフィードバックが必要だから
- 自分の手を動かして初めて理解できる事柄がたくさんあるから
- 自分自身で判断のための情報を得られないとビジネスの判断が遅れてしまうから
<要点>
人によって課題に思うことがそれぞれ違う。
自分で分析できるようになれば、問題解決する質や速度が変わる。
6. レポートファクトリーとはなんですか
- レポート作成を受託する企業のこと
- 分析結果を求めている「Task」を持っている人が自分でデータを探索することができず、他人に分析やレポーティングを依頼して作ってもらっている状態
- レポート作成依頼を受けるメンバーが過剰な依頼数に忙殺され、すぐに分析結果を依頼主に返すことができない状態
- 依頼からレポート完成までに時間がかかり過ぎて、もはやレポートが完成する頃にはその分析結果が不要になっている状態
<要点>
レポートファクトリーとは、分析やレポート作成ができる人に負荷がかかってしまっている状態のこと。※企業ではない
7. データを見ないで判断することによるデメリットは何でしょうか
- 経験と勘だけでの判断となり、現在の状況に則しているかわからない
- 人に依存する判断となり、みんなで合意を取ることが難しい
- 高速に決断を下すことができない
- 事実と異なった空想での判断に基づいた決定で致命的な判断ミスをしてしまうことがある
<要点>
例えば、「熱が出たとき」。風邪なのか、その他の疾患なのかわからない。
家族に聞いたところで本当の原因なのかどうかわからない。
病院に行って原因を確認する前に、薬を飲む判断をした方が早いので早く決断を下すことはできる。
8. データを見て判断することのメリットは何でしょうか
- 経験と勘をすべて否定することができる
- 自分の想像だけで話していたことから脱却できる
- 多くの人にとって納得感があるため、他人と合意しやすい
- 自分の主観だけでは気づかなかったことに気づくことができる
<要点>
経験と勘が全て合っていないとも限らない。
データから読み取った上で、経験と勘に沿った答えと一致する可能性もある。
9. 自動化できるような作業を手作業にすると
- 忘れられる
- 面倒がられる
- コストがかからない
- 廃れて、使われなくなる
- 人により作業の正確さや時間にムラができる
<要点>
自動化はシステムを入れることで(コスト)お金がかかる。
ただコストはお金だけでなく時間も意味する。
10. データをみんなで共有していくためには
- IT部門は動いてくれないケースが多く、現場部門が主導して進めるべきである
- 現場部門はデータのセキュリティなどの考え方に疎く、現場主導を容認すべきではない
- 現場部門、IT部門双方のコミュニケーションと寄り添いが重要である
<要点>
分析部門と現場部門の情報共有は必須条件である
11. すべての人がTableau Desktopでドラッグアンドドロップしながらデータを深堀できなければデータドリヴンな組織とはいえませんか
- はい
- いいえ
<要点>
はいの場合は、すべての人がcreatorにならなければいけない。
本当にそうであるべきなのか。
12~14. Visual Analyticsのサイクルで、Creatorが担うべき部分をすべて選んでください
- Task
- Get Data
- Choose visual mapping
- View data
- Develop insight
- Act (Share)
<要点>
Creator 常に新たな視点を持ち、想像する人
Explorer 常に探求心を忘れず、世界のことを知りたいと思い続ける好奇心を持つ人
Viewer 美しい数々のViewを見て心を動かし、アクションをしていく人々
15.Viewerとはどういう存在ですか?
- データを見るだけの人
- データを見る知識がなく、簡単な操作しかできない人
- データを見る人
- データを見て理解した上でAct(施策を打つ)することを主な活動とする人
<要点>
データを用いて能動的に活動する人
16.データは頻繁に活用されるとどうなりますか?
- データは見られると美しくなる
- データは見られるほど複雑になる
<要点>
見られるほどブラッシュアップされていく
17.すべての人がデータを見て理解した上で会話することによる効果はなんでしょうか
- ある事実を把握した上で、様々な視点(役割・立場・感性など)から議論を交わし、新しいアイディアを創出することができる
- すべての人がData Drivenという言葉を使うようになる
- 判断の根拠がわかりやすくなり、方針の合意がとりやすくなる
<要点>
Data Drivenという言葉を使うことだけで、真の効果が得られるでしょうか。
18.なぜデータを同じ場所で管理しなければならないのですか
同じ場所で管理というのは同じデータベースにすべてのデータを置くという意味ではなく、データを使う人が一箇所ですべての必要なデータにアクセスできるような環境のことを指します
- ばらばらに点在したデータをそれぞれが見ている場合、まずお互いの見ているデータが一致していることから確認しなくてはならないから
- 同じ場所にあるデータを見ていることで、共通の事象を見ていると信頼してお互いに話すことができるから
- 分析のためのデータを探すことに時間がかかってしまい、Data Driven Cultureの浸透を進める妨げになってしまうから
<要点>
分析のためのデータが常に全員の共通認識になっているデータである状態をつくらなければならない。
19.「すべての人がデータを活用するプラットフォーム」では…
- すべての人が同じレベルのデータに関する技術を持ち、それぞれがVisual Analyticsのサイクルを回している
- データリテラシーを持った異なるスキルの人々が、自らの役割に応じて、同じ土台の上で自分が最も力を発揮できる仕事をしている
<要点>
12.~14のVisual Analyticsのサイクルではそれぞれが役割分担している。
1. ビジュアライゼーションを作る際、まず最初に
どんな表現にするか決める
質問から始める
<要点>
ビジュアライゼーションは誰に向けて作るのかを考えるのがポイントです。
自分で突き進んでしまう前に、まずは相手のニーズをヒアリングして把握することが重要です。
2. ヒトにとってもっともわかりやすいPreattentive Attributesは次のうちのどれか?
サイズ
形状
位置
色
<要点>
Preattentive Attributes = 視覚的な特徴
人にとってもっともわかりやすいものを選びます。
3. 分類的な名義と相性の良いPreattentive Attributesは?
サイズ
形状
色相
彩度
<要点>
分類しやすいという意味は、「●●色」「●角形」等と判別しやすいもの。
色相:色の変化・色み
明度:色の明るさ
彩度:色の鮮やかさ
4. 経時的な変化を見るのに適切なのは?
棒グラフ
線グラフ
面グラフ(エリアチャート)
円グラフ
<要点>
経時的 = 時間に伴って変化が確認できるもの
※面グラフ例
5. 比較とランク付けを見るのに適切なのは?
棒グラフ
線グラフ
箱ひげ図
地図
<要点>
「量の比較」が簡単に出来るものはなにかを考える。
表彰台の高さや長さをイメージしてみましょう!
6. 分布を見るのに適切なのは?
棒グラフ
円グラフ
箱ひげ図
ヒストグラム
<要点>
分布 = データの散らばりを確認するのに適切なものは何かを考える。
箱ひげ図の例
ヒストグラムの例
7. 比較値を示すのに効果的なグラフ形式は?
線グラフ
棒グラフ
散布図
箱ひげ図
<要点>
5と考え方が同じです。
8. 円グラフの不利な点は?
隣り合っているものしか比較できない
角度を比較するのが困難
色を使わないと表現できない
スペースを大幅に取る
数が多いものを比較することができない
<要点>
円グラフはよく見かけますが
色や数値がないとデメリットが多い…
・6つのデータ比較の場合、対面の大きさ比較しにくい。
・角度は小さいものの比較だと目視で確認できない。
・色を変化させないと判別できない。
・項目を増やすと場所を取りますよね。
・10項目の円グラフとかだと判別できないですよね。
9. 人が一度に区別できる色の数は?(もっとも近いものを選択)
3
7
20
100
<要点>
虹の色だと、4つ以上は区別できそうですよね。でも全色が限界かもですね。
10. ダッシュボードには以下の種類のものがある
深堀型
説明型
探索型
作文型
<要点>
説明型ダッシュボード
→作成者の意図や主張が決まっており、それを説明することを目的としたダッシュボード
探索型ダッシュボード
→作成者は中立的な立場で、それを見る人がデータを探索しそれぞれが結論を導き出すことを目的としたダッシュボード
11. ダッシュボードに配置するシート数は一般的にいくつに収めるのがよいか?
2以下
4以下
6以下
10以下
気にする必要はない
<要点>
多すぎるとグラフがつぶれてしまって他を圧迫しますよね。
4枠くらいがちょうどよいかもです。
12. ツールヒントはどうするとより効果的に活用できるか?
デフォルトのまま使用する
必要な情報に絞り、わかりやすい文言とフォントに変更する
<要点>
デフォルトのままだと情報量が多い場合がある。
情報量を絞って、何を伝えるか明確にする必要がある。
Q1.サブカテゴリ「テーブル」の最後の年(2016)の売上は、最初の年(2013)と比べて何%増加していますか?
表計算を追加する機能で、差の割合だす
Q2.各都道府県がサブカテゴリ「椅子」の利益に及ぼした貢献度を知りたいです。 都道府県を利益合計を多い順に並べ、積みあがっていく状況と総計を表してください。Q2-1: 累計利益金額が最大となるのはどの都道府県ですか? Q2-2: Q2-1の時の利益はいくらでしょうか? Q2-3: 利益に対して貢献できなかった都道府県に地域特性はありますか?
ウォーターフォールチャート(累計値を曲線で見ながら最大の累計利益を確認する)
ガントチャート
Q3.年四半期ごとサブカテゴリの売上ランキングの推移をみたとき、
Q3-1: 最も長い間、継続して1位を獲得していたのはどのサブカテゴリでしょうか?
Q3-2: そのサブカテゴリがもっともランキングを下げたときは何位でしたか?
Q3-3: そのサブカテゴリ含め、同じカテゴリに所属しているサブカテゴリは全期間の内何回1位を獲得しましたか?
面積グラフの表現方法
集計値の関数でMIN(1)を入れる・・・棒の幅を広げるため
Q4利益TOP10、WORST10の顧客の売上を比較し、 利益でTOP1の金額を出している顧客の売上とそれ以外の顧客それぞれの売上の差を見せてください。
セットの作成・セットの結合・
Q4-1: 利益TOP1の顧客より高い売上を出している顧客はいますか?
Q4-2: 利益WORST10の顧客の中で売上金額の差が利益TOP1と比較してもっとも小さい顧客との金額差はいくらですか?
順位の表示(ペイン下)
Q5.年四半期の売上が最高記録を更新したのは何回ありますか? 売上が最初に発生した四半期は回数から除いて下さい。 なお、最高記録を更新したタイミングがわかるよう、その箇所は色を変えて表現してください。
簡易計算で累計 表計算の編集最大値にする
二重軸にして片方を円形にする
売上が最初に発生した四半期は回数から除き且つ最高記録更新した売上表示
INDEX()>1 AND RUNNING_MAX(SUM([売上]))=SUM([売上])
※INDEX()>1 売上が最初に発生した四半期は回数から除く
Q6.利益率ワースト3のサブカテゴリを除外すると、 利益率は何%になりますか?
利益率の出し方、アクションフィルター
売上と前年比成長率の相関(サブカテゴリをラベル表示)
年ごとのフィルターはできない(前年比成長率の計算が崩れる)ため、
LOOKUP関数を使用する。年の値のみを返す関数
LOOKUP(MIN(DATEPART("year",[オーダー日])),0)
出荷にかかる平均日数を週単位の推移で見せてください。社の方針として上方管理限界線(UCL:Upper Control Limit)を3σ(シグマ)として管理しているのですが、
Q8-1: この限界を突破して配送が遅延した週は何回ありましたか?
Q8-2: その週の配送先の市区町村を確認し、問題が起こった原因について調査してください。
出荷にかかる日数を計算式
DATEDIFF("day",[オーダー日],[出荷日])
箱ひげ図をいれて、分布、標準偏差を‐3・3
限界を突破して配送が遅延した週をクリックすると、アクションフィルターでその市区町村がでるようにする
Q9.2016年の四半期単位の売上推移をメーカーごとに比較してください。 メーカー名が「s」で終わるメーカーにはどのようなトレンドがありますか?
「サンプル - スーパーストア - メーカー情報.tdsx」
メーカーのブレンド方法
フィルターのワイルドカードでメーカー名が「s」で終わるメーカーを絞る
最後を強調する数式を作成
IF LAST()=0 THEN SUM([売上]) END
Q.10 地域別売上ランキングの推移を年四半期で見たとき、売上開始当初(2013/1Q)と最終四半期(2016/4Q)でランキングの変動があった地域はどこですか?
地域別・年四半期別の売上ランクの出し方
(2013年1Q)と(2016年4Q)の推移のみのグラフにする
最初と最後以外を選択し除外する
カテゴリ「家電」における週数別の売上を見たとき、500,000円を連続で超えたのは
Q11-1: 最大何週間ですか?
※閾値500,000はシミュレーションで変更される可能性があるので可変にしてください。閾値を超えた週を異なる色で強調した上で「閾値超え連続週数」を数えて下さい。閾値超えが途切れたら、ゼロリセットし、閾値超え連続週数の値を連続した週の最後の週にのみ表示して下さい。
閾値判定のパラメータを作成
閾値が500000を超えたら色付けされる式を設定する。
SUM([売上])>[閾値判定]
500000を超過したら数えてくれる数式を作成。超過がなくなったらまた0クリアされる。それをラベル表示する
Q11-2: 連続で超えている間、500,000円の超過分を累計したとき、最も高い累計金額はいくらですか?
※閾値を超過している分の売上高を累計し、最後の週に表示してください。
超過しているもの売上から500000を引いたものを足し続ける計算式。
IF [閾値判定(色)] THEN PREVIOUS_VALUE(0)+SUM([売上])-[閾値判定] ELSE 0 END
-------------------
Q1.サブカテゴリ「テーブル」の最後の年(2016)の売上は、最初の年(2013)と比べて何%増加していますか?
完成イメージ
①サブカテゴリをテーブルでフィルター、年(オーダー日)と売上を並べる
売上は表計算を追加し
次との差の割合を選択
特定のディメンションを選択
基準を2013年で選択
-------------------
Q2各都道府県がサブカテゴリ「椅子」の利益に及ぼした貢献度を知りたいです。
都道府県を利益合計を多い順に並べ、積みあがっていく状況と総計を表してください。
Q2-1: 累計利益金額が最大となるのはどの都道府県ですか? Q2-2: Q2-1の時の利益はいくらでしょうか? Q2-3: 利益に対して貢献できなかった都道府県に地域特性はありますか?
完成イメージ
ウォーターフォールチャートを使用する
①都道府県・利益を並べる
以下のように並べても数が違いすぎてわからない
累計利益が最大になる地点がわからない
②椅子をフィルターにする
累計にする
③ガントチャートにしてラベル表示。最大値地点がわかった
④ガントチャートに利益をもう一つ入れ、アナリティクスから総計を表示する
累計の頂点から大阪が始まっているので、これを0~積みあがった表記にしたい
⑤ガントチャートのSUM([利益])にマイナスをつけて、0から積みあがった状態にする
都道府県の並び替えから
フィールド・昇順にすると大阪が0からスタートする
⑥地域を色付けして、地域の特性をみる
地域を入れるとガントチャートが崩れるので・・・
属性に変換
-------------------
Q3.年四半期ごとサブカテゴリの売上ランキングの推移をみたとき、
Q3-1: 最も長い間、継続して1位を獲得していたのはどのサブカテゴリでしょうか?
Q3-2: そのサブカテゴリがもっともランキングを下げたときは何位でしたか?
完成イメージ
Q3-1:椅子
Q3-2:5位
①年四半期ごとの売上合計を以下のように確認する
どこが一位なのかわからない・・・
②簡易計算でランクを選択し、
次を使用して計算でサブカテゴリを選択
軸の編集で反転させる。ただ線だとまだわかりづらい・・・
③オーダー日と売上を不連続にする。形を棒にする。
サブカテゴリのランキングを一つ一つ区切って表現するため。
④集計値の関数でMIN(1)を入れる・・・棒の幅を広げるため
軸の編集でヘッダーの軸目盛の範囲を0~1にする
色で枠線を白にし、サイズは最大にする
⑤サブカテゴリをラベル表示できるようにする
Q3-3: そのサブカテゴリ含め、同じカテゴリに所属しているサブカテゴリは全期間の内何回1位を獲得しましたか?
完成イメージ
Q3-3:同じカテゴリは家具なので、家具は7回一位を獲得している
①サブカテゴリの色を外す
②カテゴリを色に入れる
カテゴリを属性に直す
-------------------
Q4利益TOP10、WORST10の顧客の売上を比較し、
利益でTOP1の金額を出している顧客の売上とそれ以外の顧客それぞれの売上の差を見せてください。
完成イメージ
Q4-1: 利益TOP1の顧客より高い売上を出している顧客はいますか? いない
完成イメージ
Q4-2: 利益WORST10の顧客の中で売上金額の差が利益TOP1と比較してもっとも小さい顧客との金額差はいくらですか?
ラベルを最大値にすると表示される
①利益と顧客を並べ、顧客のフィルターで利益が上位10名で絞る
②絞られた上位10名を全選択(ctrl+A)でセットの作成
名前を付ける 利益TOP10名の顧客
③同じように下位10名の顧客のセットも作成
④作成した2つのセットを結合セットにする(同時に表示できるように)
⑤結合したセットが出来たらフィルターに入れる
⑥利益TOP10を入れるとIN/OUTが表示される。INがTOP10・OUTがWORST10
別名の編集をしておく
⑦売上の差を出す。計算タイプは次との差を選択
基準を最初に設定する。そうすると利益TOP1の石嶺明美さんとの売上差が表示される。
Q4-3: Q4-2の顧客は利益WORST何位でしたか?
完成イメージ
①利益を入れてランク表示
②ペイン下でTOP10とWORST10を区切る
③不連続にして行に持っていく。必ず顧客名より前に出す
④WORST10の順位に合わせるため、昇順に直す
-------------------
Q5.年四半期の売上が最高記録を更新したのは何回ありますか? 売上が最初に発生した四半期は回数から除いて下さい。
なお、最高記録を更新したタイミングがわかるよう、その箇所は色を変えて表現してください。
完成イメージ
①売上を累計の最大値に設定
②売上をもう一つ並べて形を円にする
③二重軸にして重ねる
④色分けしておく(それぞれを色編集)
⑤ 売上が最初に発生した四半期は回数は除くので、以下の計算式を円形の色にいれる
INDEX()>1
⑥売上最高記録の計算式を作成
INDEX()>1は最初はカウントしない
且つ最高記録更新した売上表示
INDEX()>1 AND RUNNING_MAX(SUM([売上]))=SUM([売上])
⑦それを色に持っていく。
-------------------
Q6.利益率ワースト3のサブカテゴリを除外すると、
利益率は何%になりますか?
完成イメージ
①利益率を出す。
SUM([利益])/SUM([売上])
②サブカテゴリごとの利益率を出し、降順で並べる
③DBに並べる
④フィルターアクションを作成
⑤ワークシートに戻り、フィルターの編集で除外を記入
⑥3つ選択すると除外された利益率になる
-------------------
Q7.サブカテゴリごとの売上と売上の前年比成長率の相関を年ごとに確認したいです。
2015年と2016年で前年比割れしてしまったサブカテゴリの傾向を教えてください。
役員がモバイルで確認するため横に並べて各年を比較することができず、フィルターで切り替えて確認できるように依頼されています。
完成イメージ
①売上の簡易計算内の前年比成長率を用いる
フィルターに売上の前年比成長率をいれて、2013年が出ないようにする
②ステップドカラー2段階に色分けし、前年比成長率が前年割れしているものを判別する
③年ごとにフィルター表示しようとしても単年ごとに表示することができない・・・
オーダー年でフィルターをかけると前年比の計算にも影響されるので表示できない。
④LOOKUP関数を使用する。年の値のみを返す関数
LOOKUP(MIN(DATEPART("year",[オーダー日])),0)
⑤不連続にすると年の値が返される
⑥年切り替えの計算式を同じ数式で作成
不連続にしておく
⑦フィルターに入れる。単年でも表示されるようになる
-------------------
Q8出荷にかかる平均日数を週単位の推移で見せてください。社の方針として上方管理限界線(UCL:Upper Control Limit)を3σ(シグマ)として管理しているのですが、
Q8-1: この限界を突破して配送が遅延した週は何回ありましたか?
3σを超えているのは1回
完成イメージ
①出荷にかかる日数を計算式で作成
②週オーダー日と出荷にかかる日数を平均表示で並べる
③アナリティクスから箱ひげ図をいれて、分布、標準偏差を‐3・3で表示。
Q8-2: その週の配送先の市区町村を確認し、問題が起こった原因について調査してください。
完成イメージ
この週は特に関西地方において配送が遅延気味であった
過半数の市区町村がその週では週別平均配送日数の平均より長くかかって配送している
週ごと市区町村の平均配送日数で最も長く配送時間がかかっているものが含まれる
①市区町村ごと、出荷にかかる日数を平均表示で並べる。
出荷にかかる日数を平均ランク付け、週オーダー日ごとにする
②ダッシュボードを作成
③アクションフィルターで3σを超えたときの週の市区町村を表示できるようにする
-------------------
Q.9 2016年の四半期単位の売上推移をメーカーごとに比較してください。
メーカー名が「s」で終わるメーカーにはどのようなトレンドがありますか?
メーカーの情報はExcelに入っていないので、
「サンプル - スーパーストア - メーカー情報.tdsx」 を使用してください。
完成イメージ
①メーカーを紐づけ
②2016年でしぼり、四半期・メーカー・売上で並べる
③セカンダリデータソース側でメーカーをフィルターにいれる
⑤フィルターのワイルドカード条件で「s」を入れて後方一致にする
⑥最後の文字が「s」になっているもののみ表示される
⑦軸の編集を行い、トレンドを見やすくする
⑧ラベルで終点箇所のみラベルを表示する
⑨最後を強調する数式を作成
IF LAST()=0 THEN SUM([売上]) END
⑩二重軸にし軸の同期をする
-------------------
Q.10 地域別売上ランキングの推移を年四半期で見たとき、売上開始当初(2013/1Q)と最終四半期(2016/4Q)でランキングの変動があった地域はどこですか?
完成イメージ
①四半期ごとに地域別で売上累計で見てみる
2016年Q4で関西地方が1位になっていることを確認
②ランク別に降順で並べる
③軸の編集で反転させて2016年Q4で関西地方が1位になっていて、1位が上の位置にする。
④(2013年1Q)と(2016年4Q)の推移のみのグラフにする
最初と最後以外を選択し除外する
-------------------
カテゴリ「家電」における週数別の売上を見たとき、500,000円を連続で超えたのは
Q11-1: 最大何週間ですか?
※閾値500,000はシミュレーションで変更される可能性があるので可変にしてください。閾値を超えた週を異なる色で強調した上で「閾値超え連続週数」を数えて下さい。閾値超えが途切れたら、ゼロリセットし、閾値超え連続週数の値を連続した週の最後の週にのみ表示して下さい。
完成イメージ
①閾値判定のパラメータを作成
表示形式は自動 現在の値を500000に設定
②カテゴリ「家電」・週オーダー日・売上で並べる
③閾値が500000を超えたら色付けされる式を設定する。
SUM([売上])>[閾値判定]
④500000を超過したら数えてくれる数式を作成。超過がなくなったらまた0クリアされる
⑤最大値のみを表示
Q11-2: 連続で超えている間、500,000円の超過分を累計したとき、最も高い累計金額はいくらですか?
※閾値を超過している分の売上高を累計し、最後の週に表示してください。
完成イメージ
①下記の選択した週が連続して超過している対象なので、その超過分の累計をだし、最後の週に記載する
②超過しているもの売上から500000を引いたものを足し続ける計算式。
IF [閾値判定(色)] THEN PREVIOUS_VALUE(0)+SUM([売上])-[閾値判定] ELSE 0 END
Q1.売上推移・製品別売上・カテゴリ別累積売上を見たいのですが、それぞれのチャートをなるべく広いスペースを使って1画面内で切り替えながら表示したいです。
パラメータ・垂直コンテナ
Q2.データ内の最も新しい日付を基準日としたとき、最終購入日から基準日までの日数が60日未満の顧客は何名いるでしょうか?
LOD計算(Level of Detail)
FIXED関数 顧客ごとの最終購入日・最も新しい日付(基準日)
DATEDIFF関数 顧客ごとの最終購入日と最も新しい日付(基準日)の差
Q3.顧客の購入回数別で、最も顧客数が多い購入回数はどれですか? 購入回数はオーダーIdの個別カウントで算出することができます。
(OP問題)1回のオーダーにおける金額の平均が高いのは何回購入している顧客ですか?
FIXED関数 顧客ごとの購入回数
WINDOW_MAX関数 最大値を色付けする
INCLUDE関数 顧客ごとの1回のオーダーあたりの売上を出す(細かい粒度を取り出す時に使用)
Q4.顧客ごとの合計売上を見たとき、どの金額レンジ(10万円単位)の顧客が多いでしょうか?
FIXED関数 顧客ごとの合計売上
顧客ごとの合計売上の10万円単位のビン
FIXED関数 顧客ごとの初回購入日
100%割合表示 簡易計算”合計に対する割合”
Q6.初めて購入した顧客が、2回目に購入してくれるまでに何四半期空いていることが多いですか?顧客ごとの初回購入四半期ごとに見せてください。
FIXED関数 顧客ごとの初回購入日
IIF関数 2回目以降の購入日
FIXED関数 2回目の購入日 ※2回目以降の購入日をMINでとる
DATEDIFF関数 初回購入日と2回目購入日の差(四半期表示)
(OP問題)同じ分類で顧客1名あたりの売上が大きいのはどのグループでしょうか。 結果を元に、最低でも2回目の購入をどのくらいまでの期間中に行ってもらうべきか教えてください。
FIXED関数 顧客ごとの合計売上←これをメジャーに変換して反映
Q7.購入月(年は除く)と曜日の組み合わせで、1日あたりの売上平均が高い組み合わせを教えてください。
INCLUDE関数 1日あたりの売上
(OP問題)LOD表現を使わないで出す方法も考えてみましょう。
SUM([売上])/COUNTD([オーダー日])
ソート用のパラメータを作成
EXCLUDE関数 ソート用パラメータを選択したら、その売上が表示されるようにする。
それ以外の売上は除外。
それ以外のカテゴリは選択されたカテゴリの降順になるように並ぶ。
FIXED関数 顧客ごとの初回購入日
FIXED関数 顧客ごとの最終購入日
DATEDIFF関数 初回購入日と最終購入日の差(月表示)
ROUND関数 端数をまとめる計算式
※地域のとりかた
顧客の住所が誤っていたため「Customer_Master.csv」に
以下リンクの「地方の情報付き都道府県リスト」を結合してください。
コピペ可能な都道府県リスト(地方区分付き) #Tableau - Qiita
Customer_Master.csvをクロスデータ結合
テキストデータ(都道府県リスト)のクロスデータ結合
FIXED関数 新規顧客
※メーカーの情報はExcelに入っていないので、「サンプル - スーパーストア - メーカー情報.tdsx」を使用してください。
メーカーデータのプライマリグループの作成
FIXED関数 サブカテゴリ単位の各メーカーの平均割引率
IIF関数 サブカテゴリ単位の各メーカーの平均割引率が15%を超えていたらメーカー名表示
メーカーの表現の仕方
ーーーーーーーーーーーーーーーーーーーー
Q1
売上推移・製品別売上・カテゴリ別累積売上を見たいのですが、それぞれのチャートをなるべく広いスペースを使って1画面内で切り替えながら表示したいです。
〇完成イメージ
ダッシュボード上でパラメーターで切り替えられるようにする。
①パラメーター作成
②同時にパラメーターの計算式も作成
③パラメーターをワークシート上に表示させる。今開いているワークシートの名称にパラメーターを合わせる。
④計算フィールドで作成した「グラフの切り替え」をフィルター内に入れる。すべての値を選択する
1-1のままOKを押す
不連続にして、
1をクリックしてOK
この状態にする。パラメーター「1」に売上推移のワークシートが紐づく。
⑤残り2つのワークシートも同様にパラメータを紐づける
「3」にカテゴリ別累積売上
「2」に製品別売上
⑥ダッシュボード上でパラメーターを表示
パラメーターで切替わるようになる。
⑦新たなダッシュボードを作成し、垂直コンテナーを入れてから3枚のワークシートを入れてパラメーターで切り替えると、1枚ずつ表示される
ーーーーーーーーーーーーーーーーーーーー
Q2.データ内の最も新しい日付を基準日としたとき、最終購入日から基準日までの日数が60日未満の顧客は何名いるでしょうか?
〇完成イメージ
①顧客ごとの最終購入日(オーダー日のMAX関数使用)を計算フィールドで作成
FIXED関数を使用する。ディメンションに表示されるようにする。
{ FIXED [顧客 Id]:MAX([オーダー日])}
ディメンションに作成される。
②データ内の最も新しい日付(基準日)をディメンションに表示されるようにする。
FIXED関数を使用する。
{ FIXED:MAX([オーダー日])}
ディメンションに作成される。
③顧客ごとの最終購入日と基準日との差を出す。
DATEDIFF関数を使用する
DATEDIFF('day',[顧客ごとの最終購入日],[最も新しい日付(基準日)])
④作成した差の計算フィールドでビンを作成。60日間で区切る
⑤顧客IDと並べて完成
ーーーーーーーーーーーーーーーーーーーー
Q3.顧客の購入回数別で、最も顧客数が多い購入回数はどれですか?
購入回数はオーダーIdの個別カウントで算出することができます。
〇完成イメージ
①顧客ごとの購入回数を出す
{ FIXED [顧客 Id]:COUNTD([オーダー Id])}
②顧客IDと並べる
WINDOW_MAX(COUNTD([顧客 Id]))=COUNTD([顧客 Id])
色付けする
ーーーーーーーー
(OP問題)1回のオーダーにおける金額の平均が高いのは何回購入している顧客ですか?
〇完成イメージ
前提としてオーダーIDと顧客IDを比べたときに、1つのオーダーIDには複数の顧客IDが存在する。
つまり1つのオーダーIDに対して平均売上を出しても、複数の顧客の平均売上となってしまう。
①その時はINCLUDE関数を使用する。INCLUDE関数は顧客IDを考慮してオーダーIDごとの合計売上を表示できる。(粒度を細かく区分して売上合計を表示する)
1オーダーあたりの売上(INCLUDE)
{ INCLUDE [オーダー Id]:SUM([売上])}
INCLUDE関数でも作成できるが、 FIXED関数でも表示できる。
顧客IDとオーダーIDと売上の組み合わせでFIXED関数を使用する
1オーダーあたりの顧客別売上(FIXED)
{ FIXED [顧客 Id],([オーダー Id]):SUM([売上])}
INCLUDE関数で作成した1オーダーあたりの顧客別売上と
FIXED関数で作成した1オーダーあたりの顧客別売上が同額になっているのがわかる
②先ほど作成したダッシュボードに移り、1オーダーあたりの顧客別売上を平均表示にしていれる。この時、INCLUDE関数で作成したものとFIXED関数で作成したものとどちらでもよい
③色付けして終了
WINDOW_MAX(AVG([1オーダーあたりの売上(INCLUDE)]))=AVG([1オーダーあたりの売上(INCLUDE)])
ーーーーーーーー
Q4.顧客ごとの合計売上を見たとき、どの金額レンジ(10万円単位)の顧客が多いでしょうか?
〇完成イメージ
①顧客ことの売上の組み合わせなのでFIXED関数を使用する
{ FIXED [顧客 Id]:SUM([売上])}
②作成した顧客ことの売上合計の計算フィールドのビンを作成。
10万ごとで区切る
並べて完成。
ーーーーーーーー
Q5.各顧客を初回購入年毎にまとめて、オーダー年毎の売上を割合で表現してください。2016年の売上の何%が2013年からの継続顧客で占められているでしょうか?
またその結果を見て、スーパーストアに潜む課題について言及してください。
なお、割合は1年分を100%として計算してください。
〇完成イメージ
①初回購入日をFIXED関数で作成
{ FIXED [顧客 Id]:MIN([オーダー日])}
②初回購入日と売上とオーダー日を配置
③100%割合表示にする
合計に対する割合
表(横)に表示する
ーーーーーーーー
Q6.初めて購入した顧客が、2回目に購入してくれるまでに何四半期空いていることが多いですか?顧客ごとの初回購入四半期ごとに見せてください。
〇完成イメージ
①初回購入日をFIXED関数で作成
{ FIXED [顧客 Id]:MIN([オーダー日])}
②2回目以降の購入日を以下のように出す
IIF関数を使用する。オーダー日が初回購入日より大きいとき、オーダー日を表示させるという計算式
IIF([オーダー日]>[顧客ごとの初回購入日],[オーダー日],NULL)
③2回目の購入日を以下のように出す
2回目以降の購入日のグループの中の最小値が2回目購入日なので、FIXED関数で2回目以降の購入日のMINを使う
{ FIXED [顧客 Id]:MIN([顧客ごとの2回目以降の購入日])}
④初回購入日から2回目購入日までの日数、且つ、その日数を四半期表記にする計算式はDATEDIFF関数を使用する。四半期はquaterを使用する
DATEDIFF('quarter',[顧客ごとの初回購入日],[顧客ごとの2回目購入日])
⑤縦軸に顧客ごとの初回購入日の四半期表示と
横軸に初回購入日から2回目購入日までの差(四半期)をディメンション形式で並べる顧客IDで色付け・グラフの形を四角にして、ラベルもつける
これをみると初回購入日から0四半期で購入しているのがわかる。
(OP問題)同じ分類で顧客1名あたりの売上が大きいのはどのグループでしょうか。
結果を元に、最低でも2回目の購入をどのくらいまでの期間中に行ってもらうべきか教えてください。
〇完成イメージ
①先ほど作成した顧客ごとの売上合計をメジャー側に変換する
②メジャーに変えたらそのままドラックする
③顧客ごとの売上と初回購入日と2回目購入日の差で、それぞれラベルが出るようにする。
④メジャーバリューごとに色を変える。別々の凡例を使用
ーーーーーーーー
Q7.購入月(年は除く)と曜日の組み合わせで、1日あたりの売上平均が高い組み合わせを教えてください。(LOD表現使うパターン)
〇完成イメージ
①1日あたりの売上をINCLUDE関数で計算する
オーダー日ごとの売上
{ INCLUDE[オーダー日]:SUM([売上])}
②月と曜日を並べる
オーダー日ごとの売上を平均にしていれる
(OP問題)LOD表現を使わないで出す方法も考えてみましょう。
〇完成イメージ
①オーダー日ごとの売上をLOD表現を使用しないで作成する
すでに平均になっている
SUM([売上])/COUNTD([オーダー日])
②Q7と同様にならべる
ーーーーーーーー
Q8.年 四半期ごとに、「カテゴリ」で「売上」の差を表示しています。
この差の大きさにより年 四半期をソートしたいです。ソートは選択した「カテゴリ」に応じて変わりますが、3つのカテゴリは同時に表示しておいてください。
(選択していないカテゴリのものは選択したカテゴリの降順で並んでいればよいです)
ヒント: ディメンションのソートでは表計算を使用できません。
〇完成イメージ
ソート用カテゴリのパラメータを作成して、パラメータをいじると対象のカテゴリが降順になり、その他のカテゴリは選択されたカテゴリの降順になるように並ぶ。
①スターターからステップドカラーを4つに分ける状態にする。
②ソート用のパラメータを作成する
③EXCLUDE関数を使用して、ソート用パラメータを選択したら、その売上が表示されるようにする。それ以外は除外という計算式を使用する。
{ EXCLUDE[カテゴリ1]:SUM(IF [カテゴリ1]=[ソート用パラメータ] THEN [売上] END)}
④作成したソート用売上パラメータを表示し、ソート用売上の計算式を行に挿入し,
簡易計算で差にして、ディメンションにする。
ーーーーーーーー
Q9.顧客別の購入間隔の平均(初回購入~最終購入の月数÷購入回数)ごとの顧客数と 売上を見てください。売上がもっとも高い購入間隔を目標の購入間隔としたとき、現在最も人数の多い購入間隔のメンバーに対し、何か月間隔を縮めるような施策を打てばよいですか?
〇完成イメージ
1か月縮める施策を打てばよい
①顧客ごとの初回購入日をFIXED関数で作成
{ FIXED [顧客 Id]:MIN([オーダー日])}
②顧客ごとの最終購入日(オーダー日のMAX関数使用)をFIXED関数で作成
{ FIXED [顧客 Id]:MAX([オーダー日])}
③初回購入日と最終購入日の差を月で出す
DATEDIFF('month',[顧客ごとの初回購入日],[顧客ごとの最終購入日])
④顧客別の購入間隔の平均(初回購入~最終購入の月数÷購入回数)を
ROUND関数で出す。(ROUNDは端数をまとめる計算式)
ROUND([初回購入日と最終購入日の差(月) ]/[顧客ごとの購入回数])
⑤顧客IDと売上を並べる。各顧客の購入間隔平均も並べる
Q10.スーパーストアでは新規顧客獲得に苦戦しているという問題を発見しました。
新規顧客獲得が比較的進んでいる地域※を見つけ出し、その施策を全国に展開したいと考えています。
年月ごとの新規獲得顧客の累計推移を見たとき、最終月に第1位で着地している地域はどこでしょうか?
また、その地域はいつから第1位でしょうか?
その頃に始めたマーケティングの内容を確認したいと思っています。
※地域のとりかた
顧客の住所が誤っていたため「Customer_Master.csv」に
以下リンクの「地方の情報付き都道府県リスト」を結合してください。
コピペ可能な都道府県リスト(地方区分付き) #Tableau - Qiita
〇完成イメージ
①Customer_Master.csvをクロスデータ結合で繋げる
②顧客IDが文字列にどちらのファイルもなっていることを確認し、共通キーを設定
③地方区分付き都道府県リストをコピー
コピペ可能な都道府県リスト(地方区分付き) #Tableau - Qiita
④データソース上に貼り付け
⑤フィールド名を自動生成するにチェック
⑥新しいワークシートに同じデータリストを貼り付け
⑦列タイトルが北海道/北海道になってしまっているので、右クリックしてフィールド名を自動生成にする
⑧カスタム分割をクリック
⑨ /スラッシュを入力し分割を最後にし、スラッシュ以降の都道府県が表示されるようにする。
⑩都道府県が生成されたら、編集をクリックし、都道府県を生成するために計算された計算式をコピーする
⑪Customer_Master.csvとクリップボードの都道府県を紐づける
⑫下記のようになったら、
注文とCustomer_Masterは顧客IDで紐づけられている状態
Customer_Masterとクリップボードリストは都道府県で紐づけられている状態
⑬クリップボードリスト側で出てきたリストをカスタム分割にして、地方を取り出す
⑮新規顧客をFIXED関数で出す。
{ FIXED [顧客 Id]:MIN([オーダー日])}=[オーダー日]
初回購入日をオーダー日とイコールになったら真を返すという計算式。
真だったら新規顧客で、偽だったら既存顧客となる
⑯オーダー月・顧客ID・新規顧客で並べる
⑰フィルターに新規顧客を入れ、真(新規顧客)のみを表示
⑱地方で色分けして完成
Q11.スーパーストアでは利益確保の観点から、サブカテゴリごとに平均割引率が基準値15%以上にならないように指導されています。
しかしながらこの4年を通して平均割引率を算出したとき、いくつかのサブカテゴリが15%以上になってしまっているようです。
割引率がオーバーした原因として、基準値以上割引をしているメーカーはいくつあるでしょうか?
たくさんのメーカーが基準値以上割引しているために起こっているのか、どこかひとつのメーカーが大きく割引しているために全体的に割引率が上がってしまっているのか一目で確認できるようにしてください。
なお、サブカテゴリごとの平均割引率で見たときには15%以上ではないけれども、平均割引率15%以上のメーカーが同等程度存在しているサブカテゴリがあれば、そのサブカテゴリと対処すべきメーカーを教えてください。
※メーカーの情報はExcelに入っていないので、「サンプル - スーパーストア - メーカー情報.tdsx」を使用してください。
〇完成イメージ
①メーカーをデータソース内に入れる
②サンプルスーパーストアのワークシート上で製品IDをいれプライマリデータソースにし、
メーカーのワークシート上で、製品IDの紐づけが完了しているか確認し、メーカーをいれる。(これでメーカーの抽出は完了)
③プライマリデータソース上でメーカーを使用したいのでプライマリグループの作成をクリックする
フィールド名をメーカーにして・・・
プライマリデータソース側にメーカーが出てくる
④平均割引率とサブカテゴリを並べて、15%でリファレンスラインを引き、15%以上になっているサブカテゴリを見てみる
⑤サブカテゴリ単位の各メーカーの平均割引率をFIXED関数で出す
サブカテゴリ単位の各メーカーの平均割引率
{ FIXED [メーカー],[サブカテゴリ1]:AVG([割引率])}
⑥サブカテゴリ単位の各メーカーの平均割引率が15%を超えていたら、メーカー名を表示する計算式をIIF関数作成。
メーカーごと平均割引率が15%を超えていたらメーカー名表示
IIF([サブカテゴリ単位の各メーカーの平均割引率]>=0.15,[メーカー],NULL)
⑦INDEXを列に追加。サブカテゴリは17個あるので、17段表示される
⑧メーカーごと平均割引率が15%を超えていたらメーカー名表示をINDEX側のマークに色で入れ、形を円にする。
⑨二重軸にして重ねる
割引率を棒にする
⑩INDEXの頭に「-」つけて、位置を入れ替える
⑪INDEXの幅を0.005の掛け算にして調整する
〇幅調整のため
⑫次を使用して計算で、「メーカーごと平均割引率が15%を超えていたらメーカー名表示」を選択
⑬軸の同期を選択
⑭割引率が15%以上のサブカテゴリに色付けして完了
AVG([割引率])>0.15
Q1_サブカテゴリの売上を以下のように分類し、それぞれのサブカテゴリがどこに属するかわかりやすいように表現してください。また、サブカテゴリはカテゴリごとにまとめておいてください。
2000万円以上 1000万円以上 500万円以上 500万円以下
等分ではない売上の区切り方
パラメータ作成・売上or利益がダッシュボード上で反映されるようにする
利益のパラメーター(5000円~2万円まで)・利益のビン作成
Q4_顧客ごとの数量と利益の分布をみたとき、数量が多いときに利益が上がりやすい傾向にあるカテゴリ・地域の組み合わせはどれですか?なお、R-2乗やP値は考慮しなくてよいです。
利益と数量の分布・傾向線
Q5_カテゴリごとに顧客区分の売上の割合を見たとき、「大企業」で売り上がった比率が最も大きいカテゴリはどれですか?割合は各カテゴリを100%として計算してください。
各カテゴリを全体が100%の割合として計算する方法
簡易計算で合計に対する割合・次を使用して計算で表(横)
Q6_2016年に、1カテゴリ単体で20万円以上購入している顧客を教えてください。
1カテゴリごとに切り替えて表示できるようにしてください。
フィルターをかける順番の設定・コンテキストフィルター
売上を用いて簡易計算(ランク)の表示・不連続・ペイン(下)
フィルターで順位表示する(スライダー・売上は連続にする)
Q8_カテゴリを絞ってメーカーごとの売上を確認しつつ、別の画面で気になったメーカーの売上明細を見ることはできますか?
アクションフィルターを使った画面遷移
12週間の移動平均入れ方(表計算の追加から移動平均選択・前12で設定)
オーダー月ごとに色分け(オーダー月の数字を返す関数を用いて色分けする)
DATEPART('month', [オーダー日])
※オーダー月をそのまま使うとグラフの形状が変わってしまう
Q10_2014年にオーダーされた注文について、売上高の合計が20万円を超えた製品はいくつありますか?シート上で一目見てわかるように工夫してみてください。
オーダー年(2014年)のコンテキストフィルター
売上を用いた順位のランク数表示
ビュー全体で一目でわかるように
Q11_明細(1行)単位の売上をサブカテゴリごとにみたとき、外れ値を除いた最大値が最も高いのはどのサブカテゴリですか?また、そのサブカテゴリのオーダー回数は他と比べて多いですか?少ないですか?
外れ値という概念は箱ひげ図を使用する
カテゴリのパラメータ
売上10%増加のパラメータ
パラメータと連動した計算式
Q13_各製品の売上を見ながら、同一画面内でに製品名をWeb検索することはできますか?
予測インジケーター
ページスクロールで経年状況が線のでわかる表現
履歴の表示から「末尾」に設定
ーーーーーーーーーーーーーーーーーーーー
Q1
サブカテゴリの売上を以下のように分類し、それぞれのサブカテゴリがどこに属するかわかりやすいように表現してください。また、サブカテゴリはカテゴリごとにまとめておいてください。
2000万円以上
1000万円以上
500万円以上
500万円以下
〇完成イメージ
①等分ではない区切り方をしたいので計算フィールドを作成する。
〇売上金額分類
IF SUM([売上])>=20000000 THEN "2000万以上"
ELSEIF SUM([売上])>=10000000 THEN "1000万以上"
ELSEIF SUM([売上])>=5000000 THEN "500万以上"
ELSE "500万未満" END
②下記のように並べる。
※補足①
今回作成した売上金額分類は、見た目は文字列にだが、計算フィールドで作成しているのでメジャー群にいる
補足②
特定の売上の区切り方として以下の方法もある。
1000万以上2000万以下で区切りあとはNULLとする場合↓
IIF(SUM([売上])>=10000000 AND SUM([売上])<=2000000,"1000万以上2000万以下",NULL)
ーーーーーーーーーーーーーーーーーーーー
Q2_売上と利益に関するダッシュボードを作りたいのですが、スペースが狭すぎて見づらくなってしまいました。売上と利益を同時に見る必要はなく、
ボタンを押して切り替えるようなレイアウトにすることはできませんか?
なお、本設問ではVizの形や配置を変える必要はありません。
〇完成イメージ
パラメータで売上と利益を選択できるようにする
①パラメータを作成する
②下記のように入力
1 売上
2 利益 とする
③パラメータと連動する計算フィールを作成する
IIF([売上または利益を選択する]=1,[売上],[利益])
下記のようになれば準備完了
④お題のいずれかのワークシートに行き、パラメータの表示。
「売上」・「利益」が元々入っているので。「売上または利益」に変更する
⑤他のワークシートも「売上または利益」に変更する
売上と利益とで色分けもしておく
⑥ダッシュボードに戻り、パラメータを表示する
連動して変わるかも確認する
ーーーーーーーーーーーーーーーーーーーー
Q3_1行単位の利益金額1万円ごとに区切ったとき、どの価格帯のオーダーが最も多いでしょうか。なお、区切る金額は見る部門によって違うことがあるようなので5千円ごとに5千~2万円で変更できるようにして下さい。
〇完成イメージ
①利益のパラメーターを作成。5000円から2万円のパラメーター。
5000円ごとに切り替わる設定にする
②ビンの作成
利益のパラメーターに設定する
③利益のビンとオーダーID(個別のカウント)で並べる。作成したパラメーターも表示する
ーーーーーーーーーーーーーーーーーーーー
Q4_顧客ごとの数量と利益の分布をみたとき、数量が多いときに利益が上がりやすい傾向にあるカテゴリ・地域の組み合わせはどれですか?なお、R-2乗やP値は考慮しなくてよいです。
〇完成イメージ
ーーーーーーーーーーーーーーーーーーーー
Q5_カテゴリごとに顧客区分の売上の割合を見たとき、「大企業」で売り上がった比率が最も大きいカテゴリはどれですか?割合は各カテゴリを100%として計算してください。
〇完成イメージ
①売上・顧客区分・カテゴリを並べる
②簡易計算で合計に対する割合にする
③次を使用して計算で表(横)選択。各カテゴリを100%として計算される。
ーーーーーーーーーーーーーーーーーーーー
Q6_2016年に、1カテゴリ単体で20万円以上購入している顧客を教えてください。
1カテゴリごとに切り替えて表示できるようにしてください。
〇完成イメージ
①顧客名・売上を並べる。
フィルターには、顧客名を売上20万以上でセット
オーダー年を2016年
カテゴリをいれてフィルター表示にする
売上20万以上の顧客でフィルターしたのに、20万以下の顧客も表示されてしまう
理由は、フィルターの順番が同列になっているため。
オーダー年を2016年にフィルターし、カテゴリをフィルターしてから顧客の売上20万以上でフィルターしたい。
②オーダー年2016年・カテゴリをコンテキストフィルター化する
すると、20万円以下の顧客名が表示されなくなる。
コンテキストフィルターに入っているものはグレー表記になる
※補足
クエリ―パイプライン
ーーーーーーーーーーーーーーーーーーーー
Q7_各地域ごとの売上TOP3サブカテゴリを見たとき、全ての地域で存在している(TOP3にランクインしている)サブカテゴリはありましたか?なお、TOP5で見たい人やTOP10で見たい人もいるようなので、ビュー上で変更できるように工夫して下さい。
〇完成イメージ
①売上・地域・サブカテゴリを並べる
②売上を使用して順位(ランク)をつける
売上を入れて、不連続にする。
簡易表計算でランクにする
③次を使用して計算から、ペイン(下)を選択
④フィルターにランク計算された売上をいれる。連続の形で。
不連続だと単一でしかフィルタできない
⑤サブカテゴリをハイライトできるように、ハイライターの追加
ーーーーーーーーーーーーーーーーーーーー
Q8_カテゴリを絞ってメーカーごとの売上を確認しつつ、別の画面で気になったメーカーの売上明細を見ることはできますか?
〇完成イメージ
メーカーにの一部分をクリックすると・・・
別画面に画面遷移して、そのメーカーの明細表がでるようにできる
①明細表を作成
②ダッシュボードとして明細表を作成
③Q8のダッシュボードのフィルターアクションに以下のように入力
ーーーーーーーーーーーーーーーーーーーー
Q9_時系列に週ごとの売上推移を確認したいのですが、各週の売上をそのまま推移にしてしまうと特殊な売上などがダイレクトに反映されてしまい、傾向が見えづらいです。現在の週を含めた過去12週間の移動平均を見て、何月の週が売上の大きい傾向になるか教えてください。なお、12週間に満たない期間の売上は表示しなくて構いません。
〇完成イメージ
11月が一番高い傾向なのがわかる
①週のオーダー日と売上を入れる。
売上は、表計算の追加から
移動平均を選択
12週間の移動平均なので、前の値12を選択
②作成したグラフをそのままにしてオーダー月ごとに色分けしたい
※オーダー月をそのまま色に持って行ってもグラフの形が変わってしまう…
その理由はオーダー月は日付関数なので、グラフの形状が変わってしまう。
計算フィールドで以下のようにオーダー月を作成。以下は、オーダー月の数字のみを返す関数になる
DATEPART('month', [オーダー日])
③計算フィールドで作成したオーダー月(数字)を色に持っていく
④オーダー月(数字)を不連続に変える
ーーーーーーーーーーーーーーーーーーーー
Q10_2014年にオーダーされた注文について、売上高の合計が20万円を超えた製品はいくつありますか?シート上で一目見てわかるように工夫してみてください。
〇完成イメージ
オーダー年(2014年)のコンテキストフィルター
売上を用いた順位のランク数表示
ビュー全体で一目でわかるように
ーーーーーーーーーーーーーーーーーーーー
Q11_明細(1行)単位の売上をサブカテゴリごとにみたとき、外れ値を除いた最大値が最も高いのはどのサブカテゴリですか?また、そのサブカテゴリのオーダー回数は他と比べて多いですか?少ないですか?
〇完成イメージ
外れ値という概念は箱ひげ図を使用する。
外れ値をのぞいた最大値が最も高いのはテーブル、 オーダー回数は低い。
①サブカテゴリと売上を並べる。今回1行単位の売上なので、合計は外す(ディメンションにする)
②グラフの形状を円にする
③アナリティクスから箱ひげ図を挿入
④オーダーIDを個別のカウントで挿入
ーーーーーーーーーーーーーーーーーーーー
Q12_全地域の売上をマーケティング施策によりそれぞれ10%ずつ向上させたいと考えています。しかしマーケティング費用も限られているため、全カテゴリに対して施策を打つことができません。施策を打つと元の売上から10%,20%と10%単位で向上できると仮定して、最も少ない%で全地域の売上10%UPを達成できるマーケティング効率のよいカテゴリはどれでしょうか?また、その際何%UPする必要があるでしょうか? なお、基準になる売上は2016年のものとします。
〇完成イメージ
売上X%増加パラメータを10%ずつ増加させると
すべて達成した地域がわかるようなVIZにする
①パラメータで、シミュレーション対象のカテゴリを作成
②パラメータで、売上X%増加パラを作成する
表示形式は%。10%ごとに増加できるように設定する
③売上X%増加の計算式を作成する(上記2つのパラメータと連動したもの)
IIF([カテゴリ1]=[シミュレーション対象のカテゴリ],[売上]*(1+[売上 X%増加パラ]),[売上])
④2016年でフィルターして、各パラメータを表示する。
作成した計算式の売上X%増加をメジャーとして使用し、地域別に並べる
⑤リファレンスラインで売上100%・110%の分布を入れる
詳細に売上をいれてからリファレンスライン
⑥売上X%増加が売上110%以上になったら色付けする式をいれる
SUM([売上X%増加])>=SUM([売上])*1.1
ーーーーーーーーーーーーーーーーーーーー
Q13_各製品の売上を見ながら、同一画面内でに製品名をWeb検索することはできますか?
〇完成イメージ
①WEBページのコンテナを入れる
を入力
URLのアクションの追加から
以下のように入力
製品名をクリックすると検索される
ーーーーーーーーーーーーーーーーーーーー
Q14_オーダー日の四半期単位での売上推移を出荷モード別に確認し、各出荷モード別の2年後の予想売上を算出したいです。2年後に第2位の売上を出しているのはどの出荷モードですか?なお、予想モデルは自動で構いません。
〇完成イメージ
①四半期ごとに売上を並べ、出荷モードを色分けする
②アナリティクスから予測をいれる
③予測がディメンションになっているので属性に変える
ーーーーーーーーーーーーーーーーーーーー
Q15_サブカテゴリの数量と利益の相関をオーダー年の推移で確認したいです。2015年までの3年間で数量も利益も順調に成長したといえるサブカテゴリはどのカテゴリに所属しているでしょうか?また、そのサブカテゴリは2016年にどうなっているでしょうか?
〇完成イメージ
ページスクロールすると経年状況が線の経過でわかるようになる
以下が2013年~2014年
以下が2013年~2016年
①以下のように配置する
②履歴の表示を押す
次の履歴を表示するマークを「すべて」にする
表示を末尾にする