分析プロセスを初公開!データ分析プロジェクトの進め方

分析プロセスを初公開!データ分析プロジェクトの進め方

2020年3月2日。新型コロナウイルス感染拡大の影響を受けて、全国の小中高校に臨時休校が要請された直後。 株式会社Rejouiでは定期的に行われている勉強会の一環として、コロナウイルスによるイベント開催への影響をレポートするデータ分析プロジェクトを開始しました。

有志で集まったメンバーはアナリストやデータサイエンティストだけでなく、データ分析業務に直接携わらない総務や広報のメンバーを含め、多様性に富んだチームとなりました。 
本記事では今回の分析プロジェクトの取り組み方について振り返りたいと思います。

取得するデータの検討

分析を始めるにあたり、まずは分析計画を練る必要があります。社内で普段使っている「分析ワークシート」をもとに皆で話し合いながら計画書を作成しました。 

 

通常の分析工程

①ISSUE
 調べたいことや疑問を記入(今回はあらかじめ決めてあった目的を記入)
②Hypothesis
 ISSUEをより具体的(定量的)に説明できる要素。関係していそうな事象
③Visualization
 仮説の裏付けとなるデータを可視化したもの
④Data
 どのようなデータによって仮説を証明することができるか。また、そのために必要なデータを入手するための手段 

分析ワークシートに沿ってプロジェクト実施

今回は実際の分析計画とは逆の手順で、分析ワークシートの右側の工程から作業を開始しました。 

分析業務の経験が全くないメンバーを含んでいたため、経験者のアナリストやデータサイエンティストが率先して説明を行ない、各メンバーに作業を分担しました。 気づき・仮説のディスカッションから新たな疑問が発生することもあり、②仮説・③アプローチの視点を何度か行き来しながらミーティングを重ねました。 

今回の分析工程

●データ収集各所のデータを手分けして取得(取得可能かどうかの判断も必要) 

●可視化資料作成収集したデータを集計し、グラフなどにまとめた可視化資料を作成

●可視化資料から得られた気づきをまとめる
 ・1項目1要点での箇条書きにする 
 ・同じ意見は統合する 
 ・抜け漏れや重複がないようにする 

●仮説気づきから考えた仮説について、妥当性を検討 

●KPI/KGI仮説が与える影響について、意見を出し合う(誰の役に立てそうか?どのようなサービスが作れそうか?) 

プロジェクトを取り巻く環境の変化

開始当初はオフィスにて定例ミーティングを行なっていましたが、当社は2020年3月27日より全社員在宅勤務を導入したため、以降はSlackでのやりとり、Zoomでのミーティングに切り替えました。 

元々社内ではSlackやZoomを使う文化があったため、オンラインだけのコミュニケーションになっても進行が遅れたり、やりづらさを感じることはなく進めることができました。 
オンラインになったことで意外にもコミュニケーション量は増加し、常にメンバーのタスクと締め切りを追うことができました。各メンバーがそれぞれの状況をみて手分けしながら残タスクを消化するなど、チームの連携が取れたと思います。 

まとめ

総務や広報など、分析未経験のメンバーを含めたプロジェクトは初めての試みでした。実際に参加したメンバーから多くの気づきが報告されたので、プロジェクト終了後に寄せられた感想・気づきを以下にまとめます。 

 ●未経験者と経験者が一緒に分析を行なうことによる相乗効果があった 

未験者にとって、仮説立てて分析を行なうなどプロジェクトの進め方のノウハウを得ることができた 
-全く未知のものであったデータサイエンスの工程を知った 
-「気づき」と「仮説」の使い分けについて学べた 

経験者にとって、未経験者への専門知識の説明、作業方法の伝え方を学ぶことができた 
-意図が伝わっているか、用語や手法に対する理解ができているかを都度確認しながら進めた 
-相手の知っている言葉に置き換えて説明を行なった 
-画面共有などを利用して、視覚的に作業方法を伝達した 

チームでデータ分析を行なう経験を経て、コミュニケーションや言語化の重要性を学んだ
-ミーティング欠席者に対する補足説明、情報レベルの共通化を強化した 

●組織全体として、データ分析業務に対する理解が深まった 

データ取得の作業について、手作業のものから自動化までさまざまある 
-世の中に溢れる情報のうち、分析にそのまま使える状態のデータはとても少ない
-取得したデータを分析に使える状態にするために行う前処理の重要性と、作業の煩雑さ 
-データソースは一次情報を参照することが大切 

●多様な視点により、1人では気づけなかった意見を聞くことができた 

-同じデータを見ても、人それぞれ意見や解釈は異なる 
-経験が違うからこそ、多様な意見が飛び交った 

●組織を横断したコミュニケーションが活性化した 

-普段共に仕事をすることがないメンバーの考えを知り、お互いの理解が深まった
-在宅勤務中にオンラインで顔を合わせる機会を作ることができ、コミュニケーション量が増えた 

このようにたくさんの感想が寄せられました。分析プロジェクトを行なう上で、分析手法スキルや統計・数学の知見はもちろん大切ですが、多様な立場からの意見が議論により合体・発展を経て、新しいアイデアを生み出すことも分析には欠かせない工程です。 

  •  目的に沿ったデータを収集・可視化する 
  •  可視化した資料を見て気づきを得て、仮説を立てる 
  •  気づき・仮説から、行動指針や打ち手を考える 

この一連のプロセスは、データ分析を本業としない人であっても、状況を把握して行動や意思を決定する考え方としてとても重要です。 

5Gが普及し始めた現在、データを読み解く力は以前より重要性を増しています。データから見える事実×多様な視点を持った意見のディスカッションが生み出す価値は、これからより大きな意味を持ちデータサイエンスの現場で活きてくるでしょう。 
本投稿が「未経験者でも、データサイエンスによる課題解決ができる」と思っていただけるきっかけとなれば幸いです。 

 

こちらの記事で今回のプロジェクトの分析結果レポートについてご紹介しています。ぜひ、あわせてご覧ください。

 

【この記事を書いた人】

早坂 亜紀 (はやさか あき)
株式会社Rejoui
データサイエンティスト

「働きやすい組織」の実現を目指し、エンゲージメントやメンタルヘルス向上・採用支援などHR領域でのデータ分析を担当。15年以上歌手活動をしており、毎月のレギュラーライブをはじめ都内各所でライブ活動を行う。