アーカイブ動画
『データマネジメントの勘所』を通じて、データマネジメントの価値向上に寄与
株式会社primeNumber
プロダクト開発本部
プロダクトマーケティングマネージャー 鳩 洋子氏
『データマネジメントの勘所』シリーズを主催しているのは、「あらゆるデータを、ビジネスの力に変える」というビジョンを掲げている、データテクノロジーカンパニーのprimeNumberだ。
データに関するさまざまな課題解決に取り組むprimeNumberでは、データ統合を支援するクラウドETL「TROCCO®」を筆頭に、蓄積されたデータを発見・理解・活用するクラウドデータカタログ「COMETA®」を展開。
さらにはデータ利活用の実現に向けたステップを一気通貫でサポートする「Professional Services」も手がける。
大企業からスタートアップまで、業界・業種を問わず2,000を超える企業や団体で導入されている。
一方で、TROCCO®のプロダクトマネージャーであり、当日はイベントのファシリテーターも務めた鳩洋子氏は、単にツールを提供するだけでは不十分だと語る。
「実際にツールをどう有効活用するのか、組織作りはどのようにすればよいのかといった点において、まだまだ知見が少ないと考えています」(鳩氏)
このように述べると共に、なぜ本イベントを開催し続けているのか、理由も併せて語った。
「データマネジメントに最適解はなく、企業や状況、技術の進歩により、日々変わりゆくものだと思っています。各社が実際にどのようにデータマネジメントに向き合っているのか。技術スタックだけではなく、試行錯誤や苦労、今後の展望といったいろいろな切り口で、リアルな話をお聞きし共有し合うことで、国内企業のデータマネジメントの知見共有、価値向上につなげていきたいと考えています」(鳩氏)
システム目線ではなくビジネスコンテキストに沿ったDWHを事業部と共創
株式会社アイスタイル
データ戦略推進部 山本 泰毅氏
株式会社アイスタイル
データ戦略推進部 土佐 智紀氏
最初に登壇したのは、アイスタイルの山本泰毅氏と土佐智紀氏だ。新卒でアイスタイルに入社した山本氏は、システムエンジニアとしてデータ抽出業務に携わるうちに、データ活用に興味を持つようになった。
データ基盤の構築や運用を経て、現在はデータ戦略の責任者として、データビジネスの企画やデータの利活用ならびに整備を推進している。
一方、抽出や可視化などデータに関する全般業務に携わってきた経験を持つ土佐氏。アイスタイルに入社した後も、Tableauを用いたデータの利活用などに携わり、2022年よりTROCCO®を使った運用保守業務などに従事。現在は分析系データモデリングを中心に活動し、データ活用環境の整理・改善に努めている。
化粧品に関するポータルサイト『@cosme』の運営などを手がけるアイスタイルは、創業以来、生活者中心の市場創造をビジョンに掲げ、独自のデータベースを活用し、マーケットそのものをデザインしてきた。
組織や年齢、バックグラウンドといった垣根を超え、お互いがリスペクトしながら議論を闊達に行う共創の精神を大切にしており、「アイスタイルらしいカルチャーでもあります」と、山本氏は述べた。
カルチャーが必要な理由についても、山本氏は言及した。上記スライドで示されているように、BtoB向けのマーケティング支援を行っている一方で、BtoC向けのEC事業など、さまざまな分野でいろいろなサービスを展開しているが、これらが一気通貫で連携しているからだ。
そしてその中心、根幹となるのが美容に関する「ヒト・モノ・コト・バショ」など、あらゆる関連データを保有しているデータベースというわけだ。「特に、購買行動に関するプロセスにはすべて介在しており、ユーザーIDも共通化しています」と、山本氏は述べた。
@cosmeの会員数は1000万人を超えていることから、膨大なデータが集まることが想像できる。だが、山本氏は「量はもちろんですが質にもこだわっています」と語り、リアルにユーザーとコミュニケーションできる場やイベントも積極的に展開していることも紹介した。
そしてこのような施策が奏功し、ECとリアル店舗を併用する顧客の割合が、徐々に高まっているという成果も示した。
一般的なOMO(Online Merges with Offline)との違いについても言及した。購買がゴールならびにコンバージョンとなることが多いOMOに比べ、アイスタイルの場合は商品との出会いはもちろん、アイスタイルとユーザーだけでなく、ユーザー同士のコミュニティなど、ゆるやかなつながりを大事にしている。
「コミュニティ分析の高度化など、今以上にメディア・EC・店舗を連携できる環境が求められていると感じています」(山本氏)
山本氏はこのように述べ、具体的にどのようなデータ基盤の構築ならびにマネジメントを行っているのかについて、土佐氏にバトンを渡した。
土佐氏はまず、現状と課題について述べた。山本氏が紹介したとおり、店舗、EC、メディアと3つの領域でデータ連携は行っているが、データウェアハウスなどそれぞれのデータ関連システムが異なっていたため、複合する際には複雑な処理が必要であった。
このような状態となっている原因についても言及した。それぞれの領域でのビジネスコンテキストに沿った成長戦略を推進してきたからであり、結果として全体最適なデータウェアハウスとなっていなかったのである。
具体的には、まさにビジネスコンテキストだ。同じ言葉であってもそれぞれの領域で背景や捉え方が異なるためである。
その結果、グループ全体で捉えた場合、類似クエリを量産していたり、部門横断によるデータ分析の深堀ができていないなどの課題が浮き彫りになった。
そこでシステム目線ではなく、ビジネスコンテキストに沿ったデータウェアハウスを開発しようとの解決策に取り組むことにした。ビジネスプロセスに紐づくビジネスイベントを発見し、整理していくこととしたのである。
この取り組みを推進するにはアイスタイルのカルチャーである、共創の精神がポイントであることに行き着く。そして実際に、事業部と密接にコミュニケーションしながら、フレームワークを活用し、共に洗い出していった。
具体的には概念を横軸に書き出すなどして、コミュニケーションを取りながら、イベントマトリクスのシートとしてまとめていった。実装においては、ディメンショナルモデリングの手法を用いた。
ディメンショナルモデリングを採用した理由も述べた。中でも、事業部側が理解しやすいことが大きかったと土佐氏は語る。
そして、これらのサイクルをアジャイル的にまわしていくが、そのためにはデータ部門側と事業部側の日頃からの関係構築が重要であることを、改めて強調した。
実装においてはdbtやTROCCO®を活用。BigQueryを利用しているが、それ以外のデータも取り込む必要があったこと、スモールスタートで始めたかったことなど、採用理由も併せて述べた。
土佐氏は紹介してきたデータウェアハウス再構築のフローを改めて振り返ると共に、最後のスタースキーマからテーブル化するフェーズにおいては、テーブル作成・運用後も事業部側とコミュニケーションを取り、イベントマトリクスを更新していく。その結果、テーブルも再びブラッシュアップされる。
「このような作業を何度も繰り返していくことで、ビジネスコンテキストに沿ったデータウェアハウスが設計されていくと考えています」と、述べた。
実際、抽出依頼数が10~20%削減したり、コミュニケーションのさらなる改善や活発化したりなど、事業部側からは自分たちが理解できる概念でデータの整理がされているので分かりやすい。データを扱う恐怖心がなくなり、自信につながったとの声が届くという成果が出ていることを話し、セッションを終えた。
TROCCO®を活用し、データ基盤運営におけるさまざまな課題を解決
株式会社バンダイナムコネクサス
データエンジニア 永野 啓介氏
続いて登壇したのは、2024年にバンダイナムコネクサスに入社した永野啓介氏だ。現在はアナリティクスエンジニアチームに所属。データレイクのコスト削減や新規追加データの設計や開発といったプロジェクトの、マネジメントやBIツールのガバナンス向上などの業務に従事している。
永野氏はまずは、バンダイナムコネクサスのデータ基盤のアーキテクチャ概要を紹介した。AWSやTreasure Dataから上がってきたデータがBigQueryに保存され、LookerやJupyterといったツールを使い、分析などに活用されていることが分かる。
データやシステムの量が多いため、処理や保守にかかるコストが増大している。また、新たなサービスやシステムの連携のためにツールやパイプラインが乱立するという課題もある。
そこで、これらの課題解決に向けてTROCCO®を導入する。フルマネージドサービスのため運用コストが削減したり、IaCにも対応したりしているのでインフラの開発コストも削減できていると、TROCCO®の導入によるメリットを述べた。
そして本講演ではTROCCO®による多くの成果の中から後段、以下スライドの赤枠の領域における取り組み、ダッシュボードやパイプラインの管理・運用について、詳しく解説した。
例えば、以下のような「作りっぱなしのダッシュボードがもたらす課題」がある。
ダッシュボードがあるとデータが可視化されているため、データに詳しくない人でも分析が容易になる。そのため数多くのダッシュボードを作成しているケースが少なくない。
一方でこのような背景からダッシュボードが乱立し、どのダッシュボードが効果的なのかが分からない。ダッシュボードの担当者が異動や退職した際に、次のメンバーにダッシュボードの管理や運用が引き継がれることなく放置される。
「本来は意思決定のためのBIが、かえって混乱を生んでいる」と、永野氏は指摘した。
そこでバンダイナムコネクサスでは、このようなダッシュボード関連の課題を解決すべく、プロジェクトや部署ごとに分散していたアナリティクスエンジニアを、バーチャルチームとして組織横断で組成することとした。
そして、ダッシュボードの課題を改めてブレストを通じ、明らかにしていった。すると、以下スライドで示したような大きく4つの課題が顕在化。それぞれ、対策を講じていった。
誰のダッシュボードなのかが不明という課題に対しては、ダッシュボードを一覧化。一覧化の作業においてはレポートIDに紐づけること、TROCCO®を活用することで、自動登録ならびに更新できるようにした。
しかし、当初はうまくいかなかった。それでも永野氏は、エラーを自ら検証することはしなかった。TROCCO®のQAに該当する対策がまとまっていたからだ。「TROCCO®のリファレンスは充実していると思います」と、述べた。
続いてはダッシュボードに紐づくリソースの乱立に対する取り組みである。ここでもTROCCO®の機能を活用することで、どのデータマートがどのデータツールに活用され、実際にレポートが作成されているかなどを一覧化した。
さらにはダッシュボードを引き継ぐタイミングで、データパイプラインの移行も実施。キャッチアップ工数の削減や、不要なリソースによるコスト増加抑制といった効果が得られた。
3つ目は、ダッシュボードの利用頻度が不透明な課題においては、閲覧状況を可視化し把握することで対策とした。
最後の4つ目、権限管理も含めたルールが不透明だった課題においては、Slackチャンネルを開設し、運用ルールを整備。特定の共通アカウントをオーナーに設定するなどの対策も講じた。
最後に永野氏は、アナリティクスエンジニアチームの認知や、ダッシュボードに関わるリソースの棚卸しといった今後の取り組みを、「各所とコミュニケーションを取りながら進めていきたいと考えています」と述べ、セッションを締めた。
TROCCO®を活用し、データ人材が少ない状態でもデータ活用ができる状況を構築
株式会社ドコモバイクシェア
野口 翔氏
続いては、ドコモバイクシェアの野口翔氏が登壇した。ドコモバイクシェアとはその名のとおり、NTTドコモ傘下の同社が手がける自転車シェアリング事業であり、好きな場所で自転車を借り、同じく好きな場所で返却できる。
このような手軽さの一方、保険も完備するという安心面も加わり、ニーズが拡大。現在では全国各地にサイクルポートを展開している。すると事業拡大に伴い、データ分析基盤が必要になった。
そこで、他の会社でBI開発などに取り組んでいた野口氏が、データ分析基盤はもちろん、組織の立ち上げから担うかたちでジョイン、現在に至る。また、本セッションは鳩氏が野口氏にインタビューを行うかたちで実施された。
データ活用を推進する背景とビジネス課題
鳩:データ活用を推進する背景について聞かせてください。
野口:事業の開始から10年目を迎え、サイクルポートの設置箇所は全国各地に約4000、東京などエリア別においても60ほどまでに拡大し、ここ数年は黒字を達成しています。
そこでさらなる収益化に向けて、駐輪場オーナーや自治体などにご提案する際、これまでの利用傾向などをデータとして提供する場面が増えてきました。そのためデータを抽出したりまとめる業務稼働の負担が増えてきたため、データ基盤を導入しようとの話になったと聞いています。
鳩:具体的にどのようなビジネス課題があったのでしょう?
野口:派遣社員も含めて全体で100名ほどの組織のため、そもそも専門のデータ人材を確保していませんでした。そのためビジネスサイドからデータの提出を求められた際、当初はプラットフォーム開発チームのエンジニアが行っていました。当然、通常の業務がありますから依頼されてもすぐに出せず、困っていたようです。
鳩:データ基盤がない状態では、データのマスキングや整形などができていませんから、いざ提供するにも時間やコストがかかったりしますからね。
野口:マスキングなどの作業もそうですが、主語が自転車であったりエリアであったり、ユーザーであったりしました。さらには求められるデータの粒度も色々と異なってくる。これらの業務をプラットフォーム開発エンジニアが片手間で行うのは、厳しいだろうと。
鳩:それで、データ基盤を構築しようと。推進に際してはプロジェクトチームのようなものが立ち上がったんですか?
野口:そもそも私の採用目的が、データ基盤構築に向けてでした。ですから最初は一人でした。ベンダーさんに依頼しようとも考えたのですが、規模が小さいために受けてもらえませんでした。
であれば社内でメンバーを増やせないかと考えたのですが、こちらも同じく組織の人数が少ないため、難しい状況でした。その結果、ツールに頼るしかないなと。
TROCCO®を選んだ決め手とは?
鳩:数あるツールの中からTROCCO®を選んだ決め手を教えてください。
野口:ドコモバイクシェアの社員は、私も含めて全員、親会社であるNTTドコモからの出向です。そのため今後も異動する可能性があるため、私だけが理解しているような状態はよろしくないと考えました。
また、専門的なデータエンジニアがこの先、異動してくることも難しいと思います。このような背景から誰でも簡単に扱え、ぱっと見て分かる。これらが第一条件でした。実際、いろいろなツールをトライアルしてみましたが、TROCCO®がUIやドキュメントに優れていましたし、分かりやすいと感じました。
そのように思っている中で、決定的なことが起きました。私以外にも派遣社員の方が手伝ってくれていたのですが、その方は非エンジニアでした。
でも、データに興味があるということでGoogle スプレッドシートからSnowflakeにデータを転送する作業をお願いしたら、すぐにできたんです。それを見て、他の方も同じように操作できるし扱えると思いました。
もう一つは、NTTドコモにはネットワークセキュリティにおける導入基準などが設けられているのですが、私はセキュリティには詳しくありませんでした。そこで、TROCCO®のサポートの方に手厚くケアしてもらえたのも、大きかったです。
鳩:TROCCO®が非エンジニアの方にも多く使われているとの話はよく聞きますが、派遣社員の方は元々事務職だったんですか?
野口:ええ。ただデータに触れるようになってからはさらに興味を持つようなり、今ではほぼエンジニアと化しています。
TROCCO®の活用状況について
鳩:TROCCO®の活用について、どのような事業課題に対してどんなデータの抽出を行っているかなど、具体的なユースケースを聞かせてもらえますか。
野口:毎日行っているメイン業務は、プラットフォームにある100個ほどのテーブルデータをAmazon S3に書き出し、Snowflakeに貯めることです。さらに、各プラットフォームから取り込んだテーブルデータを、データマートの機能を使い、分析用などBIツールに読み込ませるような処理も行っています。
自転車の修理や再配置を行うために日々、トラックで自転車を運んでいる業者さんがいるのですが、作業情報を日々Googleスプレッドシートに入力してもらっています。
その情報を見て以前はこちらから返信したり、データのバックアップ作業などを行っていました。しかし、現在同業務は自動化しています。また情報に異常値がないかどうかもTROCCO®に検知してもらっています。なお同業務に関しては、先ほど話した派遣社員の方が行っています。
そのほか、各種APIを叩いてSnowflakeにデータを貯めるといった取り組みもしています。
どのようにダッシュボードを運用しているのか
鳩:具体的にどのようなダッシュボードを運用しているのか、聞かせてもらえますか。
野口:シンプルなところでは、各駐輪場でどれだけ自転車が利用されているのか。逆に、自転車がどれくらいあふれてしまっているかといったデータを見るための、オペレーション用のダッシュボードがあります。
活用方法としては、駐輪場のオーナーから車両が少ないのではないかとの指摘があった際に、ダッシュボードを見せ、すぐに答えられるような状況を構築しています。
自転車の再配置や自転車修理を行う業者さんの実績も、こちらのダッシュボードのタブで見えるようにしています。その結果、どのエリアにどれくらい車両を配置すれば、より利用回数が増えるのか。検討材料にも活用しています。
鳩:TROCCO®の利用やダッシュボードの作成などを踏まえ、以前と比べどのような変化がありますか?
野口:データ基盤が立ち上がったことが、一番大きな変化だと思います。その結果、クライアントに対してデータをタイムリーに提供できるようになったり、こちらからデータを使った提案もできるようになりましたからね。
鳩:駐輪場の拡大がビジネス課題だと話されていましたが、こちらでの変化はどうですか?
野口:交通量がどれだけ増えているのか、観光用途として使われているか、など。以前と比べるとこれらの詳しいデータを可視化するなどしてより詳しく提供できているので、駐輪場の設置や、利用の継続を検討している自治体の方々は、納得感を持ってサービスの継続をされている方が増えているように感じます。
鳩:今後の体制について聞かせてください。
野口:派遣社員の方のスキルがアップしているので、現在はほぼ2名体制で取り組んでいます。今後、私は育休に入る予定もあるのですが、私が抜けた状態でもTROCCO®があれば現状がまさにそうであるように安定して動いているので、非エンジニアの方1人だけでも、問題なく稼働し続けると思っております。
実際、今もTROCCO®はほぼ手を触れることなく、分析やダッシュボードの開発といった業務にリソースを割けていますからね。
データ活用における今後の展望
鳩:最後に、データ活用における今後の展望を教えてください。
野口:今の話に重なるのですが、ChatGPTがデータ抽出業務を正しくできるようなことも確認しています。そのため私の役割はさらに薄まっていくだろうと考えていますし、それでいいだろうとも思っています。
それこそが真のデータの民主化だと思いますし、当社のようにデータ人材が少ない状態でも、データの活用ができる。このような状況を強めていきたいと考えています。