はじめに
初めまして。プラットフォーム開発部にてデータ基盤を整備しているkashiraと申します。
ピクシブではデータエンジニアリングのスキルアップを目的として、有志で Fundamentals of Data Engineering (洋書) の読書会を行いました。
この記事では、ピクシブのエンジニアがどのように日々のスキルアップを行なっているかの一例として紹介します。
なぜFundamentals of Data Engineeringを選んだのか?
私は業務として社内のデータインフラを整備しています。
データインフラを整備する際には、データエンジニアリングやデータマネジメントなどの知識や技術をキャッチアップし、データインフラを安定的に運用するだけでなく、利用者が素早くデータに関する意思決定を行えるようにし、コストを最適化するという成果が求められています。
2023年11月19日現在、日本語で書かれたデータマネジメントに関する本として「データマネジメント知識体系ガイド(DMBOK)」や「データマネジメントが30分でわかる本」などが存在します。
つまり、データマネジメントについては日本語で十分に知識をキャッチアップできる良書がいくつか存在していると感じています。
一方で、データエンジニアリングに関しては、日本語で書かれた参考書がなく、技術に関するキャッチアップに苦労していました(英語でも少ないですが)。
具体的には、ベンダーのドキュメントに書かれているベストプラクティスやこれまでの運用経験上の知識を整理しながら作業していましたが、どこに根拠が書いてあったのか思い出せず、ベンダーを跨いでのツール選定の基準が分からないなどの課題がありました。
そんな中、まさに自分が一番欲しかった情報をまとめている『Fundamentals of Data Engineering』という本を見つけました。
最初は本が英語で書かれているため、一人で頑張って読み切ろうと思っていました。しかし、社内ブログに1章を読んだメモを投稿したところ、複数の人から興味があるという反応をいただけたため、読書会として開催することにしました。
進め方
読書会の概要は以下になります
- 開催頻度
- 週1回60分 (業務時間内)
- 開催期間
- 2023年2月6日 〜 2023年11月6日
- 開催場所
- Google Meet
- 参加者
- 5人
- 事前準備
- 必要無し
進め方は社内の先輩エンジニアの声を参考にし、事前準備を完全になくして、その場で読んで感想を言い合う形式で進めていきました。
事前準備をなくすことで、英語の本ですが、準備が嫌になったり、飽きたりせずに読み進めることができました。
具体的にはこんな感じの流れです。
- その場で、どこまで読み進めるか決める
- 例: 前回は第1章を全て読み終わったので、今回は第2章の始めからKindleで10p先の hogehogeという節まで読む
- 読み終わったらMeetのコメントで反応する
- 全員が読み終わったら感想を言い合う
- 時間があれば1に戻って繰り返す
1番の部分は特に気をつけるようにしました。
というのも、今回の課題書は英語のみで書かれているため、雑に1章まで読むと決めると、それだけで60分経ってしまい、感想が言い合えなくなってしまいます。また、60分ずっと英語を読むのが辛すぎると感じる人もいるでしょうし、実際には1章を60分で終わらせられないかもしれません(自分自身もそうです)。
また、課題書をみんなKindleで買っていました。その理由としては、物理本だと翻訳が使えなかったりするため、英語が堪能でない人にとっては地獄となってしまうからです。
弊社には購入後は個人所有が可能な書籍購入制度があるので、これを活用しました。 inside.pixiv.blog
読んでみての結果・感想
自分はデータマネジメントよりもデータエンジニアリングの方が興味関心が高いので、かなり楽しく読むことができました。
また、ツールの選定、データモデリング、ELT、リアルタイムデータパイプライン、セキュリティなどについては実際の業務で参考になる部分が多く、今後も定期的に読み返したい内容でした。
特に、データツールの選定技術については実際の業務で試せて有益だったと感じました。
読書会を開くのが初めてだったので不安な点もたくさんありましたが、先輩社員のアドバイスや参加者が意欲的に出席してくれたこともあり、無事に全員で読破することができました!!
読書会にはインフラに詳しい人、バックエンドに詳しい人、分析に詳しい人が参加してくれて、それぞれの専門性が高い部分でたくさん補足していただき助かりました。
本当に読書会の参加者の方々に感謝です。
本記事の読書会はエンジニアのみが参加する形でしたが、データ分析はビジネスで利活用されてこそ価値を発揮します。そのため、現在は「LEAN ANALYTICS」の読書会を、ビジネス職も含めて部署横断で開催する取り組みも始めました。 www.oreilly.co.jp
今後もデータエンジニアリング・データマネジメントの専門家として、関連技術のキャッチアップを読書会などを通じて行っていきます。
最後までご覧いただきありがとうございました。