✍️blog

技術系のこととか

Google Cloud Certified Professional Data Engineerを取得した

今は違うのですが、前はデータサイエンスなこともやっていたのでデータエンジニアリングな部分は
地味に重要な役回りだなと感じていたので、この認定の取得を行おうと思いました。
他のクラウドベンダーだと関連しそうな認定がなかったり、英語限定だったりしたのでこの認定にしました。

これから受験しようと思っている方々のために、受験に向けてやったことや教材について書いていきます。

cloud.google.com

勉強前のスペック

  • データサイエンス系の業務経験あり
    • 機械学習系の基礎知識ぐらいは持っているのかなと思います。
    • そういえば数年前にG検定とってました。
  • GCPの利用経験なし
    • AWSは業務でそこそこ使っている(認定とかは持っていない)
  • SparkとかHadoopみたいな分散処理はほんの少しやったことがある(遊び程度)

勉強に使用したもの

Google Cloud Skills Boost - Data Engineer Learning Path

認定の説明ページからリンクされているLearning Pathです。

www.cloudskillsboost.google

講義 + 実際にGCPの操作を行いながら体系的に勉強していくことができますがすべてをやりきるには割と時間がかかります。

私の場合は、隙間時間とかでちょこちょこ進めて2か月弱ぐらいかかりました。

GCPで演習を行う部分についてはクレジットが必要になります。

一部の演習だけ行いたい人はクレジットを都度購入した方がよいですが、すべての演習をやりたい人は月額や年額のサブスクリプションを購入した方がお得です。

私の場合は月額サブスクリプションを購入しましたが、$30でした。
$30払えば演習やり放題と考えれば、認定の勉強用という観点だと個別にクレジットを購入する理由はあまりないですね。

良かったところ

  • 動画で基礎を抑えて、演習を行うという流れになっているので理解が深まります。

  • 演習環境は都度都度、演習用アカウントが払い出されたうえで行うので変な操作で事故ってめっちゃ請求されるということはありません。
    その代わり、意図していない操作をそのアカウントで行うと演習用アカウントが取り消されます。

  • 演習結果があっているか間違っているかチェックしながら進めることができるので長い演習などでさまようことがないです。 演習にそったCloud Storageのバケットを作成できているかどうかなどチェックしてくれます。

悪かったところ(気になるところ)

  • 動画の一部は日本語訳が用意されていましたが、ほとんどが英語→日本語翻訳で視聴することになり、わかりにくい部分もありました。

  • 動画内で説明をされている方で、訛りが結構ある(インド系なのかな)方がいてあまり英語ができない私には聞き取りが難しかったです。
    日本語翻訳を諦めて英語字幕で見ようとしたら、音と字幕とのギャップで挫折しました。。。

  • チャレンジラボという課題を与えられて自分なりに解決を策を考えるという実践的な演習があるのですが、
    これの中でマシンタイプがデフォルトのままだと不正操作とみなされ演習用アカウントが取り消されます。。。 (たしかDataprocでデフォルトのマシンタイプではなく弱いマシンタイプを選ばないダメでした。3回ぐらいやり直したかな。。。)

【最短攻略】Google Cloud 認定 Professional Data Engineer 模擬問題集

udemyの問題集です。

www.udemy.com

以前はこれのほかにもudemyに教材があったようですが、現在(2023/03)はこれだけみたいですね。

50問x3セット問題があります。実際の試験が50~60問で2時間なので模擬試験3セットという感じでしょうか。

良かったところ

  • 解説がついている
    たまに、問題と解答だけという問題集もあったりするので、これはありがたい。

  • 本番の試験でも似た問題が出題される
    私の場合はこの問題集の問題と近い内容の問題が実際に出題されました。その問題に関しては楽々と回答が出来ましたねw

  • 隙間時間にやることができる
    実際の試験同様問題を解き始めると2時間のタイマーが動き出すのですが、一時停止が出来たり、PCとスマホ両方で回答できるので 私は自宅のPCで一時停止して、移動中の電車の中でスマホで続きをやるというようなことをしていました。

悪かったところ(気になるところ)

  • 解説が正解についてのみ
    誤っている選択肢についてなぜ誤っているのかについて解説がありませんでした。

  • 一部文章が変
    問題文や選択肢の文章が日本語として不自然ななもの(機械翻訳にかけたような感じ)がありました。

Data Engineer 模擬試験

認定の解説ページが行ける公式の模擬試験ですね。
とはいえ、25問ぐらいの簡単なものです。

解説もきちんとしていましたが、udemyの問題集があったのであまり利用しませんでした。
1、2回ぐらい試しにやってみた感じですね。

docs.google.com

受験前の状態

Data Engineer Learning Path についてはとりあえず1週こなしました程度でした。

学習する(動画を視聴したり演習をパスする)と該当するコースにチェックがついていくのですが、とりあえず全部チェックつけるかぐらいの感覚ですね。
あまり深追いしてやるということはしなかったですね。
演習環境も演習によっては2時間ぐらい利用できるのですが、30分でサッと終わらせることもありましたねw

でも、適当にやっていたとしても、実際に触ってこんな感じなんだと体感するという観点ではとても意味のあるものだったかもしれません。

上記が終わった後は、udemyの問題集をひたすら解いては解説を読んで関連するGCPのドキュメントを流し読みしてというのを繰り返していました。

とはいえ、以下のような感じで3週目をやるころには問題文と解答のセットを覚え始めていたので間違えても数問程度という状態になってました。
ここまでくると、問題集を解いていてもあまり意味がないので、あまり理解できていないサービスのGCPのドキュメントとかを読んだりするのがセオリーかなと思いつつ
3週目をやったのが試験前日というのもあって開き直って、もう十分でしょ?と思い何もしませんでしたw

受験と受験結果

試験環境に余計なリスクを背負いたくなかったので、リモート会場ではなくテストセンターに行って受験を行いました。
私の受験したときは、udemyの問題集に近い雰囲気の問題が6~7割ぐらいでした。
1時間ぐらいで一通り回答して、残りの1時間でもう一周して回答の見直しをした感じです。たぶん普通に勉強した状態であれば、時間的余裕は割とある試験なのかなと思います。
結果は回答提出後すぐに表示されますが、これは暫定の結果で数日後に正式結果をメールで通知するよと表示されます。
私の場合は翌日届きましたw

そして、正式結果には認定おめでとうというメッセージとともにノベルティの案内も記載されています。
受験する時期とかによってノベルティは変わるのかなと思いますが、私の場合は以下でした。
この中から1つ選ぶことができて寄付するか、フリースか、マグカップのいずれかですね。

せっかくなので、寄付ではなく、ノベルティにしようと思いマグカップを選びました。(フリースじゃなくてパーカーならよかったのに
海外からの発送みたいなので気長に待つことにします。

まとめ

GCP未経験でも意外と合格できるレベルの試験かなと思います。
データサイエンスの知識が多少あってほかのクラウドを多少使ったことがあれば。
逆にGCPを割と使ってるよなんて人は、問題集をこなすだけで合格しちゃうんじゃないですかね。わかりませんけどw

ノベルティはいつ頃届くのかな?

via GIPHY