データサイエンティストにおすすめの資格はありますか?
そうねぇ。統計学や機械学習についての深い理解が求められるから、少しレベルの高めな資格がいいかもね。
マッドサイエンティストにおすすめの資格はありますか?
その人は資格よりも治療が必要なんじゃない?
こんにちは、Yunです!
データ分析について勉強するなかで「データサイエンティストに役立つ資格がほしい」「データアナリストが取っておいたほうがいい資格を知りたい」と感じていませんか?
そんな疑問をお持ちの方に、こちらの記事ではデータ分析業務の仕事内容やおすすめの資格について解説します!
この記事を読むとなりたい職種に応じた求められるスキルの違いがわかります!
データ分析の仕事は将来性が高い
データ分析関連人材が不足している
2019年3月に経済産業省が公表した「IT人材需給に関する調査結果」によると、2018年のIT市場規模を基準とした中位シナリオでは2030年には約45万人の需給ギャップが生じると計算されました。
深刻な人手不足ですね!
ただしこれはIT人材全般に関する需給ギャップであり、データアナリスト・データサイエンティストなどの先端IT人材についてはより需給ギャップが大きくなります。
同調査では、IT需要の伸びが中位(2~5%)であるばあい、先端IT人材の需給ギャップは2030年で約54万人となるという試算がでています。従来型IT人材から先端IT人材に転換する「Reスキル率」が1.0%のばあい、従来型IT人材の需給ギャップは解消する見込みとなっていますが、従来型IT人材で先端IT人材の代替ができない以上、従来型IT人材いくら増えても先端IT人材が増えないかぎり需給ギャップは改善しないことになります。
替えが効かない人材なら、お給料は高くなりそうですね!
AI市場もデータ分析によって成り立っている
昨今世間をにぎわせているAIも、機械学習(ディープラーニング含む)によってなりたっており、優秀なAIはビッグデータが存在してはじめて作成できます。
「今後はAIに仕事を奪われる人と、AIを使いこなして仕事を増やす人の二極化が進む」とよく言われますが、データ分析にかかわる仕事はAI需要によって仕事が増える職業の最たるものです。
その意味では、データアナリスト・データサイエンティストなどに限らず、どんな職業の人も初歩的なデータ分析の知識は一般教養としてもっておくと便利な世の中になっていくと考えられます。
また、今後はデータ分析の業務が業界を問わず広がっていくことも予想できます。AI市場が拡大し、企業ごとの特性に合わせたAIの活用法が研究されつづけるなら、どの企業にも営業担当がいるのと同じように、データ分析担当がおかれる可能性があります。
現状はまだまだIT業界での採用が中心よ。
データ分析にかかわる主な職種
データサイエンティストとデータアナリストの違い
データサイエンティストとデータアナリストは業務内容の重なりが大きく、企業によっては一方の肩書きを与えられつつも両方の役割を求められることがあります。
ただし本来的な違いとしては、データサイエンティストは分析モデルを新しく「つくる」側で、データアナリストのほうは既存の分析モデルを「つかう」側です。
データサイエンティストはデータの加工・モデリングが主要な業務に含まれますが、多くのデータアナリストにはそれがありません。データアナリストもデータ分析はおこないますが、それに加えて顧客提案も主要な業務となります。
言い換えると、データ処理としてより高度な技術を求められるのがデータサイエンティストであり、よりビジネスセンスやコミュニケーション能力が問われやすいのがデータアナリストです。
名前が似ていてややこしいです!
データ分析業務に共通して求められるスキル
データ分析をおこなう際に共通して重要になるスキルには、上記のものです。
数学については、統計分野の知識が職務に直結します。統計の基礎知識については業務をしながらや資格の勉強を通じて身につける必要があります。
統計学以外では、プログラミングについても基本的な知識はあるほうがよいでしょう。データ分析で利用するプログラミング言語の二本柱は機械学習に強い「Python」と統計に特化した「R」です。そのほか、データベース処理には「SQL」も覚えることがほぼ必須です。
プログラミング言語は分析のための「言語」ですが、それをどう使うかの「思考」にあたるのがロジカルシンキングです。これはデータ分析に限らずすべてのビジネスパーソンに求められるスキルですが、データ分析は思考力によってプロダクトや提案の付加価値が大きく変わります。データ分析に共通して重要な思考力としては、特に仮説を立てる力が重要といえるでしょう。
入社後に身につく部分もあるけれど、これらはほぼ必須の知識になるわ。
データサイエンティストとはなにか
仕事内容
データサイエンティストの主な仕事は、ビッグデータの分析です。業務形態は自社のシステム対応とクライアントワークの2種類がありますが、どちらも業務内容の根本は共通しています。
ビッグデータの分析に関して幅広く携わることになる職種ですが、ほかの職種と区別してデータサイエンティストを置いている場合は、ビッグデータから目的のデータを抽出するための分析手法を決定する役割が重視されます。具体的には、目的に沿った分析モデルの構築と、そのモデルの有効性の検証をおこないます。
分析モデルとは分析処理の枠組みであり、データの構造や処理の流れをクラス図やシーケンス図によって視覚的にわかりやすくしたものでもあります。
作成した分析モデルに問題がなければ、それをサービスとして設計・実装していきます。
設計の段階では、具体的な手法をひとつひとつ決めていくので、データベースはなにを使用するか(DB設計)、どのような点検のしかたが有効か(保守設計)、コーディングのルールはどうするか(実装設計)などを設計モデルにしたがって適用していきます。
企業が提供している分析モデルのサービス事例としては、「ファンの行動とビジネス貢献の因果関係を分析するサービス」「消費者意識調査のデータを利用した広告効果分析サービス」などがあります。
求められるスキル
Googleが開発した「TensorFlow」は現在ディープラーニングフレームワークのなかでもっとも人気があるものと言っても過言ではありません。Google翻訳にも使われているフレームワークで、C言語やPython、Goに対応しています。ただし現場ではTensorFlowをPythonと組み合わせて利用することが多いので、Pythonに関した知識はデータサイエンティストにとって特に重要になります。
特に機械学習の知識が重要なんですね!
データアナリストとはなにか
仕事内容
データアナリストの職務内容は、大きくコンサル型とエンジニア型に分けられます。
コンサル型のデータアナリストは、データ分析をもとにクライアントの経営課題を解決したり商品開発を支援したりするのが仕事です。
コンサル型はデータ分析のスキルだけでなく、コンサルタントとしてのスキルも重要になります。すぐれたコンサルタントにはクライアントに行動をおこさせる提案力や、経営課題に気づくビジネスセンスも必要です。
エンジニア型のデータアナリストは、データの分析結果を業務に役立てる方法を見つけ出す仕事をします。サービス向上のためのシステム改善がエンジニア型の役割となるので、プログラミングの知識が重要になります。また、「エンジニア型」とは名がつきますが分析結果の活用にはマーケティングの知識もあるほうが好まれます。
求められるスキル
コンサル型のデータアナリストは、データサイエンティストほど高度なデータ分析の知識は必要ありません(PythonやRの基礎知識は必要です)。むしろ重要になってくるのは分析結果を顧客にレポートにして伝えたり、意思決定の提案をしたりするための資料作成のスキルです。そのためには、ExcelやPowerPointなどの定番オフィスソフトを使いこなして素早く質の高い資料を作成することが重要になります。
エンジニア型のデータアナリストは、コンサル型と比べて統計学やプログラミングのスキルがより役立つ仕事です。データサイエンティストと求められる職能の重なる部分も多いため、機械学習についての知識・経験も役立ちます。
コンサル型はコミュニケーション能力も大切になりそうです。
データエンジニアとはなにか
仕事内容
膨大なデータを分析するためにデータの整理や管理をおこない、活用基盤を構築するのがおもな仕事内容です。
たとえばユーザーの性別、年齢、購入履歴など膨大なデータをただ集めても、それらが整理されていなかったり加工されていなかったりするとせっかくのデータを活用することができません。
もしくは、データ活用基盤を構築したものの接続負荷に耐えられなかったり、システムが重すぎて使いづらかったりするなら基盤の修復が必要になります。
データエンジニアはクライアントのこのような課題を解決し、最適なデータをスムーズに処理できるようにします。データサイエンティストやデータアナリストは、データエンジニアによってあつかいやすくしてもらった情報をもとに分析や提案・意思決定をおこないます。
データエンジニアの業務は機械学習にかかわる場合も多く、データエンジニアとしてデータ処理の経験を積んでAIエンジニアにキャリアチェンジする選択肢もあります。機械学習における膨大な教師データを用意するのもデータエンジニアの仕事のひとつです。
データエンジニアとデータサイエンティスト/アナリストの違い
データエンジニアは上記のとおり、データ分析のインフラ基盤をあつかいます。これはデータサイエンティストが分析モデルを構築することよりもさらに土台となる素材の作成です。
データベース上にデータを整理していくことになるので、下記のデータベースエンジニアと職務内容が重なる部分もあります。
データエンジニアとデータベースエンジニアの違い
データエンジニアと名前が似ている職種にデータベースエンジニア(DBエンジニア)があります。どちらもデータベースをあつかいますが、DBエンジニアが社内DB全般を保守・管理・設計していくのに対して、データエンジニアはあくまでデータ分析にかかわるデータをあつかうのが仕事です。
データエンジニアがあつかうビッグデータは量も膨大ですし、生のデータはさまざまなDBにばらばらに置かれているのがふつうです。これらを収集しても耐えられる、耐久性と拡張性のあるシステムを構築するのがデータエンジニアの役割です。
似た名前の仕事多すぎです。
求められるスキル
データエンジニアはデータベース関連知識が必須かつ重要になるので、SQL言語の理解を含めてデータベースについては精通する必要があります。
また、クラウド関連の知識も求められることが多いのでアマゾンのAWS、マイクロソフトのAzure、GoogleのGCPなど定番のクラウドサービスの仕組みについては理解しておくことが望ましいと言えます。
大量のデータをあつかうデータ分析では、データを複数のサーバーやCPUで分割し、高速処理するのがふつうです。このような分散処理で用いるフレームワークはApache Hadoop、Apache Sparkが定番で、これらの使用経験や基礎理解も現場では求められることになります。
データ分析業の年収
データサイエンティストとデータエンジニアの平均年収は、厚生労働省提供の「job tag」によると以下のとおりとなっています。企業規模によってかなりの差があるので、あくまで目安としてください。
平均 | データサイエンティスト | データエンジニア |
---|---|---|
年収 | 557.5万円 | 534.6万円 |
年齢 | 43.7歳 | 40.8歳 |
就業者数 | 79,260人 | 207,400人 |
データアナリストについては「job tag」には記載がありませんでしたが、業務内容から考えてデータサイエンティストに近いものであると推測できます。
Google検索ではデータサイエンティスト、データアナリストの平均年収について690万円代とする求人サイトもあり、平均年収の数値は統計の母集団によってかなり差がでています。くり返しになりますが、平均年収はあくまで目安として確認してください。
それぞれの職種の平均年収に対する考え方については、こちらの記事でくわしく解説しています。
データ分析初級者に役立つ資格
データ分析初級者に役立つ資格とは、つまり未経験から就職・転職する際にもっておくと役立つ資格のことです。IT業務の未経験者であればまずはIT関連の全般・基礎的な知識があることを証明するITパスポートや基本情報技術者を取得するのがおすすめです。
プログラミング関連で優先して勉強すべきはPythonです。Pythonをつかえることを資格で証明できれば即戦力として評価されやすくなります。
ITパスポート
ITパスポートは経済産業省が実施する「情報処理技術者試験」のひとつであり、同名の国家資格でもあります(略称はIP)。情報処理技術者試験はレベル1〜4に分類されますが、ITパスポートは唯一のレベル1であり、IT系の資格試験の登竜門となっています。
ITパスポートはIT業務に従事する社会人の基礎知識を範囲とするので、これだけでデータ分析をおこなえるものではありませんが、未経験からIT業務に転職を考えている人はまずここからはじめてみるのがよいでしょう。
基本情報技術者
基本情報技術者は情報裏技術者試験のレベル2に分類される国家資格です(略称はFE)。
すでにある程度IT系の基礎教養がある人は、ITパスポートからではなくこの基本情報技術者試験から勉強しだすのがおすすめです。ITパスポートが一般常識的な知識を含むのに対し、基本情報技術者はITベンダー・エンジニアにとっての基本知識を求めるのでややレベルがあがります。
エンジニアにとって必須の知識が多くあつかわれているので、未経験から転職を考えている人が職場で即戦力となるのに役立つ資格といえます。
基本情報技術者についてはこちらの記事でくわしく解説しています!
Python3 エンジニア認定データ分析試験
Python3エンジニア認定データ分析試験は、一般社団法人Pythonエンジニア育成推進協会が主催する民間資格です。
Pythonに関する国内資格は2023年現在これとPython3エンジニア認定基礎試験しかありません。基礎試験のほうはPythonのより入門的な資格試験なので、データ分析試験よりも合格しやすくなっています。
ただし、データ分析業をめざす人はデータ分析資格を勉強することがおすすめです。基礎試験の範囲に加えて確率や統計、線形代数などについても勉強できるので、資格勉強をとおして業務について深く学ぶことができます。
G検定
G検定は一般財団法人ディープラーニング協会(JDLA)が主催する、ディープラーニング関連の基礎知識をもっていることを証明する資格です。
おなじくJDLAが主催するディープラーニング系の資格にE資格がありますが、そちらはより専門的な内容となっています。
基礎的な知識とはいえ、ディープラーニングを理解するには統計学やプログラミングの知識が必要になるので、IT業界に初挑戦する人にとっては応用的な試験に感じるかもしれません。
受験資格はなく、受験料もE資格の半額程度なのでAI分野の資格を保有しておきたい人には第一の候補となる資格試験です。
データ分析中級者に役立つ資格
ここでは、すでにデータ分析の業界に所属していたり関連業務に従事している人が、社内での評価を高めやすくなる資格を紹介します。
データ分析系の職種であれば、多くの場合これらの資格を保有していると資格手当が得られます。また、未経験者がこれらの資格を取得している場合は、かなり高いポテンシャルをもっていると評価されやすくなります。
応用情報技術者
応用情報技術者は情報処理技術者試験のレベル3にあたります(略称はAP)。応用情報技術者試験はシステム開発全般にかかわる応用的な知識が必要になります。範囲としては基本情報技術者と重なる部分が多いですが、それぞれより深い知識を求められます。
データベーススペシャリスト試験
データベーススペシャリスト試験も情報処理技術者試験のひとつです。こちらはより難易度の高いレベル4です(略称はDB)。この資格は保有していることがデータベースのプロフェッショナルであることの証明となるので、データエンジニアやデータサイエンティストであれば保有していると評価されやすくなります。
オラクルマスター
データベースで有名なものは「MySQL」や「Oracle Database」ですが、オラクルマスターは日本オラクルが主催する資格試験で、Oracle Databaseシリーズをあつかう技術力を認定する資格です。
ブロンズ、シルバー、ゴールド、プラチナと4つの階級に分かれており、いきなり上位を受験することはできず、下位から順に取得しなければいけません。ブロンズは基礎知識が対象ですが、シルバー以上は実務経験がなければ取得は容易ではありません。逆に言えば、シルバーを取得できれば即戦力として活躍することにつながります。
Oracle Databaseを利用している企業は多いので、まずはブロンズの資格勉強を通じてオラクルのDBに慣れてみるのがおすすめです。
E資格
E資格は一般財団法人ディープラーニング協会(JDLA)が主催する、ディープラーニング関連の知識・能力を証明する資格です。
ディープラーニングの知識をもった人材はIT業界で引く手あまたであり、そのスキルを証明する資格を取得しておくことは周囲からの評価を大いに高めます。
E資格の難易度は高く、ディープラーニングシステムを実装するためのしくみを数学的に理解していく力が問われます。問題数に対して制限時間も非常にタイトであり、知識だけでなく計算力の高さも必要になります。
ただし、E資格の合格率は70%程度あり、決して低くありません。受験にはJDLAの認定プログラムに参加する必要があるので、そこで勉強したうえで試験に臨めることが理由のひとつです。