【IT転職】データサイエンティストになりたい!

スポンサーリンク
データサイエンティスト

転職先の職業としてデータサイエンティストを志望する人は多いんじゃないでしょうか?

最近はAI技術を使った案件も多く出てきていますし、IT業界に止まらず幅広い業界でデータサイエンティストの求人情報が出ています。

今回はデータサイエンティストとはどういう仕事?どんなスキルや知識が必要なの?というところをまとめていきたいと思います。

「サイエンティスト」って肩書きがすでにかっこいいですね。
憧れます。

データサイエンティストって?

では最初にデータサイエンティストという職業がどういったことをするのか?という点を紹介していきます。

データサイエンティストの仕事内容は以下のような仕事が当てはまります。

  • 大量のデータの収集とデータを使いやすい形に整形
  • ビジネス上の課題に対するソリューションをデータからアプローチする
  • 統計情報の理解

これらの作業をするためにプログラミング、機械学習などについてもある程度理解を持っておく必要があります。

なんで最近人気なの?

近年はストレージが高性能化したり、IoTなどに代表されるようにセンサーから情報を得ることができるようになったり、エッジで計算ができるようになったり。。

というように莫大なデータを集められるようになりました。

そのため、

これらの大量なデータからなんか知見を得ることができないのかな?

という発想からデータを扱うための専門的な役職としてデータサイエンティストの人気が出てきています。

AIに学習させるにも基本的にはデータをAIの学習用に整形しないといけなかったり、AIのパラメータチューニングをやる必要があります。

データサイエンティストはこれらチューニングも行います。

データサイエンティストに必要なスキル

クライアントとのコミュニケーションスキル

データサイエンティストの作業は上で述べたようにクライアントが困っていることに対して大量のデータから知見を得てソリューションを提案することです。

そのため、まず第一にクライアントから困りごと、解決したいことをヒアリングする必要があります。

また、データサイエンティストとしてできることをしっかり伝える、ということも時に必要になります。

特に近年はAIの発展が望ましいので

  • とりあえずAIでいい結果が出せるんでしょ?
  • AIでなんかやってみたい(やった実績を持ちたい)

というようになんだかAIがどんな場面でも万能に結果を出してくれるみたいな感覚で見ている人がいます。

そういった方に分析でわかることがどこまでで、どんなことならできるということを適切にコミュニケーションする必要があります。

データ収集・整形スキル

データサイエンティストが扱うデータは非常に膨大なものになります。
そのため、収集にも多大な時間がかかるというのが現状です。

つまり、収集したデータをどのように整形して使うか正しく判断ができないとロスを産んでしまい最悪なんの知見も得られないということがあります。

正しく判断するためには分析手法や、ケースごとに適用する機械学習手法などの知識を持っている必要があります。

データサイエンティストに転職するためにやること

ここからはデータサイエンティストに転職するためにやることををまとめていきます。

  • 統計学
  • 機械学習、分析手法
  • プログラミング
  • データベース知識

が求められます。

何から手をつけると良い?

統計学

まず必須で身につけておきたいのは統計学の知識です。

データから予測をする際にも統計的な数値の取り扱い方をしっかり押さえておかないとせっかく集めたデータを上手に扱うことができません。

また、機械学習や分析手法の知識を勉強する際にも統計学の知識が最低限ないと意味がわからないことが多々あるので必須で押さえておきたい分野です。

機械学習、分析手法の知識

機械学習と聞くと「なんだかプログラムが学習していい結果を出しそう」な感じがしますが、実際にはいろんな手法の集合で成り立っています。

ニューラルネットワークからベイジアンネットワーク、K-means法などの教師なし学習などさまざまな手法があり、それらを知識を一通り持っておいて損はないでしょう。

プログラミング

データサイエンティストにプログラミングのスキルは必須です。

ビックデータを扱うことが得意なPythonや分析の得意なRがよく使われる言語です
最近は高性能なライブラリがそろっているので自分でスクラッチで作らなくてもほとんど人が作ったものを流用してパラメータを変更するだけでやりたいことができるようになっています。

ただ、プログラミングスキルをもっていないとどうしても使っているツールがブラックボックス化してしまうので、理解を深めるためにも積極的にプログラミングスキルは磨いておくことをオススメします。

データベーススキル

何度か書いているようにデータサイエンティストの扱うデータ量は非常に膨大です。そのためデータの格納場所も専用のデータベースになります。

データベースを扱うためのクエリの書き方や、Hadoopなどのプラットフォームの扱い方を学ぶ必要があります。

Hadoopは大規模データを扱う時に分散処理を使った分析を行うためのプラットフォームです。象のアイコンが特徴です。

完全に余談ですが、この象はHadoop開発者の一人のお子さんの象のぬいぐるみの名前がHadoopだったことから来たらしいです。

学習のためには?

データサイエンティストになるために身につけておきたいスキル、知識についてお話ししましたが、独学で修めるには結構コストがかかる上にどれくらいの知識量が必要なのかわかりにくいですよね。

そのため、Udemyを使って講師の方についてもらって学習するのをオススメします。PythonやRなどのプログラミングに関する学習はもちろん、データサイエンティスト専門講座もあるので、ぜひ一度見ていただくことをオススメします。

なんといっても

  • 専門のスクールに通うよりもぐっとコストが低くすむこと
  • 映像学習なのでスキマ時間で学習できる

のがメリットです。

まとめ

今回はデータサイエンティストに転職するために必要な知識、スキルについてまとめました。

また、データサイエンティストになるためにまず身につけておきたいスキルについてまとめました。

転職でデータサイエンティストになりたいと考えている方は

  • 統計学
  • 機械学習、分析手法
  • プログラミング
  • データベース知識

について学ぶことを最初に行いましょう。

タイトルとURLをコピーしました