ここ数回データサイエンスについて取り上げています。

私の関心はデータサイエンスとは何かということであり、大学でどのように教えられようとしているかということです。

今や日本では国を挙げてAI人材育成ということが言われデータその中でデータサイエンス教育という言葉がほとんど動議で出てきます。中学高校では統計教育が強化され、大学では文系理系に関係なくAI教育(?)が必要とされています。

そうした動きの中でデータサイエンスってなんだろう、(ビッグ)データの分析とAI機械学習に使われるデータサイエンスは違うように思えるけど、用語や目指しているものに違いがあるのではないかという素朴な疑問を感じているのです。

従来大学で教えられてきた「統計学」とはどう違うのだろうかということも関心があります。

 

そうしたもやもやの中で一年前に買った本がタイトルの『大学4年間のデータサイエンスが10時間でざっと学べる』です。「大学4年間で」ということはすでに教えられているカリキュラムを簡単に教えてくれる本だろうと思ったので買ったわけです。その時は斜め読みしただけでしたが、一年経ってみて、私の中で「データサイエンス」なる学問が何なのか混迷の度が深めているのでもう一度引っ張り出してきました。

 

 

[図解]大学4年間のデータサイエンスが10時間でざっと学べる
久野 遼平 木脇 太一
KADOKAWA (2019-09-13)
売り上げランキング: 23,037

 

前書きの最後に次のような文章をみつけました。

 

データサイエンスの未来

 

■データサイエンスは日進月歩している分野でもあります。取得可能なビッグデータも変わるでしょうし、人工知能技術の進展とともに社会的にデータサイエンティストに求められるニーズも表層的には変わっていくでしょう。実際本書でも扱っている、画像やテキストなど非構造化データの分析は、近年の技術進歩に支えられて流行するようになったものです。

またビッグデータ、人工知能、IoT、ブロックチェーンなど、複合的に技術革新が組み合わさった結果、社会の至るところでオートメーションエンジニアリング導入の流れが不可避的に進行しています。この流れの恩恵としてデータサイエンス業界でも今まで考えたこともなかったデータサイエンス課題が日々生まれています。ひょっとしたら、今までわれわれがデータサイエンス課題と思っていたものはほんの氷山の一角にすぎず、本当に面白いデータサイエンス課題にはまだ気がついてさえいないのかもしれません。

しかしそうであったとしても根本の計算や統計などの科学的知識は、そう大きく変わるものではありません。そして、こういう変化の激しい時代だからこそ、データサイエンスの基礎を学ぶことが重要であるといえます。本書が読者にとって基礎力のしっかりしたデータサイエンティストを目指すきっかけになったとするならば、筆者としてそれに勝る喜びはありません。

根本にある計算や統計などの科学的知識とは何かを見極めるようと思ってもっていますが、まずこの本に書かれている「データサイエンスとは何か?」を見ていこうと思います。

 

※ところで本書には「日進月歩する」という表現が出てくるが、日本語としては少しおかしく感じます。日進月歩で発展している(する)あたりでしょう。

 

図表が示されているのでそれを見てみましょう。

 

テキストにはデータサイエンスとはという文章はなく「データサイエンティスト」とはコンピューティング技術を活用しデータ収集と処理、統計学や機械学習的分析、意思決定や商品開発までの一連の流れを効果的に処理する技能を持った人を指すとあります。

 

データサイエンティストにはビジネス寄りの実務系と実装重視のIT系を峻別するようになっており、この本ははっきりと後者に焦点を絞ったものであると宣言してありました。

 

ということはデータサイエンスの全体像はこの本からはわからないことになります。

「大学4年間のデータサイエンスが10時間でざっと学べる」というのは冒頭からつまずいたことになります。私が知りたいことの片方しかわからないということになります。そしてこのあたりの混乱がやはりデータサイエンスということを語る時にあるということではないでしょうか。

 

IT系のデータサイエンスについてはよく概観できていると思いました。

 

かなり広い領域をカバーする「データサイエンス」を知る糸口を知ることができたのは収穫でした。AIのことに入っていきたいのですが、もう少し入り口を逍遥してきることにします。

 

[今までのところまでのまとめ]

このブログで紹介したサイト「データのじかん」にあるデータサイエンティストの解説

データサイエンス力」とは「情報処理、人工知能、統計学などの情報科学系の知恵を理解し、使う力」、 「データエンジニアリング力」とは「データサイエンスを意味のある形に使えるようにし、実装、運用できるようにする力」とされています。 前者はデータの解析力や分析力、 後者はデータの加工力に近いです。

https://ameblo.jp/blc/entry-12527829925.html?frm=theme

の区分の後者が今回取り上げた本で取り上げられていることということになります。

また滋賀大学データサイエンス学部河本薫教授が語られることは前者に近いことです。前者の中(ビジネス社会)での求められれいることはデータ分析だけではなく、経営の中核にあって意思決定する力を求められているが、まだ日本の大学も企業もそこまでいっていないということのようです。

 

 

 

[Dell]数量限定在庫一掃モデルがお得!