PySparkによる大規模データ処理手法と機械学習

Rating 4.43 out of 5 (29 ratings in Udemy)
What you'll learn
- 並列計算の基礎知識
- Pythonのプログラミング
- Spark, Hadoopについての知識
- PySparkのプログラミング
- Dockerの基礎
- Pandasの基礎
Description
本コースでは、大規模データを高速分散処理するためのフレームワーク"Apache Spark"を人気のプログラミング言語Pythonで実践します。
最近はビッグデータと呼ばれる大規模データを扱うケースがとても多くなってきており、そのようなデータを高速に処理するためには分散処理が必要になります。
分散処理??Spark??と思う人も多いかと思いますが、このコースでは分散処理とは何か、Sparkとは何かといった導入から、実際にPython(PySpark)で実装するまでを全て行いますので、未経験の方でも学ぶことができます。
皆さんのよく知る大企業でもSparkの技術はたくさん使われているので、この機会にSparkをPythonで扱う"PySpark"の扱い方を学び、これ …
Duration 8 Hours 58 Minutes
Paid
Self paced
Intermediate Level
Japanese
193
Rating 4.43 out of 5 (29 ratings in Udemy)
Go to the Course
We have partnered with providers to bring you collection of courses, When you buy through links on our site, we may earn an affiliate commission from provider.
Paid
Self paced
Intermediate Level
Japanese
193
Rating 4.43 out of 5 (29 ratings in Udemy)
Go to the Course