スマート ガジェットの世界では、あらゆる小型デバイスからエンタープライズ クラスのマシンまでが大量のデータを生成しており、これがこの用語の進化につながります。ビッグデータ。ビッグデータが登場した今、大企業にとってそれを扱うのは大きな課題となっています。しかし、大きな問題には大きな解決策が必要であり、これを解決するためにオープン ソースが登場し、利用可能なオープン ソース ツールが数多くあり、それらはビッグ データ分析において中小企業から大企業まで簡単に支援できます。オープンソースツール今では、ビッグデータ ソリューション、ビジネス インテリジェンス、予測分析、e コマース、などなど。たくさんありますオープンソースのデータ分析アプリそして全員がUSPを持っています。
ビッグデータ分析に利用できるほとんどのツールはオープンソースであり、Apache はその分野をリードするツールです。本日はこちらを特集させていただきましたトップのオープンソース データ分析ソフトウェア ソリューション。これらのビッグ データ分析ツールはすべて、エンタープライズ レベルの要件に対応できるように構築されています。ここでは、トップのオープンソースビッグデータ分析ツールをいくつか紹介します。
1.ハドゥープ
アパッチハドゥープはビッグデータの世界では有名な企業であり、説明の必要はありません。 Hadoop は、コンピューターのクラスター全体で大規模なデータ セットを分散処理するために使用するフレームワークです。単純なプログラミング モデルを使用します。 Hadoop は、ローカル コンピューティングとストレージとともに、単一サーバーから数千台のマシンまでスケールアップできます。このフレームワークは、高可用性を実現するためにハードウェアに依存するのではなく、アプリケーション層で障害を検出して処理するように設計されています。
2. スパーク:オープンソースのデータ分析アプリ
Spark は、メモリ内では Hadoop MapReduce よりも最大 100 倍、ディスク上では 10 倍高速にプログラムを実行することを約束する Apache プロジェクトでもあります。 Apache Spark DAG 実行エンジンは、非周期データ フローとインメモリ コンピューティングをサポートする高度な実行エンジンの 1 つです。 Spark は、SQL と DataFrames、機械学習用の MLlib、GraphX、Spark Streaming などのライブラリのスタックを強化します。詳細については、こちらをご覧ください。
3. テイルンド
Talend はオープンソース プロジェクトですが、Apache のような財団ではなく、営利目的の企業によって運営されています。 Talend は、需要のバランスをとるために、商用製品と無料製品の両方を提供しています。 Talendの無料のオープンソース製品はTalend Open Studioと呼ばれ、Open Studio for Big Data、Open Studio for Data Integration、Open Studio for Data Quality、Open Studio for ESB、およびOpen Studio for MDMで構成されます。Talend Data Analyticsをダウンロードします。
4.ジャスパーソフト:オープンソースのデータ分析アプリ
Jaspersoft は、Talend が商用の有料製品と無料製品の両方を提供しているのと同様に、オープンソースのビジネス インテリジェンス ツールです。には、無料と有料の複数のエディションがあります。提供されるビジネス インテリジェンス ソフトウェア エディションは Community (無料およびオープンソース エディション) で、残りの有料エディションは Reporting、AWS、Professional、Enterprise エディションです。ジャスパーソフトをダウンロード
5.ラピッドマイナー
RapidMiner の Web サイトでは、自社がナンバー 1 のオープンソース データ サイエンス プラットフォームであり、新しい 2017 年のデータ サイエンス プラットフォームに関する Gartner マジック クアドラントのリーダーであると主張しています。高価値のデータ サイエンスのための共同分析プラットフォームを提供します。 RadipMiner プラットフォームは 3 つの異なるモジュールで構成されています。
- ラピッドマイナースタジオ
- RapidMinerサーバー
- RapidMiner Radoop
これら 3 つはすべてオープンソースであり、無料ライセンスと有料ライセンスの両方が付属しています。最初は、3 つのモジュールはすべて無料です (ユーザーによって異なります)。RapidMiner をダウンロード。
6. 嵐
Apache Storm も無料で、オープンソースのデータ分析アプリリアルタイム処理で知られています。あらゆるプログラミング言語で使用できます。リアルタイム データ分析、オンライン機械学習、分散 RPC、継続的計算、ETL など、さまざまな目的に使用できます。スケーラブルで耐障害性があり、高速処理機能があり、操作と展開が簡単です。 Apache Storm は、Flipboard、Yahoo、Twitter、Spotify などの多くの有名企業によって使用されている、無料のオープンソースの分散型リアルタイム計算システムです。Apache ストームをダウンロードします。
7.H2O
H2O の Web サイトは、H2O が世界ナンバー 1 のオープンソース人工知能 (AI) または機械学習プラットフォームであると主張しています。高速なパフォーマンスを提供するインメモリ テクノロジーを使用しています。 H2O 機械学習および予測分析ソフトウェアは、Java で完全にゼロから書かれており、Apache Hadoop や Spark などの最も人気のあるオープンソース製品とシームレスに統合されます。 H2O は、クラウド、オンプレミス、ワークステーション、サーバー、クラスターのどこにでも簡単に導入できます。H2oをダウンロード
8. 発光:オープンソースのデータ分析アプリ
Lumify は、オープンソースのビッグデータ分析および視覚化プラットフォームです。 Lumify はエンティティ間の関係を簡単に分析し、2D または 3D でリンクを確立できます。 Lumify Web サイトの Aso では、Lumify の仕組みを理解するためのビデオをいくつか提供しています。ビデオは、Lumify グラフの視覚化、Lumify マップの統合、検索をルミファイする、 そして詳細ペインを輝度化する。ルミファイをダウンロードします。
9. Apache ドリル
Apache Drill は、Hadoop、NoSQL、Cloud Storage 用のスキーマフリーの SQL クエリ エンジンです。 Apache Drill は、Google Cloud Storage、Swift、NAS HBase、MongoDB、MapR-DB、HDFS、MapR-FS、Amazon S3、Azure Blob Storage、ローカル ファイルなど、さまざまな NoSQL データベースとファイル システムをサポートしています。Apache ドリルをダウンロードします。
10. HPCCシステム
HPCC Systems は、ビッグ データの処理と分析のためのオープンソースの並列処理コンピューティング プラットフォームです。データをクエリするための標準ベースの Web インターフェイスを提供します。汎用ハードウェア、組み込みの分散ファイル システム上で実行でき、数千のノードにスケールアウトでき、耐障害性があります。HPCC システムをダウンロード
また、以下をお読みください: