データレイク とは

データレイクは、大規模な非構造化データ(正規化や統合などを行っていないオリジナルのデータ)を保管するためのストレージ領域を指します。データレイクには、フラットファイルシステムをサポートするコンピューターからメインフレームまで、様々なマシンを活用できます。ここでのデータの操作(データを構造化するなど)は、他のサーバーにデータを転送して実行されます。SNSやIoTから膨大な量のビッグデータが生まれる現代では、Hadoop Distributed File System(HDFS)等のツールを用いて、データ処理の高速化が図られます。

関連記事

  1. CIRCA法とは

  2. 決算短信とは

  3. 遅発性神経毒性試験とは

  4. 調質とは

  5. ホルダーとは

  6. リークサイトとは

  7. 退職金制度とは

  8. 電子計算機損壊等業務妨害罪とは

  9. 役員選任権付株式とは