【基礎編】ELTとは?ETLとは?データ処理プロセスをわかりやすく解説
1. データ処理プロセスとは?
ビジネスにおけるデータ活用では、データを単に集めるだけでなく、整理・整形して、使いやすい形に加工するプロセスが欠かせません。
このデータ処理プロセスの代表的な手法が、ETLとELTです。
どちらも「データを活用できる状態にする」ためのアプローチですが、それぞれ流れや考え方に違いがあります。
2. ETLとは?
ETLは、Extract(抽出)→ Transform(変換)→ Load(格納)の頭文字を取った言葉です。
データの流れはこうなります。
- ・Extract(抽出)
社内システム、外部サービスなどから必要なデータを取り出す - ・Transform(変換)
抽出したデータを、分析や管理に適した形に加工・整形する - ・Load(格納)
変換後のデータを、データウェアハウスなどの保存先に格納する
ポイントは、
データをデータウェアハウスに入れる前に「変換(加工)」を完了させるところです。
3. ELTとは?
ELTは、Extract(抽出)→ Load(格納)→ Transform(変換)の順で進みます。
データの流れはこうです。
- ・Extract(抽出)
社内外からデータを取り出す - ・Load(格納)
変換せずに一旦すべてをデータウェアハウスに取り込む - ・Transform(変換)
必要なタイミングで、データウェアハウス上で加工・整形を行う
特徴は、
「まずすべてのデータを保存してから、あとで必要に応じて加工する」というスタイルです。
クラウド型のデータウェアハウス(BigQuery、Snowflakeなど)の進化により、大量データでも柔軟に変換できるため、近年ELT方式が主流になりつつあります。
まとめ
ETLは、加工してから保存する方式
ELTは、保存してから加工する方式
どちらも目的は同じですが、時代や技術進化によって、選ばれるプロセスが変わりつつあります。