IoTやDXの時代には、大量のデータが発生する。それを扱い欲しい分析結果を手に入れる方法の一つが「問い合わせ言語のクエリー Query 」。
構造型問い合わせ言語のSQLを使う方法は、現在いろいろあります。無料で使えるもの、有料だけど性能が良いもの、プログラムをテキストファイルで作るもの、GUI(マウスでドラッグ&ドロップなど)が使え直感的に作りやすくメンテしやすいものなどいろいろあります。
技術者がデータ解析する場面では、求める結果を出すために使いやすくさほどのスキル不要で自由に編集できることが必要。
そのためには、本体DBに影響しないようにデータを抽出し、得られたデータを分析する方法が向いています。
基幹システムは、元データを入力し管理するために要求される厳密な定義とプログラム作成プロセスやエラー処理などが必要な専門家領域ですが、蓄積されたデータを利用するユーザーに求められるスキルはそれとは異なるのです。
日本では、両者を混同しシステムとそのデータ取り扱いを難しいものとして避けてきたことは問題ですね。
そこで少しまとめてみました。元データはエクセルやCSVなどの一覧表を想定しています。
クエリ使えるアプリ | 概要 | 備考 |
エクセル: 行フィルタ、列表示非表示、検索、合計やピボットテーブル |
エクセル機能や関数の利用できるが機能限定、都度作成必要、 |
元のデータが変化してしまう。 |
エクセル付属のパワークエリ | エクセル標準添付、機能豊富 | 元データに影響しない 元エクセル編集後も適用可能 |
MicrosoftのAccess | エクセルをリンク、GUI使える | 元ファイルの汎用分析プログラム Office365では使える |
Python付属の簡易DB sqlite3 | CSV読み込み、標準クエリ使える | フリーソフト、テキスト作成必要 |
Pythonアプリpolarsのクエリ | CSVやExcelを読み込み高速処理 | フリーソフト、テキスト作成必要 |
PythonアプリからDB接続しクエリ使う | 本格DBへ接続して分析できる | DBアプリ多数登場、フリーソフト、 テキスト作成必要 |