ユーザ用ツール

サイト用ツール


pentaho:start

文書の過去の版を表示しています。


Pentaho

オープンソースで開発されているBIツール「Pentaho」のインストール記録。

Pentahoはオープンソース形式で開発されているが、サポート付の有償版もある。無償版の「Community Edition」は、いわゆる便利機能が利用できないものの、中心となるサーバの主要機能は利用できるためそれなりに使えるが、技術や工夫が必要となる。充実したドキュメントが公開されているが、有償版を前提に作成されているため、Community Editionとは異なる部分もある。また、マニュアルの一部に不備があったり、落とし穴があるため注意も必要。ここでは、Community EdisionでBI基盤を構築する手順を記録しておく。

PentahoはJavaベースのソフトウェアで、Tomcatないしはアプリケーションサーバで稼働するBAサーバを中心として、いくつかのツールからなっている。ツールは、デスクトップアプリケーションとして利用するGUIツールと、BAサーバのプラグインとして利用するものがある。有償版の多くは、BAサーバ上のプラグインであるようだ。

BAサーバのインストール

準備

  • Linuxサーバ(Gentoo Linux)
  • JDK
  • PostgreSQL

 PentahoはJavaで書かれているため、JDKをインストールしておく。データベースサーバについては、MySQL、PostgreSQL、MS-SQLサーバ、Oracleなど主要なものに対応しているが、ここではマニュアルでお勧めされているPostgreSQLでインストールする。なお、データベースサーバがなくても内臓のHSQLDBで作動するため、データベースサーバの設定は必須ではないようである。ユーザとして試用する程度ならば、これで十分だろう。PostgreSQLについてはパッケージでインストールし、必要に応じてネットワークからアクセスできるように適当に設定をしておく。

 Linuxサーバ上に、「pentaho」ユーザを作成しておく。以降は、このユーザで作業を進める。

BAサーバダウンロード

 Community Editionをダウンロードする。

 コミュニティサイトの画面下部「Main Downloads」以下の「Business Analytics Platform」からBAサーバをダウンロードする。ダウンロードはSourceforgeから行われる。今回利用するバージョンは、Pentaho 7.0。バージョンによってインストール方法などが変更になっていたり、機能が増減していたりする一方で、マニュアルに反映されていない部分もあったりと、試行錯誤が必要。

 zipファイルでダウンロードしたら、アーカイブを解凍する。解凍すると「pentaho-server」フォルダができるので、以降はこのフォルダを起点に記述していく。pentahoにはTomcatが同梱されており、今回はこれを利用する。既にアプリケーションサーバやTomcatが利用できる場合は、sourceforgeからpemtaho-manualというファイルを落とせばよいようである。

$ unzip pentaho-server-ce-7.0.0.0-25.zip 

インストールと設定

 以下のドキュメントを参考に設定していく。一部、落とし穴がある。以下、パスはすべてpentaho-serverを起点にする。

 ディスプレイが接続されていない、ないしはGUIが設定されていない環境向けにJAVAの起動オプションを設定する。Community Editionの同梱のTomcatはstart-pentaho.shで起動するため、このファイルを編集する。ファイル内の「CATALINA_OPTS」に「-Djava.awt.headless=true」というパラメータを追加しておく。ただし、実際に利用してみてオプションの効果はよくわからない。

 以下のスクリプトを利用して、PostgreSQLに必要なデータベースを作成する。マニュアルには4つのファイルが記載されているが、Community Editionには3つしかない。

  • data/postgresql
    • create_jcr_postgresql.sql
    • create_quartz_postgresql.sql
    • create_repository_postgresql.sql

 これらのファイル内に、作成されるデータベースユーザとパスワードが記載されているため、必要に応じて編集する。以降、各所のDB設定では、ここで修正した内容に置き換える。ファイルはすべてSQLであるため、どのような形でもPostgreSQLで実行すればよいが、コマンドラインツール「psql」を利用する場合は、以下。

$ psql -U postgres -f data/postgresql/{ターゲットファイル}

 ここでマニュアルにない落とし穴。Quartzデータベースに不具合があり、そのままではpentahoの起動に失敗する。後の設定でテーブルのPrefixを設定するが、起動時の確認の際にはこの設定がうまく効いていないようで、テーブルの確認が失敗するようだ。なので、ダミーのテーブルを作成してやる必要がある。バグなのか?ソースを共有しているはずであるが、有償版では問題ないのだろうか?

 先ほど作成したquartzデータベースに、以下のSQLでダミーのテーブルを作成する。

CREATE TABLE "QRTZ" (
  "NAME" character varying(200) NOT NULL
);
pentaho/start.1480481103.txt.bz2 · 最終更新: 2016/11/30 13:45 by Wiki Editor

Donate Powered by PHP Valid HTML5 Valid CSS Driven by DokuWiki