root/tPod/trunk/README

リビジョン 126, 14.5 KB (コミッタ: masa, 4 年 前)

tPod->tacoPotへの名称変更作業(とりあえず完了版)

行番号 
1********************************************************************************
2本プログラムは、「Rinza公衆使用許諾契約書 第1.0版」に基づいて提供されています。
3「Rinza公衆許諾契約書 第1.0版」は、パッケージ内の"LICENSE"ファイル、および次に
4示すURLにおいて参照することができます:
5        http://www.tyzoh.jp/rinza/licenses/LICENSE-1.0.txt
6本プログラムにおけるオリジナル・プログラムの初期開発者は、日本ユニシス株式会社で
7あり、その著作権は日本ユニシス株式会社が所有しています(The Original Program is
8copyrighted (C) 2005 by Nihon Unisys, Ltd. with all rights reserved.)。
9
10本プログラムは現状有姿にて提供されるものとし、明示・黙示を問わず、プログラムの
11瑕疵の不存在、商業的な使用可能性、使用目的に対する適合性を含め、いかなる保証も
12なしに提供されるものです。
13また、日本ユニシス株式会社をはじめとするRinzaソフトウェアの開発に携わっている
14団体および個人は、本プログラムの使用によって発生するいかなる損害に対しても一切の
15責任を負わないものとします。
16
17なお,上記の”本プログラム”および”オリジナル・プログラム”の定義については、
18「Rinza公衆使用許諾契約書 第1.0版」を参照ください。
19********************************************************************************
20
21                             Rinza tacoPot
22                             ==============
23■ tacoPot について
24tacoPot はキーワード付けによる検索を提供するエンジンです。
25検索対象に任意のキーワードをつけることで、利用者視点での意味づけ/分類といった folksonomy が行え、検索性能と利便性が高まります。
26
27■ 主な機能
28-- 0.8 の追加機能
29   JSP版UIをAjaxでのUIに変更
30   tPodから名称をtacoPotに変更
31   
32-- 以前からある機能
33・ JSP 版 UI
34・ Polling(他ファイルシステムのファイルを監視して自動登録)
35・ tacoPot-WebDav (WebDav インタフェース)
36・ SOAP/XML (SOAP/XML で tacoPot にアクセス)
37・ SSDB 新バージョン対応(limit/offset 等)
38・ SSDB 対応
39 Rinza RDF Repository 以外に SSDB をリポジトリとして使用できるようになりました。
40 (SSDB の動作環境が Linux 用のため、SSDB 版 tacoPot も Linux のみ対応となります)
41・ キーワード付け
42 利用者が好きなようにキーワードを付け、それを基にした検索を行うことができます。
43 キーワードはワンクリックで選択することが可能です。
44・ 自動キーワード抽出(5.2 の追加機能)
45 テキストファイルのキーワードを自動的に抽出します。
46・ コメントづけ(0.5.2 の追加機能)
47 利用者が自由にコメントをつけられます。
48・ URL 登録(0.5.2 の追加機能)
49 ファイルだけではなく URL を登録できるようになりました(ただし全文検索の対象外です)。
50・ 全文検索連携
51 全文検索エンジンと連携し、キーワード検索だけではなく全文検索も行えるようになります。
52・ アクセスコントロール
53 検索結果にアクセス制限を掛けることができます。
54・サマリ表示(0.5.2 の追加機能)
55  画像縮小表示、コメントサマリ、キーワードサマリを表示できるようになりました。
56
57■ 次期バージョンでの開発アイテム(予定)
58・Google 連携
59・大規模対応
60
61■ リリース日時
622007年9月
63バージョン名
640.8 tacoPotに名称変更
65
662007年6月
67バージョン名
680.7.1 tPodの最終バージョン
69
70■ 配布内容
71
72tacoPot-0.8.zip
73
74このファイルを任意のディレクトリで展開すると次のような構成となります。
75├─config
76├─doc
77├─lib
78├─src
79│  └─jp
80│      └─tyzoh
81│          └─rinza
82│              └─folksonomy
83│                  ├─tacopot
84│                  ├─tacopotclient
85│                  ├─tool
86│                  ├─search
87│                  └─common
88└─servlet
89    ├─WEB-INF
90    │  ├─lib
91    │  │  └─classes
92    │  ├─jsp
93    │  ├─tags
94    │  ├─xsl
95    │  └─classes
96    │      └─jp
97    │          └─tyzoh
98    │              └─rinza
99    │                  └─folksonomy
100    │                      ├─tacopot
101    │                      ├─search
102    │                      └─common
103    ├─icon
104    ├─files
105    └─guide.files
106
107直下の makefile, application.properties などが編集対象となります。
108後述の「インストール方法」をご覧ください。
109
110■ 動作環境
111・OS(下記いずれか)
112 Windows 2000, XP
113 Linux(FedoraCore4 以降で動作確認済み)
114
115・MW
116Apache (無くても可)
117Tomcat (5以降で動作確認済み)
118Rinza RDF Repository もしくは SSDB(svn から最新版(rev 220 以降)を落としてください)
119
120・AP
121namazu(無くても可)
122mecab(無くても可)
123
124・DB
125- Rinza RDF Repository を使う場合は PostgreSQL もしくは MySQL
126(DB は Rinza RDF Repository 経由で使用しますので、Rinza RDF Repository がすでに稼動している場合は不要です。)
127- SSDB を使う場合は BerkeleyDB
128
129■ 環境設定
1300.Apache/Tomcat および Rinza RDF Repository / SSDB の設定
131Apache/Tomcat とも、特別な設定は不要です。下記ディレクトリからダウンロードし導入してください。
132Apache - http://www.apache.jp/misc/download.html
133Tomcat - http://jakarta.apache.org/site/downloads/downloads_tomcat.html
134servlet が動作することが確認できていれば問題ありません。
135なお、Basic 認証/Digest認証/クライアント認証、いずれでも動作確認が行えており、クライアント認証を用いる場合は、クライアント証明書の CommonName をユーザ名として扱うようにしています(tacoPot の利用者はログイン手続きが不要になります)。
136
137- Rinza を使う場合
138Rinza も特別な設定は不要です。
139Rinza - http://dev.tyzoh.jp/trac/rdf-repo/
140よりダウンロードして導入してください。すでに稼動している Rinza RDF Repository があれば、そちらを流用することも可能です。
141
142- SSDB を使う場合
143SSDB も特別な設定は不要です。
144SSDB - http://dev.tyzoh.jp/trac/semi-structured-db/
145よりダウンロードして導入してください。すでに稼動している SSDB があれば、そちらを流用することも可能です。
146
1471.全文検索エンジンの設定
148全文検索エンジンとして namazu に対応しています。
149下記 URL から namazu をダウンロードし、適宜導入してください(無くてもキーワード検索は可能です)。
150http://www.namazu.org/#download
1512.0.14 以降で動作確認をしております(セキュリティホール等の問題もありますし、最新の office ドキュメント等を検索対象にする場合はできるだけ最新版 2.0.16 をお使いください)
152
1532.tacoPot が管理する ファイルを保存するディレクトリが必要です。
154任意のディレクトリを作成してください。
155
1563.zip を展開したディレクトリにある application.properties に 1. および 2. の設定を反映させます。
157次の記述にしたがって application.properties を編集してください。
158
159-----  application.properties(一部抜粋) 開始 -----
160#tacoPot のファイルを保管するディレクトリ
161#podDirectory=/var/lib/tacoPot/files/
162#podDirectory=c:\\tacoPot
163
164#全文検索エンジンのパス(*)
165command=/var/lib/tacoPot/namazu.sh
166#command=c:\\namazu\\bin\\namazu.exe -l
167
168#全文検索エンジンのインデックス生成プログラムのパス(*)
169index=sh /var/lib/tacoPot/mknmz.sh
170#index=c:\\namazu\\bin\\mknmz.bat c:\\tacoPot -O
171
172#全文検索エンジンの「インデックス」ディレクトリ
173indexDirectory=/var/lib/tacoPot/index/
174#indexDirectory=c:\\\\tacoPotIndex\\\\
175
176#Windows は指定なし、Linux 系は euc-jp
177#encodeType=euc-jp
178#encodeType=UTF-8
179
180#検索結果をインライン表示するか否か
181#inline=false
182
183#イメージの縮小表示サイズ。どちらかが 0 のときは縮小表示なし
184#thumbWidth=40
185#thumbHeight=40
186
187#キーワードのサマリーの表示桁(文字数)。0 のときはサマリ表示なし。
188#keywordSummarySize=60
189
190#コメントのサマリーの表示桁(文字数)。0 のときはサマリ表示なし。
191#commentSummarySize=60
192
193#利用するリポジトリ
194# Rinza 利用の場合はこちら
195#repository = jp.tyzoh.rinza.folksonomy.tacopot.Rinza
196# SSDB 利用の場合はこちら
197repository = jp.tyzoh.rinza.folksonomy.tacopot.SSDB
198
199# Connector
200# Rinza RDF Repository のサーバ IP アドレス(Rinza を使わない場合は指定不要)
201connector.agent.address=localhost
202# Rinza RDF Repository のエンコードタイプ(Rinza を使わない場合は指定不要)
203connector.encoding=Shift_JIS
204-----  application.properties 終了 -----
205
206*)tomcat の実行時の文字コードと異なると検索に失敗することがあります。
207次のようなシェルを書いて回避することができます(LANG が euc-jp の場合)。
208--namazu.sh start--
209export LANG=ja_JP.eucJP
210namazu -l $1 /var/lib/tacoPot/index
211--namazu.sh end--
212
213mknmz.sh
214--namazu.sh start--
215export LANG=ja_JP.eucJP
216mknmz /var/lib/tacoPot/files -O /var/lib/tacoPot/index
217--namazu.sh end--
218
2194.自動キーワード抽出ライブラリの入手
220自動抽出を行なわない場合でもコンパイルのために、ライブラリが必要となります。
2210.6.1 からはパッケージに含まれていますのでこのまま利用が可能ですが、最新版
222の適用をお勧めします。
223
224・最新版の適用方法 -ここから-
225http://dev.tyzoh.jp/trac/folksonomy から
226最新版をダウンロード、もしくは svn によりチェックアウトし、
227(autoKeywod)/trunk/src/jp/tyzoh/rinza/folksonomy/keyword
228および
229(autoKeywod)/trunk/src/jp/tyzoh/rinza/folksonomy/analyze
230を tacoPot の
231(tacoPot)/trunk/src/jp/tyzoh/rinza/folksonomy
232以下にコピーしてください。
233・最新版の適用方法 -ここまで-
234
235また、自動抽出を行なう場合は、形態素解析エンジンとして MeCab をダウンロードしてください。
236http://mecab.sourceforge.jp/
2370.93 で動作確認をしております。
238
239-----  application.properties(一部抜粋) 開始 -----
240#キーワード自動抽出候補の数。0 のときはキーワード抽出なし。
241autoKeywordSize=10
242#analyzer = jp.tyzoh.rinza.folksonomy.keyword.Mecab
243#mecab のパス
244analyzer.command =/var/lib/tacoPot/mecab.sh
245#analyzer.command = c:\\mecab\\bin\\mecab.exe
246#searcher = jp.tyzoh.rinza.folksonomy.searcher.Namazu
247-----  application.properties 終了 -----
248
249■ インストール方法
250☆0.8 以前の機能を主として使いたい方
251
252zip を展開すると lib ディレクトリがあります。
253commons-fileupload-1.0.jar  - http://jakarta.apache.org/site/downloads/downloads_commons-fileupload.cgi
254servlet-api.jar             - tomcat の common/lib からコピーしてください
255rinza-rdf.jar               - (Rinza を使う場合)http://www.tyzoh.jp/rinza-family/RDFRepository.html
256log4j-1.2.8.jar             - http://www.ingrid.org/jajakarta/log4j/
257をダウンロードし、lib ディレクトリに保存してください(rinza-rdf.jar は同梱されていますが最新版のダウンロードをお勧めします)。<
258
259SSDB を使う場合は JNI による API およびライブラリ libssdbJNI.so (FedoraCore6 で動作確認済み)が必要となります。
260libssdbJNI.so は利便性を考え lib ディレクトリに入れてありますが、最新版の導入をお勧めします。
261最新版は http://dev.tyzoh.jp/trac/semi-structured-db/ から導入します。
262<ssdb のインストールディレクトリ>/src/JNI/jp/tyzoh/ssdb/*.java
263
264<tacopot のインストールディレクトリ>/src/jp/tyzoh/ssdb/*.java
265にコピーしてください。
266libssdbJNI.so は tacoPot/web サーバが稼動する linux マシンに配置し、LD_LIBRARY_PATHを通してください(tomcat から LD_LIBRARY_PATH が見えている必要があります)。
267
268makefile を適宜環境(javac のパスなど)に合わせて修正し実行するか、makefile をご
269覧頂き即した形で javac を実行してください。
270お使いの環境に応じて後述する application.properties を編集してください。
271serv.bat を利用して、servlet ディレクトリにおいて tacoPot.war を作成し配置します(tomcat ディレクトリなど適宜書き換えてお使いください)。
272(linux の方はお手数ですが、内容ご覧の上、手動で作成・展開をお願いいたします)。
273javax.activation.jar を用いて mime type を判別しています。mime.types を activation.jar が参照するディレクトリ(JAVAHOME/lib 等)などに配置してください。
274
275☆0.8 以降の機能を主として使いたい方
276doc ディレクトリの HOWTO-BUILD.txt をご覧ください。
277polling 機能をお使いの方はあわせて README.polling もご覧ください。
278
279■ 実行
280tacoPot はサーブレットとして動作します。
281ブラウザからサーバにアクセスしてください。
282http://<サーバー名>/tacoPot
283とすると tacoPot へのリンクが表示されますので、これをクリックすると
284ログイン画面となります。
285http://<サーバー名>/tacoPot/admin.html を用いてユーザ登録/削除ができます。
286アカウント名「root」は特別な権限(すべてのファイルに対してアクセスがで
287きます)をもちます。デフォルトでは登録されないので、まずはアカウント名
288「root」のユーザを admin.html から設定してください。
289
290polling 機能をお使いの方は README.polling もご覧ください。
291
292■ 利用方法
293servlet/guide.html をご覧ください。
294
295以上
Note: リポジトリブラウザについてのヘルプは TracBrowser を参照してください。