Information Extraction
Information Extraction 開発サイトでは,様々な電子文書,電子データから特定の情報を抽出し,構造化された形で提示することを目的としたツールを試作・提供していきます。
Webページからの情報抽出
- Web情報抽出APIライブラリ IE APIs :
Webコンテンツから情報を抽出するための基本的なAPIライブラリ - Web情報集約アプリケーション簡単構築ツール WebIA :
複数のWebサイトから特定の情報を抽出し集約表示するアプリケーションを構築するためのツール
プログラムソースコードからの情報抽出
- 類似コード片検索ツール AthanorEX :
コードクローン情報編成ツール「Athanor for CCFinderX」の後継として位置づけていますが,現時点では同等の機能がすべて含まれているわけではありません。 - コードクローン情報編成ツール Athanor for CCFinderX :
コードクローン検出ツール『CCFinderX(10.1.X & 10.2.X)』を補完するコードクローン情報編成ツール
CodeCloneSetSummary の後継ツールです。 - コードクローン位置情報出力ツール CodeCloneSetSummary for CCFinderX(10.1.X) :
コードクローン検出ツール『CCFinderX(10.1.X)』を補完するコードクローン位置情報出力ツール
PDFファイルからの情報抽出
- 文書差分情報抽出ツール DEXdocs :
PDF文書ファイル間の差分を抽出し,その結果をWebブラウザを用いて確認できるようにするためのツール - 財務諸表データ抽出ツール IE4FS :
PDF化された有価証券報告書の各種財務諸表データを再利用できるよう抽出するためのツール
お知らせ
最近のサイト内の出来事については タイムライン をご覧ください。
- 2008/11/13
AthanorEX 1.0.0 を公開しました。
- 2008/09/26
Athanor 3.2.0 for CCFinderX を公開しました(詳細は,チケット#21, #22 , #23, #24, #25, #26, #27, #28 を参照してください)。
- 2008/05/09 Athanor for CCFinderX のバージョン2.0.0以降において,「コードクローンに基づくファイル間類似度算出機能」の不具合が発見されました(詳細は,チケット#20 を参照してください)。athanor.php の修正版は,リポジトリからチェックアウトできます(チェックアウト方法:開発者向け情報を参照してください)。
- 2008/05/07 Athanor for CCFinderX のバージョン2.2.0以降において,「類似コード断片検索ツール(athsearcher)」の不具合が発見されました(詳細は,チケット#19 を参照してください)。 athsearcher.php の修正版は,リポジトリからチェックアウトできます(チェックアウト方法:開発者向け情報を参照してください)。
- 2008/04/18 Athanor 3.1.1 for CCFinderX を公開しました(詳細は,チケット#17 & #18 を参照してください)。
- 2008/03/04 Athanor 3.1.0 for CCFinderX で提供している ath_script 用の設定ファイルに不具合がありました。
詳細および対処方法については,チケット#17 を参照してください) - 2008/02/25 Athanor 3.1.0 for CCFinderX を公開しました(詳細は,チケット#16 を参照してください)。
- 2007/12/28 Athanor 3.0.3 for CCFinderX を公開しました(詳細は,チケット#14 & #15 を参照してください)。
- 2007/12/26 Athanor 3.0.2 for CCFinderX を公開しました(詳細は,チケット#12 & #13 を参照してください)。
- 2007/12/07 Athanor 3.0.1 for CCFinderX を公開しました(詳細は,チケット#10 & #11 を参照してください)。
- 2007/12/04 Athanor 3.0.0 for CCFinderX において,「コードクローンに基づくソフトウェア検診結果」の項目名表記に誤りがありました(詳細は,チケット#10 を参照してください)。関連ファイル(ath_report-j.xsl/ath_report-e.xsl)の修正版は,リポジトリからチェックアウトできます(チェックアウト方法:開発者向け情報を参照してください)。
- 2007/12/03 Athanor 3.0.0 for CCFinderX を公開しました(詳細は,チケット#6 & #8 & #9 を参照してください)。
- 2007/11/09
IE APIs 1.1.4 を公開しました(詳細は,チケット#7 を参照してください)。
- 2007/11/08
Web情報集約の第3弾:国内外 観光情報集約トライアル powered by WebIA を公開しました。
- 2007/10/11 Athanor for CCFinderX(10.1.X) 2.2.0 を公開しました(詳細は,チケット#5 を参照してください)。
- 2007/10/03 Web情報集約の第2弾:都道府県 防災・災害情報集約トライアル powered by WebIA を公開しました。
- 2007/07/09 Athanor for CCFinderX(10.1.X) 2.1.1 を公開しました(ディレクトリ境界表示不正対応)。
- 2007/07/06 Athanor for CCFinderX(10.1.X) 2.1.0 に一部不具合がありました(詳細は,チケット#3 および #4 を参照してください)。
修正版の実行スクリプトファイルは,リポジトリからチェックアウトできます(チェックアウト方法:開発者向け情報を参照してください)。
修正版を含むダウンロードパッケージは後日公開します。 - 2007/06/28 Athanor for CCFinderX(10.1.X) 2.1.0 を公開しました(コードクローン散布図を画像ファイルとして出力する機能を追加)。
- 2007/05/11 Athanor for CCFinderX(10.1.X) 2.0.1 を公開しました。
- 2007/03/29 国内大学Web情報集約トライアル powered by WebIA における大学名一覧を更新しました(2007年度開設大学に対応)。
- 2007/03/02 CodeCloneSetSummary の後継ツールである Athanor for CCFinderX(10.1.X) 2.0.0 を公開しました。
ライセンス
ソースコード形式、バイナリコード形式を問わず
Information Extraction に関連して公開しているソフトウェアのプログラムコード・関連資料の全部あるいは一部を入手する場合には、
「Rinza公衆使用許諾契約書」
の内容を受諾する必要があります。
- Rinza公衆使用許諾契約書 : 事前に必ず参照し内容を確認してください。( Rinza Public License Agreement <ENGLISH TRANSLATION>)
ダウンロード
Web情報抽出APIライブラリ IE APIs
- IE APIs 最新リリースパッケージ :
IE APIs の最新リリースパッケージが入手できます。
類似コード片検索ツール AthanorEX
- AthanorEX 最新リリースパッケージ :
AthanorEX の最新リリースパッケージが入手できます。
コードクローン情報編成ツール Athanor
- Athanor 最新リリースパッケージ :
Athanor for CCFinderX の最新リリースパッケージが入手できます。
コードクローン位置情報出力ツール CodeCloneSetSummary
- 後継ツール「コードクローン情報編成ツール Athanor」をダウンロードしてください。
文書差分情報抽出ツール DEXdocs
- DEXdocs 最新リリースパッケージ : DEXdocs の最新リリースパッケージが入手できます。
財務諸表データ抽出ツール IE4FS
- IE4FS 最新リリースパッケージ : IE4FS の最新リリースパッケージが入手できます。
トライアル
Web情報集約アプリケーション簡単構築ツール WebIA
バグ報告/要望
Information Extraction に関連して公開しているソフトウェアに関するバグ報告や新機能の要望などはページ上部の「チケットの作成」にて登録してください。
チケット登録やコメントは誰でも行えますので、ご利用ください。 その際、画面上部のメニューバーから「ユーザ設定」を選択してユーザ名(ハンドル名)を登録しておくことをお勧めします。
メールアドレスはチケット内に表示されます。メールアドレスの登録はリスクを認識した上でお願いいたします。記入しない場合は他の方と区別が付くようにハンドル名を入力していただけると幸いです。このサイトにおいてハンドル名により個人が特定されることはありません。
問合せ
ご意見・ご質問は 「お問合せフォーム」をご利用ください。
添付ファイル
- new.png (348 bytes) - 登録者 kurei 5 年 前.
- updated.png (0.8 KB) - 登録者 kurei 5 年 前.
